你好,我是秦粤。现在我们知道了在网络拓扑图中,只有Stateless节点才能自由扩缩容,而Stateful节点因为保存了重要数据,我们要谨慎对待,因此很难做扩缩容。
FaaS连接并访问传统数据库会增加额外的开销,我们可以采用数据编排的思想,将数据库操作转为RESTful API。顺着这个思路,我引出了后端应用的BaaS化,一句话总结,后端应用BaaS化就是将后端应用转换成NoOps的数据接口。那怎么理解这句话呢?后端应用BaaS化,究竟应该怎么做?接下来的几节课,我们会展开来讲。
我们先回忆一下上节课的“待办任务”Web应用,这个项目前端是单页应用,中间用了FaaS做SFF数据网关,后端数据接口还要BaaS化。这个案例会贯穿我们的课程,所以你一定要动手run一下。为了让你对我们的项目有个宏观上的认识,我还是先交付你一张大图。
这个架构的优势是什么呢?我们将这个图变个形,你就更容易理解了。
咱从左往右看上面这张图。用户从浏览器打开我们网站时,前端应用响应返回index.html;然后浏览器去CDN下载我们的静态资源,完成页面静态资源的加载;与此同时,浏览器也向前端应用发起数据请求;前端应用经过安全签名后,再将数据请求发送给SFF;SFF再根据数据请求,调用后端接口或服务,最终将结果编排后返回。
从图里你可以看到,除了数据库是Stateful的,其它节点都已经变成了Stateless。如果你公司业务量不大的话,这个架构其实已经足够了。就像传统的MVC架构一样,单点数据库,承载基本的并发量不是问题,而且数据也可以通过主从结构和客户端读写分离的方式来优化。
但MVC架构最大的问题就是累积,当一个MVC架构的应用,在经历长期迭代和运营后,数据库一定会变得臃肿,极大降低数据库的读写性能。而且在高并发达到一定量级,Stateful的数据库还是会成为瓶颈。那我们可以将自己的数据库也变成BaaS吗?
要解决数据库的问题,也可以选择我上节课和你说的云服务商提供的BaaS服务,比如DynamoDB。但云服务商BaaS服务究竟是怎么做到的?如果BaaS服务能力不全,不够满足我们的需要时怎么办?今天我就先带你看看传统的MVC应用中的数据库怎么改造成BaaS。
当然,BaaS化的过程有些复杂,这也正是我们后面需要用几节课才能跟你解释清楚的核心知识点。正如我们本节课的标题:后端应用BaaS化,就是NoOps的微服务。在我看来后端应用BaaS化,跟微服务高度重合,微服务几乎涵盖了我们BaaS化要做的所有内容。
所以我们先来学习一下微服务是什么。
微服务的概念对很多做后端同学来说并不陌生,尤其是做Java的同学,因为早些年Java就提出SOA面向服务架构。微服务算是SOA的一个子集,2014年由ThoughtWorks的Martin Fowler提出。微服务设计之初是为了拆解巨石应用,巨石应用就是指那些生命周期较长的,累计了大量业务高度耦合和冗余代码的企业应用。
跟Serverless的概念还在发展中不同,微服务的概念在这么多年的发展中已经有了明确的定义了。下面是AWS官方的解释:
微服务是一种开发软件的架构和组织方法,其中软件由通过明确定义的 API 进行通信的小型独立服务组成,这些服务由各个小型独立团队负责。微服务架构使应用程序更易于扩展和更快地开发,从而加速创新并缩短新功能的上市时间。
那在我看来,微服务就是先拆后合,它将一个复杂的大型应用拆解成职责单一的小功能模块,各模块之间的数据模型相互独立,模块采用API接口暴露自己对外提供服务,然后再通过这些接口组合出原先的大型应用。拆解的好处是,小模块便于维护,可以快速迭代,跨应用复用。
我们的Serverless专栏并不打算给你详细地讲解微服务,但是希望你能一定程度上了解微服务。FaaS和微服务架构的诞生几乎是在同一时期,它俩的很多理念都是来自12要素(Twelve-Factor App)[1],所以微服务概念和FaaS概念高度相似,也有不少公司用FaaS实现微服务架构;不同的是,微服务的领军公司ThoughtWorks和NetFlix到处宣扬他们的微服务架构带来的好处,而且他们提出了一整套方法论,包括微服务架构如何设计,如何拆解微服务,尤其是数据库如何设计等等。
我们后端应用BaaS化,首先要将复杂的业务逻辑拆开,拆成职责单一的微服务。因为职责单一,所以服务端运维的成本会更低。而且拆分就像治理洪水时的分流一样,它能减轻每个微服务上承受的压力。
我在Serverless的专栏里向你介绍微服务,主要就是想引入微服务拆解业务的分流思想和微服务对数据库的解耦方式。
谈起微服务,很多人都要说12要素[2],认为微服务也应该满足12要素。12要素当初是为了SaaS设计的,用来提升Web应用的适用性和可移植性。我在做微服务初期也学习过12要素,但我发现这个只能提供理论认识。
所以在2018年GIAC的大会上,我将我们团队在微服务架构落地中的经验总结为微服务的10要素:API、服务调用、服务发现;日志、链路追踪;容灾性、监控、扩缩容;发布管道;鉴权。
我们回想一下[第1课] 中小服的工作职责:
你有没有发现跟微服务的要素有大量的重合。API就是RESTful的HTTP数据接口;服务调用你可以理解为就是HTTP请求;服务发现你可以理解为我们只能用域名调用我们的HTTP请求,不能用IP;日志、容灾、监控都不难理解;链路追踪,是微服务重要的一环,因为相对传统MVC架构,我们一个请求在后端的调用链增长了,为了快速定位问题,我们都需要打印整个调用链路的异常栈;发布管道和鉴权,和我们的FaaS也有很重要的关联,我将放在下一课讲解。
接下来,我不准备按照微服务的10要素一一操作,但我希望可以通过Serverless帮你建立知识体系的索引,所以关联的技术栈我都尽量点出来,你可以自己进一步了解学习。
我们再次拿出我们的创业项目“待办任务”Web网站,这次我将带你一起看看微服务如何让数据库解耦。
我们先分析一下“待办任务”Web服务。上一讲末尾我的作业其实已经为你准备好了,我们一起看看index.js文件,这是一个典型的MVC架构的应用。View层就是index.html和静态资源文件;Model层,我们引入lowdb用一个db.json文件代替数据库;Control层,就是app.METHOD,处理/api/*的数据逻辑。微服务是解决后端应用的,所以我们只需要关注Control层。
API的数据处理,主要有两个,一个是/api/rule处理待办任务的,一个是/api/user负责用户登录态,而且我们“待办任务”主要的数据模型也就是待办任务和用户这两个。那我们可以将后端拆分出两个微服务:待办任务微服务和用户微服务。这里我要强调下,我只是为了向你演示微服务才这样做,在实际业务中,这么简单的功能,没必要过早地拆分。
初步拆解,我们将index.js中的数据库移走了,而且拆分后各微服务的数据库比原来混杂在一起简单且容易维护多了。user.js负责用户相关业务逻辑,只维护用户信息的数据库,并且暴露RESTful的HTTP方法;rule.js负责待办任务的增删改查,只维护待办任务的数据库,并且暴露RESTful的HTTP方法;index.js只需要负责将请求HTTP返回给数据编排。
HTTP协议要满足我们的服务调用与发现,发布的user.js和rule.js必须使用域名,例如api.jike-serverless.online/user和api.jike-serverless.online/rule。这样新扩容的机器IP,只需要注册到这个域名下就可以被服务发现IP并调用了。
我们现在拆分后只是将数据库从index.js移出,分给到了user.js和rule.js,但两个节点到目前为止数据库仍然是Stateful的。我们如何再让这两个数据库节点变成Stateless呢?你可以按一下暂停键思考一下。
我们先想想,对于rule.js这个微服务来说,我要再扩容一个新的实例,而且让两边的实例保持一致,那么我们是否只需要让新的数据库和旧的数据库保持同步更新就可以了呢?
没错,其实要解决这个问题的核心就是让数据启动时,可以更新到最新的数据库。在其中一个数据库更新时,通知另外一个数据库更新。
这里就要引出一个关键的Stateful对象:消息队列[3]。它是一个稳定的绝对值得信赖的Stateful节点,而且对你的应用来说消息队列是全局唯一的。解耦数据库的思路就是,通过消息队列解决数据库和副本之间的同步问题,有了消息队列,剩下的就简单了。
我们每个微服务中的数据库,例如MySQL,写的操作都会产生binary log,通过额外的进程将binary log变更同步到消息队列,并监听消息队列将binary log更新在本地执行,修改MySQL。比较著名的解决方案就是领英开源的Kafka,现在云服务商基本也都会提供Kafka服务。当然数据库和副本之间会有短暂的同步延迟问题,但问题其实也不大,因为我们通常对数据库进行写操作时也会锁表。
如果你要细究这个问题,那就会碰到分布式架构无法同时满足的CAP[4] 课题。我们在此也不深入展开CAP话题了,目前异步同步的时间差在很多场景下我觉得是可以接受的。
拿我们自己的例子来说也很简单,我们用消息队列RocketMQ,写操作我们都写入RocketMQ,rule.js进程中我们监听RocketMQ,一旦有rule写入的消息,我们就更新我们的lowdb数据。围绕消息队列建立的同步机制,让每个微服务的数据库和它的扩容副本之间自动同步了。对于微服务来说,它本身的数据库还是Stateful的,但在微服务外部看来,这个微服务是Stateless的。如下图所示:
跟传统的主从数据库方式不同的是,我们每个微服务的单点实例都是独享一个数据库的,rule这个微服务单点可以对外提供所有待办任务的RESTful API接口。
你要知道消息队列,例如RocketMQ的可靠性是99.99999999%,而我们常用的虚拟机ECS的可靠性也只不过99.95%。在高并发架构的设计中,我们通常会要求Stateful节点一定要稳定,而且越少越好,所以消息队列,对于微服务和FaaS来说,都是可以作为支撑业务的核心。我们依赖消息队列,会让整个架构更稳定。
我们为了避免在FaaS中直接操作数据库,而将数据库操作变成BaaS服务。为了理解BaaS化具体的工作,我们引入了微服务的概念。微服务先将业务拆解成单一职责和功能的小模块便于独立运维,再将小模块组装成复杂的大型应用程序。这一点上跟我们要做的后端应用BaaS化相似度非常高。所以参考微服务,我们先将MVC架构的后端解成了两个微服务,再用微服务解耦数据库的操作,先将数据库拆解成职责单一的小数据库,再用消息队列同步数据库和副本,从而将数据变成了Stateless。
现在我们再来回顾一下这节课的重要知识点。
由于Kafka云服务比较贵,所以这节课的作业我们采用表格存储[5]来模拟Kafka,以实现DB的同步功能。你可以尝试自己部署一下rule-faas到一个新的域名。下面是具体的代码地址:
你可以根据自己的域名,替换一下前端文件中的这个地址:http://faas.jike-serverless.online/api/rule,或者用我的前端代码lesson5分支修改/src/pages/ListTableList/service.ts中的地址,自己 npm run build
一下,替换掉项目public目录,压缩上传到函数服务目录。
这次的部署会有些复杂,我们要部署两个FaaS服务,一个是rule-faas.js,用来处理/api/rule;另一个是index-faas.js,用来处理我们的静态资源请求。原理图如下所示:
另外.aliyunConfig文件格式如下,你需要填入自己的配置情况,切记这个文件不可以上传到Git仓库:
//.aliyunConfig文件,保存秘钥,切记不可以上传Git
const endpoint = "https://rule.cn-shanghai.ots.aliyuncs.com";
// AccessKey 阿里云身份验证,在阿里云服务器管理控制台创建
const accessKeyId = "AccessKey";
// SecretKey 阿里云身份验证,在阿里云服务器管理控制台创建
const accessKeySecret = "SecretKey";
// 在数据链表中查看
const instancename = "rule";
const tableName = 'todos';
const primaryKey = [{ 'key': 'list' } ];
module.exports = {endpoint, accessKeyId, accessKeySecret, instancename, tableName, primaryKey};
期待你的作业和思考,如果今天的内容让你有所收获,也欢迎你把文章分享给身边的朋友,邀请他加入学习。
[1] https://en.wikipedia.org/wiki/Twelve-Factor_App_methodology
[2] https://12factor.net/zh_cn/
[4] https://www.ruanyifeng.com/blog/2018/07/cap.html
[5] https://ots.console.aliyun.com/
评论