你好,我是高楼。
到现在,我们的专栏已经更新了20多讲了,在前面的课程中,你应该也已经看到了,为了真正地把全链路压测拉到地面上来,同时也让你更好地理解我的全链路压测理念,我们专门搭建了一个完整的系统,这个专栏所有的内容都是基于这个系统展开的。这节课,我们就来看看,这个系统是怎么搭建起来的。
因为整个系统相对比较复杂,有很多需要考虑、部署的细节,所以这节课的内容会比较长。下面这张图是这节课的目录,你可以先整体了解一下这节课的结构,然后对应这张目录图来学习具体的搭建步骤,以免迷失方向。
我会依照云计算的架构特点,自下向上从云虚拟机到微服务应用,介绍整个搭建的过程。
云虚拟机负责管理虚拟机的生命周期,包括创建、修改、备份、启停、销毁等。云虚拟机主要是面向资源分配,虚拟机创建出来了云产商就基本没有责任了。至于服务高可用、自动伸缩、监控等这类的功能完全由应用方来处理,云平台不提供支持。云虚拟机适合传统的部署模式,对应用而言和物理机时代没有区别。
在这个系统中,我们主要用到了8 台云虚拟机,下面是具体的硬件配置:
我们可以看到,当前云主机总共使用在应用中的资源是:38 C的 CPU 资源,88 G的内存资源。NFS 网络存储服务器不会用在应用中。
关于云虚拟机类型,云产商一般会提供这几个类型:
我们这里选择的云主机类型主要为计算密集型,如下图。
在存储方面,云产商一般会提供高效云盘和SSD两种类型,这里我们选择的是SSD:
你可能会问,这么一套搞下来,成本要多少呢?我算了一下,我们这个项目,所有云主机加在一起一年大概需要六万左右的费用,这其中还包括了云硬盘、云网络等杂七杂八的费用。
我们接着来看下云主机规划。这里我把云主机类型按照节点差异分为两类:
普通节点主要供非被测系统使用,比如压力机、管理平台等。我们可以采用 Docker、二进制等方式来部署。
Kubernetes节点用于部署项目的应用服务,包括 mall-admin、mall-portal、mall-gateway、mall-member、mall-cart 等。另外 Zipkin、Nacos 等基础组件也都采用 Kubernetes的方式来部署。
具体的节点规划,你可以参考这张表:
在这里,我们规划了一个Kubernetes控制节点。如果你计划搭建高可用 Master 集群,至少需要规划三个Kubernetes控制节点。至于Kubernetes计算节点,结合前面的节点规划,我们在这里配置 7 个 worker 节点,其他的节点会根据需求灵活扩展。
这里我还想提醒一下,如果你所在的项目需要购买云主机的话,最好提早规划。因为我们之前购买的Kubernetes集群云主机都是包年包月机型,后来想省钱换成按量付费类型(支持停机后不收费功能)的主机,结果发现网络不互通。这可都是血淋淋的教训。
下面,我们再来看下操作系统的搭建。
目前,行业内主流的基于 x86 架构的 Linux 系统,无非是 CentOS 和 Ubuntu 两种。我们选择了 CentOS 系列来搭建 Linux 系统,主要是考虑到了系统的稳定性。CentOS 来自 RedHat 商业版本的重新编译,它在稳定性、系统优化以及兼容性方面,具有比较完善的测试和发版流程。
在 CentOS 7 之后的版本中,CentOS 的内核换成了 Linux 3.x,因此,我们这个课程的分析都是基于 Linux 3.x 这个内核版本展开的。
而大部分的云产商一般会提供下面两种类型的操作系统镜像:
因为我们课程的技术栈不想与云产商绑定,所以我们给每台服务器都安装了流行成熟的 CentOS 7.8 的操作系统。云主机安装操作系统非常简单,创建实例的时候选择对应的系统镜像就可以了:
关于集群计算资源,你可以参考这张表:
我们在做计算资源规划的时候,通常需要考虑不同的应用场景:
传统虚拟化技术的 I/O 损耗较大,对于 I/O 密集型应用,性能敏感的应用,裸金属服务器相比云虚拟机有更好的性能表现;
在裸金属服务器上部署应用,有更少的额外资源开销(如虚拟化管理、虚拟机操作系统等),并且可以有更高的部署密度,这可以降低基础设施成本;
在裸金属服务器上可以更加灵活地选择网络、存储等设备和软件应用生态。
如果从实际生产环境考虑,我给你的建议是:
对性能极其敏感的应用,如高性能计算,裸金属服务器是较好的选择;
云主机支持热迁移,可以有效降低运维成本;
在工作实践中,可以为 Kubernetes 集群划分静态资源池和弹性资源池,我们就是这样做的。通常而言,静态资源池可以根据需要选择裸金属服务器或者云主机实例;弹性资源池则可以根据应用负载,使用合适规格的云主机实例来优化成本,避免资源浪费,同时提升弹性供给保障。
由于我们这个系统只是课程的示例项目,为了尽可能压榨服务器资源,节省服务器成本,我们选择了云虚拟机的方案。
关于集群搭建,我们的节点规划如下:
[root@s5 k8s]# kubectl get nodes -o wide
NAME STATUS ROLES AGE VERSION INTERNAL-IP EXTERNAL-IP OS-IMAGE KERNEL-VERSION CONTAINER-RUNTIME
s10 Ready <none> 5d1h v1.19.5 172.31.184.227 <none> CentOS Linux 7 (Core) 3.10.0-1127.19.1.el7.x86_64 docker://19.3.11
s11 Ready <none> 5d1h v1.19.5 172.31.184.230 <none> CentOS Linux 7 (Core) 3.10.0-1127.19.1.el7.x86_64 docker://19.3.11
s12 Ready <none> 5d1h v1.19.5 172.31.184.233 <none> CentOS Linux 7 (Core) 3.10.0-1127.19.1.el7.x86_64 docker://19.3.11
s5 Ready master 5d2h v1.19.5 172.31.184.225 <none> CentOS Linux 7 (Core) 3.10.0-1160.31.1.el7.x86_64 docker://19.3.11
s6 Ready <none> 5d1h v1.19.5 172.31.184.226 <none> CentOS Linux 7 (Core) 3.10.0-1127.19.1.el7.x86_64 docker://19.3.11
s7 Ready <none> 5d1h v1.19.5 172.31.184.224 <none> CentOS Linux 7 (Core) 3.10.0-1127.18.2.el7.x86_64 docker://19.3.11
s8 Ready <none> 5d1h v1.19.5 172.31.184.229 <none> CentOS Linux 7 (Core) 3.10.0-1127.19.1.el7.x86_64 docker://19.3.11
s9 Ready <none> 5d1h v1.19.5 172.31.184.228 <none> CentOS Linux 7 (Core) 3.10.0-1127.19.1.el7.x86_64 docker://19.3.11
集群搭建的具体步骤,你可以参考下面这两个文档进行部署:
安装的负载均衡组件如下:
关于Traefik 搭建的具体步骤,你可以按照下面这个文档进行部署:
如果你没有Kubernetes的使用基础,那么我建议学习一下这几篇入门文章:
我们需要安装的插件主要有三种:网络插件、存储插件和组件。
对于网络插件,我们选用的是目前主流的网络插件 Flannel。如果你的系统有其它选型需求,那你可以参考下面这篇文章,这里我就不做赘述了。
如果你在阿里云上安装 k8s,建议使用 Flannel,因为有多个案例表明 Calico 与阿里云存在兼容性问题。
安装 Flannel 插件的具体步骤,你可以参考下文的第11章。
关于存储插件,我们选用的是 NFS 网络存储。因为 NFS 相对简单,上手快,我们只需要部署一个NFS服务,再由Kubernetes提供一个自动配置卷程序,然后通过 StoageClass 动态配置 Kubernetes 持久就可以了。而且在性能上,NFS 也能满足我们这个系统的需求。
只不过,NFS 并不是高可用方案。如果你是在生产环境中使用,可以考虑把 Ceph 作为存储选型方案。Ceph 是一个统一的分布式存储系统,也是高可用存储方案,并且可以提供比较好的性能、可靠性和可扩展性。但是,Ceph 部署起来更复杂些,同时维护也比 NFS 困难。
我把 NFS 和 Ceph 的详细安装步骤放在这里,你如果有需要,可以参考学习。
另外,不要忘了,NFS 配置中还需要这两个组件:
NFS-Subdir-External-Provisioner 是对 nfs-client-provisioner 的扩展,但是 nfs-client-provisioner 已经不再提供更新,而且 nfs-client-provisioner 的 GitHub 仓库已经迁移到 NFS-Subdir-External-Provisioner 的仓库了。
安装组件:
Kuboard 采用可视化UI的方式来管理应用和组件,降低了Kubernetes集群的使用门槛。下面我们看看怎么部署 Kuboard 组件。
第一步,k8s 集群执行资源文件:
kubectl apply -f https://kuboard.cn/install-script/kuboard.yaml
kubectl apply -f https://addons.kuboard.cn/metrics-server/0.3.7/metrics-server.yaml
[root@s5 ~]# kubectl apply -f https://kuboard.cn/install-script/kuboard.yaml
deployment.apps/kuboard created
service/kuboard created
serviceaccount/kuboard-user created
clusterrolebinding.rbac.authorization.k8s.io/kuboard-user created
serviceaccount/kuboard-viewer created
clusterrolebinding.rbac.authorization.k8s.io/kuboard-viewer created
[root@s5 ~]#
[root@s5 ~]# kubectl apply -f https://addons.kuboard.cn/metrics-server/0.3.7/metrics-server.yaml
clusterrole.rbac.authorization.k8s.io/system:aggregated-metrics-reader created
clusterrolebinding.rbac.authorization.k8s.io/metrics-server:system:auth-delegator created
rolebinding.rbac.authorization.k8s.io/metrics-server-auth-reader created
clusterrole.rbac.authorization.k8s.io/system:metrics-server created
clusterrolebinding.rbac.authorization.k8s.io/system:metrics-server created
apiservice.apiregistration.k8s.io/v1beta1.metrics.k8s.io created
serviceaccount/metrics-server created
deployment.apps/metrics-server created
service/metrics-server created
[root@s5 ~]#
第二步,把 Kuboard 安装好后,我们看一下 Kuboard 的运行状态:
kubectl get pods -l k8s.kuboard.cn/name=kuboard -n kube-system
输出结果:
[root@s5 ~]# kubectl get pods -l k8s.kuboard.cn/name=kuboard -n kube-system
NAME READY STATUS RESTARTS AGE
kuboard-74c645f5df-bsj4k 1/1 Running 0 98s
[root@s5 ~]#
这个结果表明 kuboard 已经部署成功了。
接着,我们获取管理员 Token 。这一步是为了登录访问 Kuboard,检查组件是否成功运行。
# 可在第一个 Master 节点上执行此命令
echo $(kubectl -n kube-system get secret $(kubectl -n kube-system get secret | grep kuboard-user | awk '{print $1}') -o go-template='{{.data.token}}' | base64 -d)
[root@s5 k8s]# echo $(kubectl -n kube-system get secret $(kubectl -n kube-system get secret | grep kuboard-user | awk '{print $1}') -o go-template='{{.data.token}}' | base64 -d)
eyJhbGciOiJSUzI1NiIsImtpZCI6IldTYlJYVXIzbWZNUnBSczF1ZFc5cmRQbEp2UlFtbXREZDVCSEtzd09kU2MifQ.eyJpc3MiOiJrdWJlcm5ldGVzL3NlcnZpY2VhY2NvdW50Iiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9uYW1lc3BhY2UiOiJrdWJlLXN5c3RlbSIsImt1YmVybmV0ZXMuaW8vc2VydmljZWFjY291bnQvc2VjcmV0Lm5hbWUiOiJrdWJvYXJkLXVzZXItdG9rZW4tZGNwMmYiLCJrdWJlcm5ldGVzLmlvL3NlcnZpY2VhY2NvdW50L3NlcnZpY2UtYWNjb3VudC5uYW1lIjoia3Vib2FyZC11c2VyIiwia3ViZXJuZXRlcy5pby9zZXJ2aWNlYWNjb3VudC9zZXJ2aWNlLWFjY291bnQudWlkIjoiODY2MWU1NzAtYWMyNC00YzA0LTgxNmYtMTM3YWMwOWU0MTcxIiwic3ViIjoic3lzdGVtOnNlcnZpY2VhY2NvdW50Omt1YmUtc3lzdGVtOmt1Ym9hcmQtdXNlciJ9.lHhr261HMdqGpMWhGVt9mOty2QpWAcuKaGYZ2FwlJPof4iddGSi6O5_SgZHi8wj4FrOiH3xwUMGGqiIcxhp6VuTFch7tUeBQ3x40dvt3t1u6kogZBMz-k2K39fnBtvcFJV9hghIXoxMsH3E09wjKrJmq0bXUfPicdCMbbwpRNXt97pqGIPBrhNtqX_-agmLSlaiqG3rTZIwGAgsBmcJVHeGhgme2PAMwuiSXUoi0W22BeH-c91_rLJ4LrB9svrhaWf_dltQ-mLT4lfnr_Imk-Dvo9Zhmm8Y9_OOe9VkWRJVtJpnVYWs9WKjMGLeYNL_h8jgNN7cq-0vxddAT31rdYQ
通过检查部署我们了解到,Kuboard Service 使用了 NodePort 的方式暴露服务,NodePort 为 32567。因此,我们可以按照下面这个方式访问 Kuboard:
http://任意一个Worker节点的IP地址:32567/
然后,在登录界面中输入管理员 Token,这样就可以进入到 Kuboard 集群的概览页了。
注意,如果你使用的是阿里云、腾讯云等云服务,那么你可以在对应的安全组设置里,开放 worker 节点 32567 端口的入站访问,你也可以修改 Kuboard.yaml 文件,使用自己定义的 NodePort 端口号。
对于上述依赖组件的安装部署,我整理了对应的教程放在这里,如果有兴趣你可以尝试一下。
MySQL 的二进制安装方式,在网上的教程多如牛毛,我在这里就不介绍了,如果你想知道怎么在Kubernetes下部署 MySQL,你可以参考这个链接中的详细步骤:
Elasticsearch 集群的部署可以参考:
Weave Scope的部署可以参考:
镜像仓库 Harbor 的部署可以参考:
Nacos 的部署可以参考:
Redis、RabbitMQ、MongoDB 单机部署的部署可以参考:
不知道你还记不记得我们这个系统的架构:
根据这个系统的架构,我们选择的工具需要监控到这几个层面:
其实,有了上面的系统架构,监控设计大体的轮廓就有了。对于我们这个课程所用的系统,全局监控如下所示:
从上图来看,我们使用 Prometheus/Grafana/Spring Boot Admin/Zipkin/Weave Scope/ELFK/Sentinel 就可以实现具有全局视角的第一层监控。对于工具中没有覆盖的第一层计数器,我们只能在执行场景时再执行命令来补充了。
对于上面这些监控工具的部署,我也把相应的安装教程放在这里供你参考学习。
Kubernetes集群资源监控的部署:
日志聚合部署的部署:
依赖组件的部署:
APM 链路跟踪的部署:
在搭建这个课程所用的系统时,我采用了微服务的架构,这也是当前主流的技术架构。
如果你有兴趣了解详细的项目介绍,可以参考这篇文章:《微服务电商项目技术全解析》。这里面主要介绍了该项目的一些预备知识、系统结构、主要技术栈以及核心组件。此外,还有相关的运行效果截图。
我们把 Git clone 项目源代码下载到本地,来部署我们的被测系统:
git clone https://github.com/xncssj/7d-mall-microservice.git
我们先将项目 config 目录下的配置包导入到 Nacos 中,然后根据自己的实际需要修改相关配置。
接着,我们将配置信息导入到 Nacos 中后,会显示这样的信息:
请注意,我们修改的配置文件主要是每个单体服务下的 application-prod.yml 和 bootstrap-prod.yml。因为这两个全局配置文件,都是服务容器内加载的配置文件。
我们使用 Java 语言的 IDE (推荐 IDEA )打开项目工程。
首先,修改项目根目录下的 pom.xml 文件:
<properties>
<!--改为你自己的 Docker 服务远程访问地址-->
<docker.host>http://172.16.106.237:2375</docker.host>
</properties>
在 IDEA 的右边 Maven 标签页,我们可以找到 root 工程下的 package 按钮,选中并执行:
然后,在编译的远程 Docker 主机上,我们修改所有服务的镜像标签名称。之后,再推送镜像到 Docker 仓库。
这一步需要将项目 document/sql 目录下的 SQL 脚本导入到 MySQL 数据库中。
第一步,进入 RabbitMQ 容器并开启管理功能:
#登录容器的时候需要注意到容器支持的 shell 是什么。
kubectl exec -it <pod-name> -n <ns-name> bash
kubectl exec -it <pod-name> -n <ns-name> sh
root@cloud-rabbitmq-5b49d784c-gbr8m:/# rabbitmq-plugins enable rabbitmq_management
Enabling plugins on node rabbit@cloud-rabbitmq-5b49d784c-gbr8m:
rabbitmq_management
The following plugins have been configured:
rabbitmq_management
rabbitmq_management_agent
rabbitmq_web_dispatch
Applying plugin configuration to rabbit@cloud-rabbitmq-5b49d784c-gbr8m...
Plugin configuration unchanged.
因为 RabbitMQ Service 使用 NodePort 的方式暴露控制台地址,比如 NodePort 为 15672。所以,第二步,我们访问地址 http://计算节点IP:15672/ 地址,查看是否安装成功:
第三步,输入账号密码并登录guest/guest。
第四步,创建帐号并设置其角色为管理员 mall/mall。
第五步,创建一个新的虚拟 host 为 /mall。
第六步,点击 mall 用户进入用户配置页面,给 mall 用户配置该虚拟 host 的权限。
到这里,RabbitMQ 的初始化就完成了。
安装中文分词器 IKAnalyzer,并重新启动:
#此命令需要在容器中运行
elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v7.6.2/elasticsearch-analysis-ik-7.6.2.zip
将项目 document/k8s 目录下的 yaml 资源文件中的 Dokcer 镜像,修改为自己的 Tag 并上传到 k8s 集群中执行:
kubectl apply -f k8s/
前面的环境搭建完成了,最后我们一起来看下运行效果。
Kubernetes 集群:
~ kubectl get nodes
NAME STATUS ROLES AGE VERSION
s10 Ready <none> 5d8h v1.19.5
s11 Ready <none> 5d8h v1.19.5
s12 Ready <none> 5d8h v1.19.5
s5 Ready master 5d8h v1.19.5
s6 Ready <none> 5d8h v1.19.5
s7 Ready <none> 5d8h v1.19.5
s8 Ready <none> 5d8h v1.19.5
s9 Ready <none> 5d8h v1.19.5
~
微服务管理:
部署架构图:
API 文档:
调用链监控:
服务注册:
服务监控:
日志聚合:
配置管理:
系统保护:
容器仓库:
Kubernetes集群资源监控:
Linux 资源监控:
MySQL 资源监控:
RabbitMQ 资源监控:
MongoDB 数据库资源监控:
Kubernetes etcd 资源监控:
Kubernetes API Server 资源监控:
Kubernetes 服务拓扑:
这节课的内容包括了云环境的说明、技术组件的具体搭建过程、示例系统的搭建过程以及运行效果。经过上面所有的步骤,我们就把整个课程涉及的所有技术组件、示例系统完全搭建起来了。
而我之所以选择这样的技术栈,主要有三方面的考虑:
2. 核心设施平台( IaaS 云)
3. 基础服务平台( PaaS 云)
我们这个系统采用的技术栈,是当前技术市场中流行的主流技术栈,这样的环境具有很高的借鉴价值。而且,从我们要表达的 RESAR 全链路压测和逻辑来说,也说明 RESAR 全链路压测理念是足以支撑当前的技术栈的。
有了主流技术栈的技术能力,再有我们的性能分析逻辑思维的落地,不能说天下无双,也是够你横霸一方,独挡一面的了。
这节课的内容非常多,希望你能够好好消化吸收。我在这里只是给你提供了我们项目的选择和理由,我们项目的选择可能不是最适合你的,如果你有其他想法,也欢迎在留言区和我交流讨论。另外在文稿的最后,我还给你汇总了你可能想要参考的文章链接,希望能让你有所收获。
学完这节课,请你思考两个问题:
欢迎你在留言区与我交流讨论。当然了,你也可以把这节课分享给你身边的朋友,他们的一些想法或许会让你有更大的收获。我们下节课见!
Kubernetes网络插件选型:Kubernetes 网络插件(CNI)超过 10Gbit/s 的基准测试结果
Kubernetes存储插件:
评论