你好,我是蒋德钧。这节课,我们一起来看看Redis是如何在源码中实现哨兵机制的。
我们知道,Redis主从复制是保证Redis可用性的一个重要手段。而一旦Redis主节点发生故障,哨兵机制就会执行故障切换。这个故障切换过程实现起来其实比较复杂,涉及了哨兵Leader选举、新主节点选举和故障切换等关键操作。但同时,这个故障切换过程又是我们在实现高可用系统时经常要面对的开发需求。
所以从这节课开始,我就来给你逐一介绍下,Redis哨兵机制及其实现故障切换的关键技术设计与实现。通过这部分内容的学习,你既可以了解在故障切换过程中,起到重要作用的Raft协议是如何实现的,而且你还可以掌握在故障切换时,主节点、从节点和客户端相互之间如何完成切换通知的。
不过,在开始了解故障切换的关键技术之前,今天我们会先来了解哨兵实例本身的初始化和基本运行过程,这是因为从源码的角度来看,哨兵实例和常规Redis实例的实现都是在一套源码中的,它们共享了一些执行流程。所以了解这部分内容,也可以帮助我们更加清楚地掌握哨兵实例的实现机制。
好,下面我们就先来看下哨兵实例的初始化过程。
因为哨兵实例是属于运行在一种特殊模式下的Redis server,而我在第8讲中,已经给你介绍过了Redis server启动后的入口函数main的整体执行过程。其实,这个过程就包含了哨兵实例的初始化操作。
所以,哨兵实例的初始化入口函数也是main(在server.c文件中)。那么,main函数在运行时,就会通过对运行参数的判断,来执行哨兵实例对应的运行逻辑。具体来说,main函数在调用initServerConfig函数初始化各种配置项之前,会调用checkForSentinelMode函数,来判断当前运行的是否为哨兵实例,如下所示:
server.sentinel_mode = checkForSentinelMode(argc,argv);
checkForSentinelMode函数(在server.c文件中)的参数,是main函数收到的启动命令字符串argv和启动命令中的参数个数argc。然后,它会根据以下两个条件判断当前是否运行了哨兵实例。
这部分代码如下所示:
int checkForSentinelMode(int argc, char **argv) {
int j
//第一个判断条件,判断执行命令本身是否为redis-sentinel
if (strstr(argv[0],"redis-sentinel") != NULL) return 1;
for (j = 1; j < argc; j++)
//第二个判断条件,判断命令参数是否有"--sentienl"
if (!strcmp(argv[j],"--sentinel")) return 1;
return 0;
}
其实,这两个判断条件也就对应了我们在命令行启动哨兵实例的两种方式,一种是直接运行redis-sentinel命令,另一种是运行redis-server命令,但是带有“–sentinel”参数,如下所示:
redis-sentinel sentinel.conf文件路径
或者
redis-server sentinel.conf文件路径—sentinel
所以,如果这两个条件中有一个成立,那么全局变量server的成员变量sentinel_mode,就会被设置为1,表明当前运行的是哨兵实例。这样一来,server.sentinel_mode这一配置项就会在源码的其他地方,被用来判断当前是否运行的是哨兵实例。
好,在完成了对哨兵实例的运行判断之后,接下来,main函数还是会调用initServerConfig函数初始化各种配置项。但是,因为哨兵实例运行时所用的配置项和Redis实例是有区别的,所以,main函数会专门调用initSentinelConfig和initSentinel两个函数,来完成哨兵实例专门的配置项初始化,如下所示:
if (server.sentinel_mode) {
initSentinelConfig();
initSentinel();
}
initSentinelConfig和initSentinel这两个函数都是在sentinel.c文件中实现的。
其中,initSentinelConfig函数主要是将当前server的端口号,改为哨兵实例专用的端口号REDIS_SENTINEL_PORT。这是个宏定义,它对应的默认值是26379。另外,这个函数还会把server的protected_mode设置为0,即允许外部连接哨兵实例,而不是只能通过127.0.0.1本地连接server。
而initSentinel函数则是在initSentinelConfig函数的基础上,进一步完成哨兵实例的初始化,这其中主要包括两部分工作。
在initServerConfig函数执行的时候,Redis server会初始化一个执行命令表,并保存在全局变量server的commands成员变量中。这个命令表本身是一个哈希表,每个哈希项的键对应了一个命令的名称,而值对应了该命令实际的实现函数。
因为哨兵实例是运行在特殊模式的Redis server,它执行的命令和Redis实例也是有区别的,所以initSentinel函数会把server.commands对应的命令表清空,然后在其中添加哨兵对应的命令,如下所示:
dictEmpty(server.commands,NULL);
for (j = 0; j < sizeof(sentinelcmds)/sizeof(sentinelcmds[0]); j++) {
…
struct redisCommand *cmd = sentinelcmds+j;
retval = dictAdd(server.commands, sdsnew(cmd->name), cmd);
…
}
从这里的代码中你可以看到,哨兵实例可以执行的命令保存在了sentinelcmds数组中,这个数组是在sentinel.c文件中定义的。
其中你需要注意的是,哨兵实例执行的一些命令,其名称虽然和Redis实例命令表中的命令名称一样,但它们的实现函数是针对哨兵实例专门实现的。比如,哨兵实例和Redis实例都可以执行publish、info、role命令,但是在哨兵实例中,这三个命令分别由sentinelPublishCommand、sentinelInfoCommand、sentinelRoleCommand这三个在sentinel.c文件中的函数来实现的。所以,当你需要详细了解哨兵实例运行命令的实现时,注意不要找错代码文件。
以下代码也展示了哨兵实例命令表中的部分命令,你可以看看。
struct redisCommand sentinelcmds[] = {
{"ping",pingCommand,1,"",0,NULL,0,0,0,0,0},
{"sentinel",sentinelCommand,-2,"",0,NULL,0,0,0,0,0},
…
{"publish",sentinelPublishCommand,3,"",0,NULL,0,0,0,0,0},
{"info",sentinelInfoCommand,-1,"",0,NULL,0,0,0,0,0},
{"role",sentinelRoleCommand,1,"l",0,NULL,0,0,0,0,0},
…
};
为了保存这些属性信息,哨兵实例定义了sentinelState结构体(在sentinel.c文件中),这其中包括了哨兵实例的ID、用于故障切换的当前纪元、监听的主节点、正在执行的脚本数量,以及与其他哨兵实例发送的IP和端口号等信息。下面的代码就展示了sentinelState结构体定义中的部分属性,你可以看下。
struct sentinelState {
char myid[CONFIG_RUN_ID_SIZE+1]; //哨兵实例ID
uint64_t current_epoch; //当前纪元
dict *masters; //监听的主节点的哈希表
int tilt; //是否处于TILT模式
int running_scripts; //运行的脚本个数
mstime_t tilt_start_time; //tilt模式的起始时间
mstime_t previous_time; //上一次执行时间处理函数的时间
list *scripts_queue; //用于保存脚本的队列
char *announce_ip; //向其他哨兵实例发送的IP信息
int announce_port; //向其他哨兵实例发送的端口号
…
} sentinel;
这样一来,initSentinel函数就主要会把这些属性设置为初始化值。比如,它会为监听的主节点创建一个哈希表,哈希项的键记录了主节点的名称,而值记录了对应的数据结构指针。
到这里,哨兵实例配置项的初始化工作就完成了。下图展示了这个初始化过程,你可以再回顾下。
接下来,main函数还会调用initServer函数完成server本身的初始化操作,这部分哨兵实例也是会执行的。然后,main函数就会调用sentinelIsRunning函数(在sentinel.c文件中)启动哨兵实例。
sentinelIsRunning函数的执行逻辑比较简单,它首先会确认哨兵实例的配置文件存在并且可以正常写入。然后,它会检查哨兵实例是否设置了ID。如果没有设置ID的话,sentinelIsRunning函数就会为哨兵实例随机生成一个ID。
最后,sentinelIsRunning函数会调用sentinelGenerateInitialMonitorEvents函数(在sentinel.c文件中),给每个被监听的主节点发送事件信息。下图展示了sentinelIsRunning函数的基本执行流程,你可以看下。
那么,sentinelIsRunning函数是如何获取到主节点的地址信息呢?
这就和我刚才给你介绍的initSentinel函数有关了,它会初始化哨兵实例的数据结构sentinel.masters。这个结构是使用了一个哈希表记录监听的主节点,每个主节点会使用sentinelRedisInstance结构来保存。而在sentinelRedisInstance结构中,就包含了被监听主节点的地址信息。这个地址信息是由sentienlAddr结构体保存的,其中包括了节点的IP和端口号,如下所示:
typedef struct sentinelAddr {
char *ip;
int port;
} sentinelAddr;
此外,sentinelRedisInstance结构中还包括了一些和主节点、故障切换相关的其他信息,比如主节点名称、ID、监听同一个主节点的其他哨兵实例、主节点的从节点、主节点主观下线和客观下线的时长,等等。以下代码展示了sentinelRedisInstance结构的部分内容,你可以看看。
typedef struct sentinelRedisInstance {
int flags; //实例类型、状态的标记
char *name; //实例名称
char *runid; //实例ID
uint64_t config_epoch; //配置的纪元
sentinelAddr *addr; //实例地址信息
...
mstime_t s_down_since_time; //主观下线的时长
mstime_t o_down_since_time; //客观下线的时长
...
dict *sentinels; //监听同一个主节点的其他哨兵实例
dict *slaves; //主节点的从节点
...
}
这里,你需要注意下,sentinelRedisInstance是一个通用的结构体,它不仅可以表示主节点,也可以表示从节点或者其他的哨兵实例。
这个结构体的成员变量有一个flags,它可以设置为不同的值,从而表示不同类型的实例。比如,当flags设置为SRI_MASTER、SRI_SLAVE或SRI_SENTINEL这三种宏定义(在sentinel.c文件中)时,就分别表示当前实例是主节点、从节点或其他哨兵。你在阅读哨兵相关的源码时,可以看到代码中会对flags进行判断,获得当前实例类型,然后再执行相应的代码逻辑。
好了,到这里,你就知道当哨兵要和被监听的主节点通信时,它只需要从sentinel.masters结构中获取主节点对应的sentinelRedisInstance实例,然后就可以给主节点发送消息了。
这个sentinelGenerateInitialMonitorEvents函数的执行逻辑,你可以参考以下代码:
void sentinelGenerateInitialMonitorEvents(void) {
dictIterator *di;
dictEntry *de;
di = dictGetIterator(sentinel.masters);//获取masters的迭代器
while((de = dictNext(di)) != NULL) { //获取被监听的主节点
sentinelRedisInstance *ri = dictGetVal(de);
sentinelEvent(LL_WARNING,"+monitor",ri,"%@ quorum %d",ri->quorum); //发送+monitor事件
}
dictReleaseIterator(di);
}
从代码中,你可以看到,sentinelGenerateInitialMonitorEvents函数是调用sentinelEvent函数(在sentinel.c文件中)来实际发送事件信息的。
sentinelEvent函数的原型定义如下,它的参数level表示当前的日志级别,type表示发送事件信息所用的订阅频道,ri表示对应交互的主节点,fmt则表示发送的消息内容。
void sentinelEvent(int level, char *type, sentinelRedisInstance *ri, const char *fmt, ...)
那么,sentinelEvent函数会先判断传入的消息内容开头的两个字符,是否为“%”和“@”,如果是的话,它就会判断监听实例的类型是否为主节点。然后如果是主节点,sentinelEvent函数会把监听实例的名称、IP和端口号加入到待发送的消息中,如下所示:
...
//如果传递消息以"%"和"@"开头,就判断实例是否为主节点
if (fmt[0] == '%' && fmt[1] == '@') {
//判断实例的flags标签是否为SRI_MASTER,如果是,就表明实例是主节点
sentinelRedisInstance *master = (ri->flags & SRI_MASTER) ?
NULL : ri->master;
//如果当前实例是主节点,根据实例的名称、IP地址、端口号等信息调用snprintf生成传递的消息msg
if (master) {
snprintf(msg, sizeof(msg), "%s %s %s %d @ %s %s %d", sentinelRedisInstanceTypeStr(ri), ri->name, ri->addr->ip, ri->addr->port,
master->name, master->addr->ip, master->addr->port);
}
...
}
...
然后,sentinelEvent函数会把传入的消息中,除了开头两个字符以外的剩余内容加入到待发送的消息中。最后,sentinelEvent函数会调用pubsubPublishMessage函数(在pubsub.c文件中),将消息发送到对应的频道中,如下所示:
if (level != LL_DEBUG) {
channel = createStringObject(type,strlen(type));
payload = createStringObject(msg,strlen(msg));
pubsubPublishMessage(channel,payload);
...
}
另外这里你要注意一点,刚才我介绍的sentinelGenerateInitialMonitorEvents函数,它给sentinelEvent函数发送的参数type是“+monitor”,这就表明它会将事件信息发到"+monitor"频道上。
下面的图展示了sentinelEvent函数的执行流程,你可以再回顾下。
好了,到这里,哨兵实例的初始化就基本完成了。接下来,哨兵就会和主节点进行通信,监听主节点的状态变化,我会在接下来的课程中给你具体介绍它们之间的通信过程。
今天这节课,我给你介绍了哨兵实例的初始化过程。哨兵实例和Redis实例使用的是相同的入口main函数,但是由于哨兵实例在运行时使用的配置项、运行时信息、支持的可执行命令、事件处理和Redis实例又有所区别。
所以,main函数会先通过checkForSentinelMode函数来判断当前运行是否为哨兵实例,并相应地设置全局配置项server.sentinel_mode,这个配置项就会在源码其他地方被用于标识哨兵实例是否运行。
这样,当启动的是哨兵实例时,main函数会调用initSentinelConfig、initSentinel函数来完成哨兵实例的初始化,然后,main函数会调用sentinelIsRunning函数,来向被监听的主节点发送事件信息,从而开始监听主节点。
最后,我也想再提醒你一下,从今天这节课的内容中,我们可以看到哨兵实例在运行后,开始使用Pub/Sub订阅频道模式的通信方法,这种通信方法通常适用于多对多的通信场景中。
因为哨兵实例除了和主节点通信外,还需要和其他哨兵实例、客户端进行通信,而采用Pub/Sub通信方法,可以高效地完成这些通信过程。我在接下来的课程中还会给你介绍Pub/Sub通信方法在哨兵运行过程中的使用,也希望你在学完这部分课程内容之后,能够掌握这种通信方法的实现。
哨兵实例本身是有配置文件sentinel.conf的,那么你能在哨兵实例的初始化过程中,找到解析这个配置文件的函数吗?
评论