简析Redis哨兵实现原理

Author Avatar
GeniusFunny 11月 23, 2018
  • 在其它设备中阅读本文章

Redis Sentinel 是一个分布式架构(Sentinel节点、Redis数据节点、Redis客户端分布在不同的物理节点上),其中包括了若干个Sentinel节点和Redis数据节点,每个Sentinel节点对数据节点和其他Sentinel节点进行监控,当它发现节点不可达时,会对节点做下线标识。若该节点为主节点,它会和其他Sentinel节点共同协商,若大部分节点皆表示该主节点不可达,那么就会从Sentinel中选举出一个Sentinel节点来完成自动故障转移的工作,同时将这个变化实时通知给Redis应用方。

实现原理

三个定时监控任务

Redis通过三个定时监控任务完成对各个节点的发现和监控。_s_

获取最新拓扑结构

每隔10s,每个Sentinel节点会向主节点和从节点发送info命令获取最新的拓扑结构。

作用:

  1. 通过向主节点执行info命令,获取从节点信息,所以Sentinel节点不需要显式配置监控从节点。
  2. 当有新的从节点加入时都可以立刻感知出来。
  3. 节点不可达或者故障转移后,可以通过info命令实时更新节点拓扑信息。

Sentinel节点发布和订阅sentinel:hello频道

每隔2s,每个Sentinel节点会向Redis数据节点的__sentinel__:hello频道发送该sentinel节点对于主节点的判断以及当前Sentinel节点的信息,同时每个Sentinel节点也会订阅该频道来了解其他Sentinel节点以及它们对主节点的判断。

作用:

  1. 发现新的Sentinel节点。
  2. Sentinel节点之间交换主节点的状态,作为后面客观下线以及领导者选举的依据。

心跳检测

每隔1s,每隔Sentinel节点会向主节点、从节点、其余Sentinel节点发送一条ping命令做一次心跳检测,来确定这些节点是否可达。

作用:

  1. 判断节点是否可达的重要依据。

主观下线和客观下线

主观下线

上面提到心跳检测,如果这些节点超过down-after-millionsections还没有进行有效回复,Sentinel节点就会对该节点做失败判断,这个行为叫做主观下线。Sentinel节点、从节点,主观下线后没有后续的故障转移操作。

客观下线

当Sentinel节点主观下线的节点是主节点时,该Sentinel节点会通过sentinel is-master-down-by-addr命令向其他Sentinel节点询问对主节点的判断,当超过个数,Sentinel认为主节点的确出现问题,此时该Sentinel对主节点做出客观下线的决定。

领导者Sentinel节点选举

当Sentinel节点对主节点完成了客观下线后,Sentinel节点之间还会选举出一个结点作为领导者进行故障转移工作;Redis使用了Raft算法实现领导者选举。

Raft算法大致思路

  1. 每个在线的Sentinel节点都有资格成为领导者,当它确认主节点主观下线后,会向其他节点发送sentinel is-master-down-by-addr命令,要求将自己设置为领导者。
  2. 收到命令的Sentinel节点,如果没有同意过其他的Sentinel节点的sentinel is-master-down-by-addr命令,将同意该请求,反之拒绝。
  3. 如果该Sentinel节点发现自己的票数已经大于或等于max(quorum, num(sentinels) / 2 + 1),那么它就成为领导者。
  4. 如果此过程没有选举出领导者,将进入下一次选举。
  5. 基本上谁先完成客观下线,谁就是领导者。

故障转移

领导者选举出的Sentinel将负责故障转移。

过程

  1. 从节点列表中选举出一个节点作为新的主节点。
    • 过滤掉不主观下线、掉线、5秒内没有回复Sentinel ping响应等等的节点…
    • 选择从节点优先级最高的节点,如果存在则返回,不存在则继续下一步。
    • 选择复制偏移量最大的从节点,如果存在则返回,不存在则继续下一步。
    • 选择runid最小的从节点。
  2. 对选举出的节点执行slave of no one,升级为主节点。
  3. Sentinel领导者节点向其他节点发送命令,让它们成为新主节点的从节点。
  4. Sentinel集合节点将原主节点更新为从节点,并保持对其关注,当其恢复后命令它去复制新的主节点。