KANG's BLOG

Let's have some fun

Zookeeper的leader选举过程

一、有两种情况会发起Leader选举: 服务器启动的时候 服务器运行的时候当Leader宕机 在讲解流程之前,先说明一下选举流程中涉及到的角色: LOOKING:寻找Leader状态,处于该状态需要进入选举流程(只有该节点才可以投票) LEADING:领导者状态,处于该状态的节点说明是角色已经是Leader FOLLOWING:跟随者状态,表示Leader已经选举出来,当前节点角色是follower OBSERVER:观察者状态,表明当前节点角色是observer(该节点不参与竞选) 二、三个核心选举原则: Zookeeper集群中只有超过半数以上的服务器启动,集群才能正常工作; 在集群正常工作之前,myid小的服务器给myid大的服务器投票,直到集群正常工作,选出Leader; 选出Leader之后,之前的服务器状态由Looking改变为Following,以后的服务器都是Follower。 三、选举案例 服务器1启动,发起一次选举 服务器1投自己一票。此时服务器1票数一票,不够半数以上(3票),选举无法完成; 服务器1状态保持为LOOKING; 服务器2启动,再发起一次选举 服务器1和2分别投自己一票,此时服务器1发现服务器2的id比自己大,更改选票投给服务器2; 此时服务器1票数0票,服务器2票数2票,不够半数以上(3票),选举无法完成; 服务器1,2状态保持LOOKING; 服务器3启动,发起一次选举 与上面过程一样,服务器1和2先投自己一票,然后因为服务器3id最大,两者更改选票投给为服务器3; 此次投票结果:服务器1为0票,服务器2为0票,服务器3为3票。此时服务器3的票数已经超过半数(3票),服务器3当选Leader。 服务器1,2更改状态为FOLLOWING,服务器3更改状态为LEADING; 服务器4启动,发起一次选举 此时服务器1,2,3已经不是LOOKING状态,不会更改选票信息。交换选票信息结果:服务器3为3票,服务器4为1票。 此时服务器4服从多数,更改选票信息为服务器3;服务器4并更改状态为FOLLOWING; 服务器5启动,同4一样投票给3,此时服务器3一共5票,服务器5为0票 服务器5并更改状态为FOLLOWING; 选举结果 最终Leader是服务器3,状态为LEADING;

Zookeeper的ZAB协议

概念 ZAB(Zookeeper Atomic Broadcast)协议是专门为zookeeper设计的一致性协议。 ZAB协议包括两种基本的模式:消息广播和崩溃恢复 当整个服务框架在启动过程中,或是当Leader服务器出现网络中断崩溃退出与重启等异常情况时,ZAB就会进入恢复模式并选举产生新的Leader服务器。 当选举产生了新的Leader服务器,同时集群中已经有过半的机器与该Leader服务器完成了状态同步之后,ZAB协议就会退出崩溃恢复模式,进入消息广播模式。 当有新的服务器加入到集群中去,如果此时集群中已经存在一个Leader服务器在负责进行消息广播,那么新加入的服务器会自动进入数据恢复模式,找到Leader服务器,并与其进行数据同步,然后一起参与到消息广播流程中去。 以上其实大致经历了三个步骤: 崩溃恢复:主要就是Leader选举过程。 数据同步:Leader服务器与其他服务器进行数据同步。 消息广播:Leader服务器将数据发送给其他服务器。 zab和Paxos算法的联系和区别 共同点: 两者都存在一个类似于Leader进程的角色,由其负责协调多个Follow进程的运行。 Leader进程都会等待超过半数的Follower做出正确的反馈后,才会将一个提案进行提交。 在ZAB协议中,每个Proposal中都包含了一个epoch值,用来代表当前Leader周期,在Paxos算法中,同样存在这样一个标识,只是名字变成了Ballot。 不同点: Paxos算法中,一个新的选举产生的主进程会进行两个阶段的工作

Zookeeper的命令及配置

zookeeper命令 查看状态:zkServer.sh status 创建节点 create /name value 编辑节点 set /name editValue