散仙在上篇文章分享了关于使用zookeeper来完成配置同步的功能,那么本篇,散仙依旧是模拟实现一个基于zookeeper怎么解决单点故障的案例。
单点故障问题,在分布式系统中是一个很有可能发生的场景,比如说在Hadoop2.x之前的HDFS的NameNode和MapReduce的JobTracker的单点故障,当然这个问题已经在Hadoop2.x中得到解决,解决的方式,大部分是基于Zookeeper来实现的。另外一个例子,在Hbase中的Hmaster的单点问题,也是使用Zookeeper解决的。
下面,我们先来看下,简单的实现图:
总结流程如下:
序号 | 描述 |
1 | 创捷父节点类型为Persistent |
2 | 创捷子节点类型为ephemeral + sequential |
3 | 客户端启动时创建子节点 |
4 | 序列号最小的子节点选为master,其他子节点都是slave |
5 | 每个slave侦听序列号比它小的子节点中最大的子节点的NodeDeleted事件 |
6 | 一旦NodeDeleted事件被触发,该slave客户端会重新选定侦听对象,如果不存在可侦听对象,该slave自动晋升成master |
代码,如下:
package com.automicswitch;
import java.nio.charset.Charset;
import java.nio.charset.StandardCharsets;
import java.text.SimpleDateFormat;
import java.util.Collections;
import java.util.Date;
import java.util.List;
import java.util.concurrent.CountDownLatch;
import org.apache.zookeeper.CreateMode;
import org.apache.zookeeper.WatchedEvent;
import org.apache.zookeeper.Watcher;
import org.apache.zookeeper.ZooDefs.Ids;
import org.apache.zookeeper.ZooKeeper;
import org.apache.zookeeper.data.Stat;
import com.util.ConnectionWatcher;
/**
* 模拟Zookeeper实现单点故障
* 自动切换
* @author 秦东亮
*
* ***/
public class Slave implements Watcher{
/**
* zk实例
* **/
public ZooKeeper zk;
/**
* 同步工具
*
* **/
private CountDownLatch count=new CountDownLatch(1);
private static final Charset CHARSET=StandardCharsets.UTF_8;
public Slave() {
// TODO Auto-generated constructor stub
}
/**
* hosts,
* zookeeper的访问地址
*
* **/
public Slave(String hosts) {
try{
zk=new ZooKeeper(hosts, 7000, new Watcher() {
@Override
public void process(WatchedEvent event) {
// TODO Auto-generated method stub
if(event.getState()==Event.KeeperState.SyncConnected){
count.countDown();
}
}
});
}catch(Exception e){
e.printStackTrace();
}
}
/***
*
* 此方法是写入数据
* 如果不存在此节点
* 就会新建,已存在就是
* 更新
*
* **/
public void write(String path,String value)throws Exception{
Stat stat=zk.exists(path, false);
if(stat==null){
zk.create(path, value.getBytes(CHARSET), Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
}else{
zk.setData(path, value.getBytes(CHARSET), -1);
}
}
public String read(String path,Watcher watch)throws Exception{
byte[] data=zk.getData(path, watch, null);
return new String(data,CHARSET);
}
SimpleDateFormat f=new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
public void automicSwitch()throws Exception{
System.out.println("Master故障,Slave自动切换......., 时间 "+f.format(new Date()));
}
public void startMaster(){
System.out.println("A的Master 启动了........");
}
public void createPersist()throws Exception{
zk.create("/a", "主节点".getBytes(), Ids.OPEN_ACL_UNSAFE , CreateMode.PERSISTENT);
System.out.println("创建主节点成功........");
}
public void createTemp()throws Exception{
zk.create("/a/b", "a".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);
System.out.println("a创建子节点成功...........");
}
public void check()throws Exception{
List<String> list=zk.getChildren("/a", null);
Collections.sort(list);
if(list.isEmpty()){
System.out.println("此父路径下面没有节点");
}else{
String start=list.get(0);
String data=new String(zk.getData("/a/"+start, false,null));
if(data.equals("a")){//等于本身就启动作为Master
if(list.size()==1){
startMaster();//作为Master启动
}else{
automicSwitch();
}
}else{
//非当前节点
for(int i=0;i<list.size();i++){
//获取那个节点存的此客户端的模拟IP
String temp=new String(zk.getData("/a/"+list.get(i), false, null));
if(temp.equals("a")){
//因为前面作为首位判断,所以这个出现的位置不可能是首位
//需要监听小节点里面的最大的一个节点
String watchPath=list.get(i-1);
System.out.println("a监听的是: "+watchPath);
zk.exists("/a/"+watchPath, this);//监听此节点的详细情况
break;//结束循环
}
}
}
}
}
public void close()throws Exception{
zk.close();
}
@Override
public void process(WatchedEvent event) {
if(event.getType()==Event.EventType.NodeDeleted){
//如果发现,监听的节点,挂掉了,那么就重新,进行监听
try{
System.out.println("注意有节点挂掉,重新调整监听策略........");
check();
}catch(Exception e){
e.printStackTrace();
}
}
}
public static void main(String[] args)throws Exception {
Slave s=new Slave("10.2.143.5:2181");
//s.createPersist();//创建主节点
s.createTemp();
s.check();
Thread.sleep(Long.MAX_VALUE);
s.close();
}
}
散仙起了,3个客户端,作为模拟Slave,本机上的一个eclipse,一个Myeclipse,和服务器上的一个Myeclipse来实现,模拟单点故障,自动切换的功能。
初始状态截图如下:
散仙停掉,2的监听后发生的变化,如下:
最后,散仙停掉A节点的Master,模拟Master宕机。
到此,散仙已经模拟实现了主从单点故障的自动切换,使用Zookeeper可以非常简单可靠的来完成这个功能,当然,我们在这里只是模拟的简单实现,真正的单点问题的实现,肯定要比散仙的这个要复杂的多,在这里只是提供给大家一个解决的思路。
最后,感谢各位道友能够坚持看完,文章若有不足之处,欢迎指正交流!
- 大小: 53.2 KB
- 大小: 69.2 KB
- 大小: 118.2 KB
- 大小: 128.3 KB
分享到:
相关推荐
分布式之Zookeeper(高清视频教程).rar
ubuntu系统部署完全分布式hadoop时,先部署了zookeeper和hbase
分布式框架Zookeeper之服务注册与订阅.........................
分布式架构Zookeeper入门实战到底层原理剖析
Zookeeper伪分布式集群搭建描述伪分布式集群就是在一台机器部署多个zk应用,部署之前服务器需要有jdk环境 java -version可以显示相关java
互联网大厂必会的高薪技能之分布式架构Zookeeper入门实战到底层原理剖析
server程序入口(启动类在zookeeper-server/src/main/java文件夹中,org.apache.zookeeper.server.quorum.QuorumPeerMain),program argument为conf/zoo.cfg,将conf/log4j.properties配置拷贝到zookeeper-server/...
三台主机搭建分布式Zookeeper,完全分布式搭建zookeeper集群,及其简单的操作
分布式服务框架 Zookeeper -- 管理分布式环境中的数据
本文来自于cnblogs,说到分布式开发Zookeeper是必须了解和掌握的,分布式消息服务kafka、hbase到hadoop等分布式大数据处理都会用到Zookeeper,所以在此将Zookeeper作为基础来讲解。Zookeeper是分布式服务框架,主要...
#资源达人分享计划#
详解Zookeeper伪分布式集群环境搭建过程
基于zookeeper的分布式锁简单实现,包含测试代码,实用工具类
ZooKeeper 是一个开源的分布式 应用程序协调服务器,其为分布式系统提供一致性服务。其一致性是通过基于 Paxos 算法的 ZAB 协议完成的。其主要功能包括:配置维护、域名服务、分布式同步、集群管理等。 zookeeper 的...
#资源达人分享计划#
从Paxos到Zookeeper分布式一致性原理与实践 + ZooKeeper-分布式过程协同技术详解
在分布式高并发的情况下,多个访问之间拥有唯一的一个订单编号,多次提交的订单不会出现重复的,只能是唯一的,ZooKeeper就很好的解决了唯一性
分布式服务框架zookeeper 3.4.13版本,主要用于构建RPC服务与常见集群等。
从传统JavaWeb转入分布式系统应用,再到接触分布式协调框架ZooKeeper,通过痛苦的思维逻辑和理念转变,历经一个月时间,小伙伴们终于把ZooKeeper嵌入到了BoCloud博云的BeyondContainer中,并在其上进行相应功能的...