本文共 7132 字,大约阅读时间需要 23 分钟。
【本文转载自:www.bigdata-star.com】
本文整合梳理了主流大数据生态圈中的组件:Hdfs+Yarn+HBase+Spark+Storm的单点故障问题的解决方案:构建HA(High Available)高可用架构。阅读本文之前,最好需要了解清楚各组件的架构原理。首先一张图来了解下这些组件的架构:
我们可以发现:它们的共同特点就是都是主从结构。HDFS中的NameNode,Yarn中ResourceManager,Hbase中HMaster,Spark中Master,Storm中Nimbus起着“老大”的角色,那么“老大”挂了怎么办呢?这可就麻烦了,只要老大挂了,等于整个集群的服务都用不了了,NameNode挂了整个集群的HDFS就用不了了,HBase的HMaster挂了整个集群的Hbase都用不了了,等等。这就是所谓的单点故障问题。单点指只有一个主节点。
既然只有一个主节点就会发生单点故障,那么我们很容易可以想到,我来两个不就行了!对的,HA的思想就是多弄几个主节点,一个死了另一个上。但这样也不够啊!必须有个东西能够使得发生故障的时候自动切换啊!这东西就是Zookeeper。所以有了下面这张图:
由于这些组件的HA原理类似,我们只以最难的HDFS的HA高可用架构原理为例讲解。而其他组件,不讲解原理,只上配置文件。
Zookeeper是一个开源的分布式协调服务,分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。
ZK在Hadoop生态圈中的主要功能有:namenode职责:
(1)负责客户端的请求和响应(2)负责元数据的管理(查询,修改。。)(3)维护元信息(fsimage文件),fsimage是磁盘元数据镜像文件,存储元数据信息。(4)维护操作日志(edits文件),edits是数据操作日志文件,当客户端操作文件的时候,操作记录首先会被记录到edits日志文件中。我们可以在$dfs.namenode.name.dir/current目录下看到如下的文件结构出现HA之后,(3)和(4)交给了另一个叫做JournalNode的东东。JournalNode在HA故障转移中起到了重要的作用!
fs.defaultFS hdfs://mycluster hadoop.tmp.dir /usr/local/hadoop-2.6.0-cdh5.11.1/data/tmp hadoop.http.staticuser.user master ha.zookeeper.quorum master:2181,slave1:2181,slave2:2181
dfs.replication 2 dfs.http.address 0.0.0.0:50070 dfs.permissions.enabled false dfs.namenode.name.dir /usr/local/hadoop-2.6.0-cdh5.11.1/data/tmp/dfs/name dfs.datanode.data.dir /usr/local/hadoop-2.6.0-cdh5.11.1/data/tmp/dfs/data dfs.nameservices mycluster dfs.ha.namenodes.mycluster nn1,nn2 dfs.namenode.rpc-address.mycluster.nn1 master:8020 dfs.namenode.rpc-address.mycluster.nn2 slave1:8020 dfs.namenode.http-address.mycluster.nn1 master:50070 dfs.namenode.http-address.mycluster.nn2 slave1:50070 dfs.namenode.shared.edits.dir qjournal://master:8485;slave1:8485;slave2:8485/mycluster dfs.journalnode.edits.dir /usr/local/hadoop-2.6.0-cdh5.11.1/data/jn dfs.client.failover.proxy.provider.mycluster org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider dfs.ha.fencing.methods sshfence dfs.ha.fencing.ssh.private-key-files /root/.ssh/id_rsa dfs.ha.automatic-failover.enabled true dfs.webhdfs.enabled true
(1)启动zookeeper集群(分别在slave1、slave2和slave3上执行)
zkServer.sh start
(2)格式化ZKFC(在master1上执行)hdfs zkfc -formatZK
(3)启动journalnode(分别在slave1、slave2和slave3上执行)sbin/hadoop-daemon.sh start journalnode
(4)格式化HDFS(在master1上执行)hdfs namenode -format
(5)启动nn1sbin/hadoop-daemon.sh start namenode
(6)第二个namenode机器同步元数据信息bin/hdfs namenode -bootstrapStandby
(7)启动nn2sbin/hadoop-daemon.sh start namenode
(6)启动所有datanode sbin/hadoop-daemons.sh start datanode
(7)在master机器上先启动zkfc(自动故障转移) 它就变成active了 sbin/hadoop-daemon.sh start zkfc
(8)再在slave1机器上启动zkfc.它就变成standby了 (1)启动服务
(2)kill命令杀死active nn的进程
(3)在web UI界面上会发现Standby自动变成了Active原理与HDFS的非常类似,也是通过Zookeeper心跳检测,自动切换,非常简单,就是配置一下配置文件。
yarn.resourcemanager.ha.enabled true yarn.resourcemanager.cluster-id rs yarn.resourcemanager.ha.rm-ids rm1,rm2 yarn.resourcemanager.hostname.rm1 master yarn.resourcemanager.hostname.rm2 slave1 yarn.resourcemanager.zk-address master:2181,slave1:2181,slave2:2181 yarn.resourcemanager.recovery.enabled true
Hbase其实是无单点故障的,你可以手动启动多个HMaster,比如在master机器上启动hbase(bin/start-hbase.sh
)之后,可以到slave1机器上也启动master(bin/hbase-daemon.sh start master
),无需任何配置。但是手工启动这样有点麻烦,可以通过配置文件,使得每次启动hbase时候自动的帮你启动两个HMaster。
touch backup-masters
在此文件上输入你要作为备份HMaster的机器主机名。 Spark同样是用ZooKeeper来实现HA。ZooKeeper提供了一个Leader Election机制,由于ZK的高度一致性,可以保证虽有多个Master但是只有一个是Active的,当Active的Master出现故障时,另外的一个Standby Master会被选举出来。
vim conf/spark-env.sh
注释掉原本的SPARK_MASTER_HOST,如果它存在,就会默认只以它为Master。
-Dspark.deploy.recoveryMode: 表明整个集群的恢复和维护都是Zookeeper.-Dspark.deploy.zookeeper.url: 所有做HA机器,其中端口2181是默认端口。-Dspark.deploy.zookeeper.dir: 指定Spark在Zookeeper注册的信息#SPARK_MASTER_HOST=masterexport SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=master:2181,slave1:2181,slave2:2181 -Dspark.deploy.zookeeper.dir=/spark"
需要将它分发给需要做备份Master的机器。
scp conf/spark-env.sh slave1:/usr/local/spark-2.2.0-bin-hadoop2.6.0-cdh5.11.1/conf/
在一台机器上:sbin/start-all.sh
另一台机器上启动第二个Master:sbin/start-master.sh