Oozie-HA

三月 17th, 2014 by klose | No Comments | Filed in 互联网应用, 海量数据存储与处理

1.Oozie是state-less,状态存储在DB中。 2.借助LoadBalancer、Virtual IP、或者DNS Round-Robin实现对外单一的host封装。 3.利用Zookeeper实现多Server在被用户访问同一个job的Distributed Locking。(实际上仅仅注册了Server,没有注册job-id的状态到ZK,因为后端有统一的DB存储所有的作业的状态。通过Zookeeper,每一个Oozie Server知道当前有几个正在执行的instances,使用mod算法,每一个oozie Server选取部分的Coordinator jobs来进行materialize。)Materialization一个Coordinator上的workflow,是从无到有(WAITING),在从有到RUNNING的过程。 4.支持到任意Server查询任何的job的log,目前通过Log Streaming(HTTP),后续可能会考虑MapReduce JobHistoryServer的方案,将已经完成作业的log存储到HDFS文件夹中. Refer to: Oozie-615 Cloudera-Blog-O

Tags: , ,

HDFS HA-Quorum Journal Manager

七月 8th, 2013 by klose | 4 Comments | Filed in 互联网应用, 海量数据存储与处理

1、背景 HDFS HA,即NameNode单点故障问题,一直是关系到HDFS稳定性最为重要的特性。之前Hadoop0.23初探系列文章中,介绍了HDFS的Federeation概况、配置与部署的情况,以及有关HA的相关概念。  Hadoop0.23.0初探1—前因后果 Hadoop0.23.0初探2—HDFS Federation部署 Hadoop0.23.0初探3—HDFS NN,SNN,BN和HA HDFS HA的发展经历了如下几个阶段: 1)手动恢复阶段。手动备份fsimage、fsedits数据,NN故障之后,重启hdfs。这是最早期使用的办法,由于早期数据量、机器规模、以及对应用的影响还比较小,该方案勉强坚持了一段时间。 2)借助DRBD、HeartbeatHA实现主备切换。 使用DRBD实现两台物理机器之间块设备的同步,即通过网络实现Raid1,辅以Heartbeat HA实现两台机器动态角色切换,对外(DataNode、DFSClient)使用虚IP来统一配置。这种策略,可以

Tags: , , , , ,

Hadoop0.23.0初探3—HDFS NN,SNN,BN和HA

十二月 9th, 2011 by klose | No Comments | Filed in 互联网应用, 海量数据存储与处理

前言 保证HDFS高可用是Hadoop被推广以来很多技术人员一直关心的问题,通过搜索引擎搜索也可以得到很多的方案。恰逢HDFS Federation出炉,本文将一些涉及到有关NameNode、SecondaryNameNode、BackupNode的含义与区别,以及HDFS HA框架做一个总结。除此之外,文章的最后,将介绍Hadoop-0.23.0如何配置NameNode、SecondaryNameNode、以及BackupNode。 1、HDFS元数据服务器如何工作? Namenode在第一次启动时刻之前,进行格式化,$bin/hdfs namenode -format -clusterid yourid 按照需求生成VERSION:例如我Hadoop0.23.0初探2中使用gb17作为namenode,在format之后会在dfs.hadoop.name.dir目录中生成如下的VERSION $ cat /opt/jiangbing/hdfs23/current/VERSION #Thu Dec 08 16:27:30 CST 2011 namespaceID=1787450988 clusterID=klose cTime=0 storageT

Tags: , , , ,