书签 分享 收藏 举报 版权申诉 / 4

一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法.pdf

  • 上传人:GAME****980
  • 文档编号:4557574
  • 上传时间:2018-10-20
  • 格式:PDF
  • 页数:4
  • 大小:303.98KB
  • 摘要
    申请专利号:

    CN201410717146.8

    申请日:

    2014.12.03

    公开号:

    CN104461792A

    公开日:

    2015.03.25

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情:

    发明专利申请公布后的视为撤回IPC(主分类):G06F 11/16申请公布日:20150325|||公开

    IPC分类号:

    G06F11/16; G06F17/30

    主分类号:

    G06F11/16

    申请人:

    浪潮集团有限公司

    发明人:

    李璋

    地址:

    250101山东省济南市高新区浪潮路1036号

    优先权:

    专利代理机构:

    代理人:

    PDF完整版下载: PDF下载
    内容摘要

    本发明提供一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法,采用两台服务器实现双机热备,HDFS的元数据需要保存在共享存储中;两台主机的eth1使用双机对联线直接连接;每台主机预留30G的空间作为共用空间被HA使用;DRBD实现了网络RAID-1功能,即两台服务器一台是主节点,一台是从节点;在主节点上的任何操作,都会被同步到从节点的相应磁盘分区上,达到数据备份的效果。本发明和现有技术相比,够解决HDFS中NameNode单点故障的问题,HDFS的元数据保存在共享存储中,实现双机热备,当其中一台服务器出现故障时实现自动切换。

    权利要求书

    权利要求书
    1.  一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法,其特征在于采用两台服务器实现双机热备,HDFS的元数据需要保存在共享存储中;两台主机的eth1使用双机对联线直接连接;每台主机预留30G的空间作为共用空间被HA使用;DRBD实现了网络RAID-1功能,即两台服务器一台是主节点,提供存储服务,一台是从节点;在主节点上的任何操作,都会被同步到从节点的相应磁盘分区上,达到数据备份的效果;当主节点发生故障时,通过Heartbeat从节点可以接管主节点的虚拟IP。

    说明书

    说明书一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法
    技术领域
    本发明具体地说是一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法。
    背景技术
    Hadoop是一个能够对大量数据进行分布式处理的软件,能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。Hadoop 由许多元素构成,如HDFS、MapReduce等。其最底部是 Hadoop Distributed File System(HDFS),它存储 Hadoop 集群中所有存储节点上的文件。
    对外部客户机而言,HDFS就像一个传统的分级文件系统。可以创建、删除、移动或重命名文件,等等。但是 HDFS 的架构是基于一组特定的节点构建的,这是由它自身的特点决定的。这些节点包括 NameNode(仅一个),它在 HDFS 内部提供元数据服务;DataNode,它为 HDFS 提供存储块。由于仅存在一个 NameNode,因此这是 HDFS 存在NameNode单点失败的问题。
    NameNode 是一个通常在 HDFS 实例中的单独机器上运行的软件。它负责管理文件系统名称空间和控制外部客户机的访问。NameNode 决定是否将文件映射到 DataNode 上的复制块上。
    实际的 I/O事务并没有经过 NameNode,只有表示 DataNode 和块的文件映射的元数据保存在 NameNode中。当外部客户机发送请求要求创建文件时,NameNode 会以块标识和该块的第一个副本的 DataNode IP 地址作为响应。这个 NameNode 还会通知其他将要接收该块的副本的 DataNode。
    NameNode 在一个称为 FsImage 的文件中存储所有关于文件系统名称空间的信息。这个文件和一个包含所有事务的记录文件(EditLog)存储在 NameNode 的本地文件系统上。FsImage 和 EditLog 文件也需要复制副本,以防文件损坏或 NameNode 系统丢失。
    发明内容
    本发明的目的是克服现有技术中存在的不足,提供一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法。
    本发明的技术方案是按以下方式实现的,采用两台服务器实现双机热备,HDFS的元数据需要保存在共享存储中;两台主机的eth1使用双机对联线直接连接;每台主机预留30G的空间作为共用空间被HA使用;DRBD实现了网络RAID-1功能,即两台服务器一台是主节点,提供存储服务,一台是从节点;在主节点上的任何操作,都会被同步到从节点的相应磁盘分区上,达到数据备份的效果;当主节点发生故障时,通过Heartbeat从节点可以接管主节点的虚拟IP。 
    本发明的优点是:
    本发明的一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法和现有技术相比,够解决HDFS中NameNode单点故障的问题,HDFS的元数据保存在共享存储中,实现双机热备,当其中一台服务器出现故障时实现自动切换。
    具体实施方式
    下面对本发明的一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法作以下详细说明。
    本发明的一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法,采用两台服务器实现双机热备,HDFS的元数据需要保存在共享存储中;两台主机的eth1使用双机对联线直接连接;每台主机预留30G的空间作为共用空间被HA使用;DRBD实现了网络RAID-1功能,即两台服务器一台是主节点,提供存储服务,一台是从节点;在主节点上的任何操作,都会被同步到从节点的相应磁盘分区上,达到数据备份的效果;当主节点发生故障时,通过Heartbeat从节点可以接管主节点的虚拟IP。
    DRBD 实际上是一种块设备的实现,主要被用于Linux平台下的高可用(HA)方案之中。他是有内核模块和相关程序而组成,通过网络通 信来同步镜像整个设备,有点类似于一个网络RAID的功能。也就是说当你将数据写入本地的DRBD设备上的文件系统时,数据会同时被发送到网络中的另外一台主机之上, 并以完全相同的形式记录在一个文件系统中(实际上文件系统的创建也是由DRBD的同步来实现的)。本地节点(主机)与远程节点(主机)的数据可以保证实时 的同步,并保证IO的一致性。所以当本地节点的主机出现故障时,远程节点的主机上还会保留有一份完全相同的数据,可以继续使用,以达到高可用的目的。
    实际生产环境中,如果NameNode宕机,造成的损失是不可估量的。要保证主NameNode不间断服务,就需要对服务器实现冗余。Heartbeat 提供了廉价的、可伸缩的高可用集群方案。通过DRBD + Heartbeat在Linux下创建一个高可用(HA)的集群服务器,在高可用(HA)解决方案中使用DRBD的功能,可以代替使用一个共享盘阵存储设备。因为数据同时存在于本地主机和远程主机上,在遇到需要切换的时候,远程主机只需要使用它上面的那份备份数据,就可以继续提供服务了。
    本发明的一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法其加工制作非常简单方便,按照说明书所示即可加工。
    除说明书所述的技术特征外,均为本专业技术人员的已知技术。

    关 键  词:
    一种 解决 HADOOP 分布式 文件系统 NAMENODE 单点 故障 HA 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种解决HADOOP分布式文件系统NAMENODE单点故障的HA方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4557574.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1