书签 分享 收藏 举报 版权申诉 / 12

对等网络环境下副本服务的部署及副本创建方法.pdf

  • 上传人:a2
  • 文档编号:1081664
  • 上传时间:2018-03-30
  • 格式:PDF
  • 页数:12
  • 大小:606.38KB
  • 摘要
    申请专利号:

    CN200910265420.1

    申请日:

    2009.12.28

    公开号:

    CN101753625A

    公开日:

    2010.06.23

    当前法律状态:

    终止

    有效性:

    无权

    法律详情:

    未缴年费专利权终止IPC(主分类):H04L 29/08申请日:20091228授权公告日:20120905终止日期:20121228|||授权|||实质审查的生效IPC(主分类):H04L 29/08申请日:20091228|||公开

    IPC分类号:

    H04L29/08; H04L12/24

    主分类号:

    H04L29/08

    申请人:

    北京理工大学

    发明人:

    孙新; 刘琼昕; 贺跃

    地址:

    100081 北京市海淀区中关村南大街5号

    优先权:

    专利代理机构:

    代理人:

    PDF完整版下载: PDF下载
    内容摘要

    本发明涉及分布式环境,特别是对等网络环境下的副本服务的部署和副本创建方法,属于分布式数据管理技术领域。本发明针对超级节点的P2P系统,首先设计了一种通用的副本服务的部署方法,构建副本服务的体系架构。然后,设计了一种动态的副本创建方法,从系统全局的数据资源分布出发,根据资源请求方访问资源的代价和副本访问频率两方面因素,确定需要创建副本的资源;根据各个域对资源的缺乏程度和访问频率,及创建副本后访问代价的减少程度确定副本创建地点。模拟实验和评估显示,在资源访问性能提升和副本数量之间能够获得好的平衡。

    权利要求书

    1.  对等网络环境下副本服务的部署及副本创建方法,其特征在于:包括副本服务的部署方法和副本创建方法;
    副本服务的部署方法包括:
    (1)确定系统中所有节点间的父子关系;
    (2)系统中每个节点都维护一个本地副本目录,保存本地共享资源的副本信息;超级节点的本地副本目录除了保存本地共享资源的副本信息之外,还包括所有子节点的副本目录信息;
    (3)副本服务部署在超级节点上,超级节点负责本地共享资源和子节点中普通节点的共享资源的副本管理;
    副本创建方法包括:
    步骤1、通过计算逻辑资源的访问频率确定热点资源;
    步骤2、对于每个热点资源,如果资源的平均响应时间大于给定阈值,则需要创建副本;
    步骤3、对于每一个需要创建副本的资源,确定需要创建副本的域;
    步骤4、在需要创建副本的域内确定副本创建的地点;
    步骤5、需要创建副本的节点选择访问代价最小的副本复制到本地。

    2.
      根据权利要求1所述的对等网络环境下副本服务的部署及副本创建方法,其特征在于:系统中所有节点之间的父子关系依据如下原则进行确定:
    ①只有超级节点可以做父节点;
    ②每个普通节点可以同时与多个超级节点相连,但只能选择其中一个超级节点作为其父节点;
    ③每个超级节点可以同时与多个超级节点相连,但只能选择其中一个超级节点作为其父节点,也可以不选择父节点,没有父节点的超级节点称为域超级节点;
    ④整个系统中所有超级节点之间的父子关系不能形成回路。

    3.
      根据权利要求1所述的对等网络环境下副本服务的部署及副本创建方法,其特征在于:副本创建的过程由每个超级节点上的副本服务周期性的执行,一旦发现有访问频率和响应时间超过给定阈值的逻辑资源,副本服务自动进行副本创建工作。

    说明书

    对等网络环境下副本服务的部署及副本创建方法
    技术领域
    本发明涉及分布式环境,特别是对等网络环境下的副本服务的部署方法和副本创建方法,属于分布式数据管理领域。
    背景技术
    对等计算模式(Peer-to-Peer Computing)简称P2P,作为一种新型的体系结构模型,强调资源的全面共享,无须依赖集中式服务器的支持,实际应用非常广泛。在P2P系统中,系统中性能较高的节点称为超级节点,除了可以共享资源和访问系统中其他资源之外,还负责转发资源路由消息及资源管理等工作;系统中其他节点称为普通节点,可以共享资源和访问系统中其他资源,接受超级节点的管理。
    在基于对等网络的分布式系统中,副本技术是提高数据可用性和系统访问性能的重要技术。通过提供多个数据资源副本,可以提高P2P系统的容错性、数据的可用性,减少数据访问延迟,同时消除热点瓶颈和实现负载均衡。P2P系统中所有共享的资源,包括文件、数据库、数据表等,都可抽象表示为逻辑资源,每个逻辑资源具有全局唯一的逻辑资源名(Logical Resource Name,LRN)。每个逻辑资源可以有一个或多个物理副本,简称为副本。为了实现副本管理的透明性,P2P系统需要引入副本服务对系统中的副本进行管理,为用户透明地提供副本创建、副本定位和副本选择等诸多功能,监控和管理副本信息,包括副本访问频率和副本响应时间等。
    目前,在P2P系统中已开展了很多副本管理方面的研究工作。集中式副本定位算法中没有明确的副本策略,不支持主动副本创建,仅当用户请求共享数据的时候,才将共享数据的副本放置在本地,由于单点失效和扩展性不好很难应用到大规模分布式系统中。在当前全分布的非结构化P2P中,副本创建策略主要有:拥有者备份策略、随机备份策略和按路径备份策略。拥有者备份策略将请求资源备份到成功定位该资源的节点上,然后该节点便可以作为服务提供者为其他节点提供数据服务,系统中数据副本的数量与该数据被访问的频率基本成正比;随机备份策略中,在资源定位成功时将数据副本按照一定的概率随机备份到路由经过的若干个节点上;按路径备份策略在资源定位成功时将请求资源备份到消息回播路径上的节点上。这些方法只考虑副本数量上的差异,而没有考虑副本存放位置的差异,且大量文件移动会消耗大量的网络带宽。
    总之,在副本创建和副本管理方面已有了很多的研究成果,但仍存在一些缺陷与不足。现有P2P系统通常假定共享的数据是静态的和只读的,因此副本技术相对简单,很少考虑副本更新问题,在资源搜索过程中动态地、盲目地、后发性地进行副本创建,单纯追求副本数量提高资源搜索的性能。如果不考虑副本更新和一致性维护的代价,副本数量越多的确能够提高资源访问效率。但是,对于拥有可写数据资源的P2P应用来讲,采用这样的副本创建方法将会带来高昂的副本一致性维护代价,而当前研究很少考虑这个问题。此外,现有多数方法是从单个节点的局部信息出发、在特定评价标准下制定副本创建策略,扩展性比较差,不能保证全局最优。
    随着P2P的新型应用如P2P游戏、分布式数据共享、远程协作等应用的出现,共享数据资源将更多的以可读写形式存在。如何平衡副本一致性维护的开销和多副本带来的访问性能提升之间的关系,设计适用于拥有可读写数据资源的P2P系统的副本创建方法具有重要的应用意义。
    发明内容
    本发明的目的是为了针对可读写数据资源的副本创建、从全局角度利用较少的副本数目降低资源访问时间,提出一种对等网络环境下副本服务的部署及副本创建方法。
    本发明的目的是通过下述技术方案实现的。
    本发明包括两部分:副本服务的部署和副本创建方法。通过本发明设计的副本服务的部署方法,可以在整个系统范围内实现副本的全局管理。本发明设计的副本创建方法,充分考虑了广域网范围内带宽对访问代价的影响,从系统全局的副本分布出发实现优化的副本创建。
    一.副本服务的部署
    由于面向不同应用领域的P2P系统对副本管理服务的要求各不相同,因此,本发明着重给出一种通用的副本服务的部署方法,目的是实现副本的全局管理。副本服务的部署方法包含四个部分:
    (1)确定系统中所有节点间的父子关系。
    父子关系确定的原则如下:
    ①只有超级节点可以做父节点;
    ②每个普通节点可以同时与多个超级节点相连,但只能选择其中一个超级节点作为其父节点;
    ③每个超级节点可以同时与多个超级节点相连,但只能选择其中一个超级节点作为其父节点,也可以不选择父节点。没有父节点的超级节点称为域超级节点;
    ④整个系统中所有超级节点之间的父子关系不能形成回路。
    域超级节点和它的所有子节点形成的节点集合称为域。在广域网范围内确定域超级节点比较费时,可以采取指定或自荐的方法确定域超级节点。
    这里,我们并没有改变P2P系统的网络结构,只是定义了父子关系,目的是指导副本服务的部署,以及明确各类节点在副本管理服务中承担的职责。
    (2)系统中每个节点都维护一个本地副本目录(Local Replica Catalog,LRC)。本地副本目录保存着本地共享资源的副本信息。超级节点的本地副本目录除了保存本地共享资源的副本信息之外,还包括所有子节点的副本目录信息。
    (3)副本服务部署在超级节点上,保存和维护本地副本目录信息,响应与副本管理有关的服务请求。超级节点负责本地共享资源和子节点中普通节点的共享资源的副本管理工作。
    由于普通节点只能有一个父节点,所以每个超级节点负责管理的共享资源之间没有交集,不会出现同一资源的副本由多个超级节点管理的情况。
    副本服务记录每次数据资源的成功访问情况记录到对应的副本目录中,包括哪个节点发起的请求、访问了哪个副本、资源响应时间,以及实时网络带宽等信息。超级节点周期性的根据副本目录信息统计资源访问频率和平均响应时间。这些数据将为副本创建提供充足的依据。
    二.副本创建方法
    超级节点P管理的所有逻辑资源记做LR0,LR1,...,LRn(n是P负责管理的逻辑资源的个数),这些逻辑资源的所有副本信息保存在节点P的本地副本目录中。超级节点P周期性的执行以下操作,实现副本的动态创建:
    步骤1.通过计算逻辑资源的访问频率确定热点资源
    首先,我们给出访问频率的定义:在单位时间间隔t内,访问逻辑资源LRj所有副本的总次数与逻辑资源LRj的副本数量的比,称为逻辑资源LRj的访问频率(Access Frequency,AF)。
    超级节点P计算逻辑资源LRj(0≤j<n)的访问频率,如果逻辑资源LRj的访问频率AFj大于预先给定的阈值ωf,那么,逻辑资源LRj就是热点资源。
    这里,用访问所有副本的总次数与副本数量之比计算访问频率,强调了副本的平均利用情况。如果某个逻辑资源的访问次数很高,但是其副本数量也很多,那么就不是热点资源,不需要对它创建副本。只有对热点资源创建副本才能有效的减少访问延迟、提高系统整体性能。
    步骤2.对于每个热点资源,通过计算平均响应时间确定需要创建副本的逻辑资源
    对于每个热点资源LRj,计算它们的平均响应时间,即单位时间间隔t内,逻辑资源LRj所有副本的总的响应时间与访问次数之比。如果热点资源LRj的平均响应时间ARTj大于预先给定的阈值ωRT,那么,副本创建服务需要对逻辑资源LRj创建副本。
    这里,我们同时使用两个评判指标(访问频率高和平均响应时间长)判断需要创建副本的逻辑资源,而不是单一使用访问频率或者平均响应时间。理由是:平均响应时间取决与很多因素,包括带宽、节点性能等,也包括数据资源的大小。尺寸越大的逻辑资源,平均响应时间也一定大,但这并不说明该资源的副本数量不够,所以,单纯用平均响应时间作为需要创建副本的依据是不合适的。另一方面,对于尺寸小的逻辑资源,如果平均响应时间并不大,那么,即使访问频率很高,也没有必要创建副本。所以,对访问频率高并且平均响应时间长的资源进行副本创建是合理的。
    步骤3.对于每一个需要创建副本的资源LRj,确定需要创建副本的域
    域超级节点管理的域记作Dk,k=0,1,...,m(m是系统内域超级节点的个数)。节点P统计单位时间间隔内对逻辑资源LRj的所有访问请求。由于超级节点P拥有逻辑资源LRj的所有副本信息,因此可以记录所有副本的访问情况,包括何时、从哪个域内的哪个节点发出访问请求,访问了哪个副本,副本响应时间等。根据历史信息,将单位时间间隔内所有请求逻辑资源LRj的节点按照不同的域进行划分,统计每个域Dk内节点访问逻辑资源LRj的平均响应时间。
    如果域Dk内的节点访问资源LRj的平均响应时间大于逻辑资源LRj的平均响应时间,则说明该域内的副本数量过少,需要在域Dk内创建副本。
    步骤4.在需要创建副本的域内确定副本创建的地点
    为了增加逻辑资源的可用性,需要在副本数量过少的域Dk内创建新的副本。数据访问的性能与副本的数量和位置相关。副本创建位置的选择是创建策略中另一个比较关键的问题,将副本创建在哪里才能最大程度降低数据的访问频率,是影响副本创建效果的主要因素。放置副本的节点首先要没有该逻辑资源;其次是,要能够保证副本放置在这里能够在全系统范围内降低该资源的访问延迟。
    因为节点P并不拥有域Dk内所有节点的相关信息,所以确定域Dk内副本放置地点的任务将交由域Dk的域超级节点确定。节点P向域Dk的域超级节点发送请求消息。域Dk的域超级节点接受请求后,根据域内节点实时信息确定适合放置副本的位置后将结果返回给节点P。
    步骤5.需要创建副本的节点选择访问代价最小的副本复制到本地
    确定适合放置副本的节点集合PEER后,需要确定将哪个物理副本的内容复制到指定的节点上。如果该逻辑资源的所有副本内容是不一致的,选择版本最新的副本进行复制。如果该逻辑资源的所有副本的内容是一致的,则可以在全部副本中选择访问代价最小的副本进行复制,最大程度减小副本传输的代价。
    引入记号:对于给定的逻辑资源LRj,所有副本记做Ri,i=1,2,...,h(h是逻辑资源LRj的副本数量),副本所在的节点对应记做Pi。任意节点Pr和Pi之间的网络带宽记做BWri。节点Pi上等待处理的任务数记做JobLength i。逻辑资源LRj的物理大小记做filesize。那么,节点Pr访问副本Ri的预期访问代价定义为Costri,计算方法如下式:
    Costri=filesize×JobLengthiBWri---(1)]]>
    对于节点Pr∈PEER,如果则选择将节点Ps上的副本复制到节点Pr上。
    以上副本创建的过程由每个超级节点上的副本服务周期性的执行,一旦发现有访问频率过大并且响应时间过长的逻辑资源,副本服务自动进行副本创建工作。
    有益效果:
    本发明具有如下优点:
    (1)通用的副本服务的部署方法适用与所有基于超级节点的P2P系统;
    (2)依据本发明给出的副本服务的部署方法可以构建P2P系统的副本管理体系架构,能够实现副本的全局管理;
    (3)本发明给出的副本创建方法具有动态性和自适应性。副本创建方法通过监控资源访问的情况,根据访问请求的变化和网络的实时通讯状况自动执行副本创建;
    (4)本发明给出的副本创建方法简单,多数操作在超级节点本地就可以完成,很少占用广域网带宽;
    (5)模拟实验和评估显示,本发明给出的副本创建方法能够在资源访问性能提升和副本数量之间获得好的平衡,降低资源平均响应时间。
    附图说明
    图1显示了系统中所有节点在父子关系下形成了树状结构;
    图2是本发明的副本服务的体系架构;
    图3是超级节点的网络结构示例;
    图4是确定父子关系之后的网络结构;
    图5是副本创建方法的基本流程;
    图6是不同副本创建方法下资源平均响应时间的模拟实验结果;
    图7是不同副本创建方法产生的副本数目的模拟实验结果。
    具体实施方式
    为了更好地说明本发明的目的和优点,以下结合实施例和附图对本发明做进一步说明。
    1.副本服务的部署方法
    图1显示了一个任意的超级节点的网络结构,所有节点之间以全分布式方式连接。
    首先,系统中所有节点确定自身的父节点。每个普通节点选择一个与其相连的超级节点作为自己的父节点,并与父节点交换确认信息;超级节点选择一个与其相连的超级节点作为父节点,并与父节点交换确认信息。超级节点也可以不选择任何节点作为自己的父节点。
    确定父子关系之后的网络结构如图2所示,粗线条表示了节点之间父子关系,箭头所指为子节点。系统中所有节点在父子关系下形成了树状结构。超级节点A1管理自身和子节点A11和A12上的共享资源。超级节点A的副本目录除了保存本地共享资源的副本信息外,还保存所有子节点A11和A12的副本目录信息。超级节点B管理自身和子节点B1、B2(B1和B2均为普通节点)上的共享资源,并且超级节点B的副本目录中除了保存本地共享资源的副本信息外,还保存所有子节点B1、B2和B3的副本目录信息。
    图2中节点A和节点B是域超级节点,每个域超级节点和它所有子节点集合形成了各自的域,如图2中的虚线所示。由于节点之间明确的父子关系,所以域超级节点管理的域之间没有交集。
    副本管理服务部署在超级节点上,负责自身和自己管理的普通节点的共享资源的副本创建工作,保存和维护本地副本目录信息,承担响应与副本有关的其它服务请求。依据上述方法部署副本服务后得到副本服务的体系架构如图3所示。图3中显示了两个域:域A和域B。域A中有三个超级节点,分别是A1、A2和A3,其中超级节点A1管理的普通节点有节点A11、节点A12和节点A13。由于篇幅限制,图3仅显示了超级节点A1管理的普通节点,而忽略了其他超级节点管理的普通节点。副本服务部署在超级节点上,实线表示数据交换,虚线表示服务的调用。
    2.副本创建算法流程
    副本创建方法的基本流程如图4所示。超级节点P实时监控自己管理的所有逻辑资源,周期性地、独立地执行下述步骤:
    步骤(1)超级节点P计算逻辑资源LRj(0≤j<n)的访问频率,如果逻辑资源LRj的访问频率AFj大于预先给定的阈值ωf,那么,逻辑资源LRj就是热点资源。热点资源表示该逻辑资源的单位副本在过去的一段时间内被频繁访问,有可能需要创建副本。
    步骤(2)对于每个热点资源,计算它们的平均响应时间。如果热点资源LRj的平均响应时间大于预先给定的阈值,那么,副本创建服务需要对逻辑资源LRj创建副本。
    根据步骤(1)和步骤(2),可以确定所有需要创建副本的逻辑资源,用集合R表示。
    步骤(3)对于每一个需要创建副本的资源LRj∈R,节点P统计单位时间间隔内对逻辑资源LRj的所有访问请求。如果域Dk内节点访问资源LRj的平均响应时间大于逻辑资源LRj的平均响应时间,则需要在域Dk内创建副本。
    确定需要创建LRj副本的所有的域,用集合D表示。
    步骤(4)对于每一个域Dk∈D,确定副本创建的地点。因为节点P并不拥有域Dk内所有节点的相关信息,所以确定域Dk内副本放置地点的任务交由域Dk的域超级节点完成。域Dk的域超级节点根据域内节点信息确定适合放置副本的位置。
    步骤(5)适合放置副本的节点集合记做PEER,对于节点Pr∈PEER,如果则选择将节点Ps上的副本复制到节点Pr上。
    我们在模拟工具OptorSim上模拟实现了本发明给出的副本创建方法(MAC-Replication),并与基于缓存的副本创建策略(LRU)和基于经济模型(ECO)的副本创建策略进行了性能比较。LRU方法采用缓存技术,尽可能多的将访问资源复制到本地,若节点没有足够空间就删除最早创建的副本。ECO采用基于经济模型的复制策略,通过经济模型评估创建副本的价值。在三种副本创建策略下资源的平均响应时间的模拟实验结果如图5所示,三种方法产生的副本数目的变化如图6所示。
    LRU方法是通过在本地大量创建资源副本、避免异地访问为主要手段降低资源响应时间的,因此,LRU方法的资源平均访问时间很小。同时LRU方法中副本数目也是持续增长的。MAC-Replication方法针对副本缺少的程度、根据资源的平均响应时间动态计算所需副本的数目,而不是一味追求副本数目降低资源访问时间,所以MAC-Replication方法用不到LRU方法10%的副本数目,就获得了与LRU方法相当的资源平均访问时间,说明MAC-Replication方法在性能提升和副本数量之间能够获得好的平衡。

    关 键  词:
    对等 网络 环境 副本 服务 部署 创建 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:对等网络环境下副本服务的部署及副本创建方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1081664.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1