书签 分享 收藏 举报 版权申诉 / 10

通信系统.pdf

  • 上传人:奻奴
  • 文档编号:1132030
  • 上传时间:2018-04-01
  • 格式:PDF
  • 页数:10
  • 大小:456.94KB
  • 摘要
    申请专利号:

    CN01812495.X

    申请日:

    2001.05.01

    公开号:

    CN1440606A

    公开日:

    2003.09.03

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    专利申请权、专利权的转移(专利权的转移)变更项目:专利权人变更前权利人:马科尼英国知识产权有限公司 地址: 英国考文垂变更后权利人:M(DGP1)有限公司 地址: 英国考文垂登记生效日:2007.2.9|||专利申请权、专利权的转移(专利权的转移)变更项目:专利权人变更前权利人:M(DGP1)有限公司 地址: 英国考文垂变更后权利人:爱立信股份有限公司 地址: 瑞典斯德哥尔摩登记生效日:2007.2.9|||授权|||专利申请权、专利权的转移(专利申请权的转移)变更项目:申请人变更前权利人:马科尼通讯有限公司变更后权利人:马科尼英国知识产权有限公司变更项目:地址变更前:英国考文垂变更后:英国考文垂登记生效日:2003.10.29|||实质审查的生效|||公开

    IPC分类号:

    H04L12/24

    主分类号:

    H04L12/24

    申请人:

    马科尼通讯有限公司;

    发明人:

    S·C·弗雷

    地址:

    英国考文垂

    优先权:

    2000.05.09 GB 0011021.3

    专利代理机构:

    中国专利代理(香港)有限公司

    代理人:

    程天正;张志醒

    PDF完整版下载: PDF下载
    内容摘要

    一种通信系统,其中一个第一节点与多个个第二节点连接,用于控制该第二节点的操作;其中所述的多个第二节点被布置在一个或多个逻辑的相互连接中,所述的一个或多个逻辑的相互连接的拓扑结构与节点的物理的相互连接的拓扑结构不同,而且其中每个第二节点包括向它的逻辑后继者第二节点发送状态消息的装置,以及监测从它的逻辑前站第二节点接收的状态消息用以确定其状态的装置。

    权利要求书

    1: 一种包括一个第一节点和多个第二节点的通信系统;其中该第 一节点与所述的多个第二节点连接,用于控制该第二节点的操作;其中 所述的多个第二节点被物理地相互连接; 其中所述的多个第二节点被布置在一个或多个逻辑的相互连接 中;其中所述的一个或多个逻辑的相互连接的拓扑结构与物理的相互连 接的拓扑结构不同; 其中每个第二节点包括向它的逻辑后继者第二节点发送状态消息 的装置,以及监测从它的逻辑前站第二节点接收的状态消息用以确定其 状态的装置。
    2: 如权利要求1的系统,其中每个第二节点包括以预设的时间间 隔向它的逻辑后继者节点发送状态消息的装置。
    3: 如权利要求1的系统,其中每个第二节点包括向它的逻辑前站 第二节点定期发送一个控制消息用以向其请求状态消息的装置,以及用 于检测来自它的逻辑后继者节点的控制消息的接收、并响应这个或每个 检测到的所接收控制消息向它的逻辑后继者节点发送一个状态消息的 装置。
    4: 如上述任一权利要求的系统,其中每个第二节点包括用于监测 这个或每个接收的状态消息、并当在预设的时段内没有从该逻辑前站节 点接收到预设数目的有效状态消息时识别错误状态的装置。
    5: 如上述任一权利要求的系统,其中每个第二节点包括应用数据 和以应用消息的形式与它的逻辑后继者节点交换应用数据的装置,其中 所述应用消息中的至少一些用作状态消息,用于上述任一权利要求的目 的。
    6: 如从属于权利要求3的上述任一权利要求的系统,其中每个第 二节点包括应用数据和以应用消息的形式与它的逻辑前站第二节点交 换应用数据的装置,其中所述应用消息中的至少一些用作控制消息,用 于权利要求3的目的。
    7: 如上述任一权利要求的系统,其中每个第二节点包括将该第二 节点的逻辑前站节点的状态通知第一节点的装置。
    8: 如上述任一权利要求的系统,其中至少一个逻辑的相互连接包 括所述的第一节点。
    9: 如上述任一权利要求的系统,其中所述的一个或多个逻辑的相 互连接包括一个或多个逻辑环。
    10: 如上述任一权利要求的系统,其中所述系统包括一种互联网协 议(IP)网络。

    说明书


    通信系统

        本发明涉及通信系统(包括分布式计算系统)领域,尤其涉及处理这种通信系统中节点(或计算机)的故障的系统。

        在分布式计算系统中,多个相互连接的计算机每一台运行应用程序的一部分。整个应用程序由一个在多个相互连接的计算机上同时运行的分布式软件系统来实现。这些计算机构成由通信系统相互连接的节点(例如象互联网协议(IP)网络中的主机)。在有弹性的分布式系统中,应用程序可以容忍组成的计算机中一台或几台发生故障,并通过以另一台计算机(例如一台完全未用过的备用计算机或有闲置容量的正在使用的计算机)替代且用适当的编码和数据装载该计算机使它能够取代故障的计算机在分布式计算中的角色而恢复。因此有弹性的分布式计算系统的配置容易改变,并由一个管理系统控制。

        管理系统(一般位于另一台计算机上)负责监控运行该分布式应用程序地计算机的操作,并负责监控分布式应用程序本身的运行。因此管理系统将涉及到向运行该分布式应用程序的计算机集合中引入任何新的计算机(例如为了增加总体的处理容量),以及在必要时从该集合中退出计算机(例如为了硬件升级或更换)。管理系统也涉及对分布式应用程序的配置,可以控制将哪台计算机指配给特定的处理任务以及如何在计算机集合中分布该处理负荷。当这种计算机集合中的一台计算机发生故障时,管理系统就必须注意到该故障,并重新配置计算机和该分布式应用程序以考虑这个问题。

        因此,有必要有效地检测在这种分布式系统中的计算机的故障。这个问题的一个可能的解决方案是管理系统通过向每一台应用计算机发送一个网间控制报文协议(ICMP)回应请求消息来定期ping它们(使它们被强制回应)。ICMP用于报告消息传递中的错误、重定向业务等。ICMP回应请求消息(通常被称作“ping”)请求接收的计算机立即用一个ICMP回应回复消息(“ping回复”)来回复。这被用来确定远方计算机的工作是否是正确的以及是否有一条可用的网络路径到这种远方的计算机(即该计算机是否可接入一条可用的路径以便到达它需要到达的任何其他的计算机)。具有运行的IP接口的计算机被请求用ICMP回应回复消息来回复这些消息。这在操作系统中是以低水平发生的,以及它是通常用于确定计算机是否工作的方法。1989年10月的InternetEngineering Task Force(互联网工程任务组)出版物RFC1122“HostRequirements(主机要求)”叙述了ICMP的操作(见第3.2.2.6章节,第42-43页)。

        通过频繁地发送这些消息(例如一次多于一秒钟),管理系统检验每一台应用计算机的功能。如果不能及时地接收到回复就表明一台计算机可能已经发生故障。但是,由于消息在网络中会丢失,所以这并不完全可靠。如果几个回复都未能到达,那么可以更有信心地推测该计算机故障,但是网络故障是另一种可能性且应该被作为恢复过程的一部分来进行探测。如果回复能从与被推测为故障的计算机相邻的计算机接收到,那么有理由认为故障就在该怀疑的计算机上,而如果不能从多个相邻计算机接收到回复,那么有理由认为该网络本身发生故障。

        一个可选择的解决方案是应用计算机自己定期给管理系统发送一个消息(不必是ICMP消息)声明它们仍旧是活着的,而不是管理系统对应用计算机进行“ping”(使用ICMP回应请求消息)。同样,几个这种预期消息的缺少将是应用计算机发生故障的一种指示。

        遗憾的是,上述的两种解决方案遇到同样的问题:即虽然在每台应用计算机上的负荷很小,但管理系统将承担很高的负荷,因为它必须与每一台应用计算机(可能有大量的计算机)交换网络通信业务。这种通信业务会降低管理系统执行其它任务的能力,并可能是制约整个系统大小或使得故障恢复所花费的时间比所期望的要长的关键因素。

        本发明提供了一种包括一个第一节点和多个第二节点的通信系统;其中该第一节点与所述的多个第二节点连接,用于控制该第二节点的操作;其中所述的多个第二节点被物理地相互连接;其中所述的多个第二节点被布置在一个或多个逻辑的相互连接中;其中所述的一个或多个逻辑的相互连接的拓扑结构与该物理的相互连接的拓扑结构不同;其中每个第二节点包括向它的逻辑后继者第二节点发送状态消息的装置,以及监测从它的逻辑前站第二节点接收的状态消息用以确定其状态的装置。

        根据一种优选的实施方案,本发明提供了一种系统,其中每个第二节点包括向它的逻辑前站第二节点定期发送一个控制消息用于向其请求状态消息的装置,包括用于检测来自它的逻辑后继者节点的控制消息的接收、并响应这个或每个检测到的已接收控制消息向它的逻辑后继者节点发送一个状态消息的装置。

        本发明的实施方案将使用例子参考附图来说明,其中:

        图1显示一种根据现有技术的分布式计算系统;

        图2显示一种根据本发明在逻辑环中布置的分布式计算系统;

        图3显示一种根据本发明的双向逻辑环。

        图1显示一个IP网络,其中一个管理系统(即在管理计算机上运行的一个软件系统)在管理节点1上,并通过IP网络3与多个应用计算机连接,各个应用计算机分别在多个第二节点2中不同的一个节点中提供。IP网络包括例如以星形、树形、总线或网形或者在例如无线电网络情形中以无定形的方式布置的连接媒体(例如铜线、光纤或无线电)。实际上IP网络一般是这些媒体布置的一些或全部结合在一起的组合。

        图2显示一种具有与图1的系统一样的物理拓扑结构的分布式计算系统。然而,第二节点2现在布置成如箭头4所示的逻辑环。箭头4指示状态消息沿逻辑环的流动方向。

        在图2中,计算机的物理布置和连接性与图1相比并未改动。然而,在第二节点2中的每一台应用计算机现在使用由管理系统配置的软件进行修改,这样每一台应用计算机都知道它的逻辑后继者(即在沿逻辑环的线路上按箭头4的方向的下一台计算机)和它的逻辑前站(即在沿逻辑环的线路上相反方向的下一台计算机),所述应用计算机需要向它的逻辑后继者发送状态消息,而期望从它的逻辑前站接收状态消息。应该注意,该逻辑环拓扑结构(即计算机之间的逻辑连接的布置)不同于物理拓扑结构(即计算机之间的物理连接的布置)。

        根据图2的实施方案,现在每一台应用计算机向逻辑环中它的逻辑前站定期发送一个ICMP回应请求消息,并等候来自逻辑前站的ICMP回应回复消息。该回复将在回应请求消息流的相反方向上沿该逻辑环传递。如果在预设的时间段内接收到有效的回复,那么一切都是好的。否则,发送ICMP回应请求消息的计算机将告知管理系统(使用适当的协议)它的前站节点似乎发生故障。用于此的一种适当的协议是例如Internet Engineering Task Force(互联网任务工程组)在1990年5月的RFC1155“Structure of Management Information(SMI)(管理信息的结构SMI)”和1990年5月的RFC1157“Simple NetworkManagement Protocol(SNMP)(简单网络管理协议SNMP)”中发布的简单网络管理协议(SNMP)-特别是该协议的“陷阱(Trap)”操作,它被接受管理的计算机用来引起管理系统的注意,并可选择地向管理系统传递一些感兴趣的数据。这样每一台应用计算机作为另一台特定的应用计算机的监视者,虽然一台计算机不能产生一个向管理系统告警自己的故障的消息,但是它的功能仍正常的监视者可以产生这种消息。管理系统还执行“注册”协议(一般使用SNMP),由此它通知新启动的主计算机它们在环上的位置,以及调整在环上的原有主机的前站-后继者关系,两个功能都用于方便新主机的进入和允许原有主机在控制之下退出(例如为了硬件升级或更换),这个过程与在这些主计算机上的分布式应用程序的启动和关闭紧密同步。

        有利的是,本发明避免了向管理系统例行发送定期的监测消息。实际上,当所有的节点都工作时(几乎所有时候都是这样的)管理系统上没有额外的负荷。这样,一台廉价的、性能较低的计算机就可以很好地适应这个管理角色。

        根据本发明的网络总体上传输与前一种解决方案一样多的消息。但是,实际上一个网络将包括多个“本地”子网,在这种情况下,沿虚拟环的通信业务将主要包括始发和终接都在同一子网中的通信业务,并在这些子网之间均匀地分布。结果在网络中加载的通信业务得到很大的改进。因此,由于通信系统中的IP网络和它们所支持的下层网络的结构,所以根据本发明的大多数请求消息和相应的回复一般仅限制在整个IP网络的一部分中,因而在计算机上或在IP网络的其它部分的网络基础结构上施加少许负担或不增负担(不象在前一种解决方案中来自每个应用计算机的故障检测通信业务都必须汇聚到一个单点即管理系统上)。

        所以,整个系统是可缩放的。而前一种解决方案在管理系统中有一个性能瓶颈,这意味着当达到瓶颈的容量时,整个系统就不能再扩大,而在根据本发明的系统中,每台计算机只有一个很小的与故障检测有关的负荷,而由于每台计算机的负荷不随应用计算机数目的增加而增加,所以在系统的大小上没有这种限制。

        根据本发明的一种进一步的实施方案,如图3所示,逻辑环以如箭头4、5所指示的双向方式运行。根据图3的实施方案,每一台应用计算机给环中它的逻辑后继者和逻辑前站定期发送一个ICMP回应请求消息,并等候来自逻辑后继者和逻辑前站的ICMP回应回复消息。该回复将在与相应的回应请求消息相反的方向中沿逻辑环传递。如在图3中可见,逻辑上与一个节点相邻(沿逻辑环)的两个另外的节点将监测该节点并检测它是否发生故障。如果检测到一个节点的故障,那么逻辑上相邻的节点就独立地通知管理系统。因此这种实施方案具有提高可靠性的优点,因为管理系统将更容易区别是实际的节点故障或仅仅是消息丢失。

        根据一种进一步的实施方案,对同一个节点进行检查的两个另外节点之间的通信将允许在通知管理系统之前更有信心地确定该节点的状态。

        根据一种进一步的实施方案,每个第二节点包含应用数据,而应用消息用于在节点之间传递该应用数据,作为一种在分布式系统的一部分发生故障时保护数据不被丢失的方式。根据这种实施方案,使用应用消息而不是ICMP来请求一个来自目的节点的响应,而且通常由目的节点使用逻辑环结构来确认。如果在一定的时间间隔中没有数据需要交换(即如果没有状态的变化),那么就发送空的应用消息或常规的回应请求消息。

        作为发送一个请求消息并等候一个有效回复的替代,每个节点可以同上面一样按常规向它的逻辑后继者仅仅发送状态消息,并监测从它的逻辑前站接收的状态消息。

        所述状态消息可以包含与发出节点的状态有关的信息,或者可替代地,仅仅状态消息的到达便可以用作发出节点状态的指示。

        逻辑环的结构,特别是第二节点沿逻辑环布置的顺序,不受这些节点物理上的布置和相互连接的任何限制。

        根据本发明的一种进一步的实施方案,所述的多个第二节点在逻辑的相互连接中可以以环状之外的其它形式布置,即采用某种网形或其它的布置形式。每个第二节点的逻辑后继者和逻辑前站的标识可以如在建立该逻辑相互连接时所指配的。该逻辑的相互连接的拓扑结构(即计算机之间逻辑连接的布置)不同于物理的拓扑结构。

    关 键  词:
    通信 系统
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:通信系统.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1132030.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1