书签 分享 收藏 举报 版权申诉 / 12

通信异常处理方法及网元设备.pdf

  • 上传人:Y0****01
  • 文档编号:1682894
  • 上传时间:2018-07-04
  • 格式:PDF
  • 页数:12
  • 大小:679.43KB
  • 摘要
    申请专利号:

    CN201410345157.8

    申请日:

    2014.07.18

    公开号:

    CN104836679A

    公开日:

    2015.08.12

    当前法律状态:

    实审

    有效性:

    审中

    法律详情:

    实质审查的生效IPC(主分类):H04L 12/24申请日:20140718|||公开

    IPC分类号:

    H04L12/24

    主分类号:

    H04L12/24

    申请人:

    中兴通讯股份有限公司

    发明人:

    赵东林; 吴展

    地址:

    518057广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦法务部

    优先权:

    专利代理机构:

    深圳市世纪恒程知识产权代理事务所44287

    代理人:

    胡海国

    PDF完整版下载: PDF下载
    内容摘要

    本发明公开了一种通信异常处理方法,应用于分布式系统的网元设备中,所述通信异常处理方法包括以下步骤:对所述网元设备中的线卡及主控板与所述网元设备中的其他通信节点的通信状态进行检测;当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理。本发明还公开了一种网元设备。本发明能够提高网元设备通信的容错性、可靠性及可用性。

    权利要求书

    权利要求书1.  一种通信异常处理方法,应用于分布式系统的网元设备中,其特征在于,所述通信异常处理方法包括以下步骤:对所述网元设备中的线卡及主控板与所述网元设备中的其他通信节点的通信状态进行检测;当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理。2.  如权利要求1所述的通信异常处理方法,其特征在于,所述当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理的步骤包括:当在预定的第一时间段内检测到所述主控板与一线卡通信异常时,对所述主控板与所述线卡发生通信异常的第一异常计数进行累加处理;当在预定的第二时间段内检测到所述线卡与所述主控板或者其他线卡通信异常时,对所述线卡与主控板或者其他线卡发生通信异常的第二异常计数进行累加处理;当在预定的第三时间段内检测到所述主控板与所有的线卡通信异常时,对所述主控板与所有线卡发生通信异常的孤岛异常计数进行累加处理。3.  如权利要求2所述的通信异常处理方法,其特征在于,所述当异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理的步骤包括:当所述第一异常计数达到预设的第一阈值时,将所述主控板向线卡发送重启命令;当所述第二异常计数达到预设的第二阈值时,记录所述线卡通信异常的信息,上传所述信息至所述主控板并将所述线卡主动重启;当所述孤岛异常计数达到预设的孤岛阈值时,将所述主控板主动重启。4.  如权利要求2所述的通信异常处理方法,其特征在于,所述第一时间段大于所述第二时间段,且所述第二时间段大于所述第三时间段。5.  如权利要求1至4任一项所述的通信异常处理方法,其特征在于,所述通信异常处理方法还包括:当通信正常时,对所述异常计数清零。6.  一种网元设备,其特征在于,所述网元设备包括:检测模块,用于对所述网元设备中的线卡及主控板与所述网元设备中的其他通信节点的通信状态进行检测;累加模块,用于当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;处理模块,用于当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理。7.  如权利要求6所述的网元设备,其特征在于,所述累加模块包括:第一累加单元,用于当在预定的第一时间段内检测到所述主控板与一线卡通信异常时,对所述主控板与所述线卡发生通信异常的第一异常计数进行累加处理;第二累加单元,用于当在预定的第二时间段内检测到所述线卡与所述主控板或者其他线卡通信异常时,对所述线卡与主控板或者其他线卡发生通信异常的第二异常计数进行累加处理;第三累加单元,用于当在预定的第三时间段内检测到所述主控板与所有的线卡通信异常时,对所述主控板与所有线卡发生通信异常的孤岛异常计数进行累加处理。8.  如权利要求7所述的网元设备,其特征在于,所述处理模块包括:第一处理单元,用于当所述第一异常计数达到预设的第一阈值时,将所述主控板向线卡发送重启命令;第二处理单元,用于当所述第二异常计数达到预设的第二阈值时,记录所述线卡通信异常的信息,上传所述信息至所述主控板并将所述线卡主动重启;第三处理单元,用于当所述孤岛异常计数达到预设的孤岛阈值时,将所述主控板主动重启。9.  如权利要求7所述的网元设备,其特征在于,所述第一时间段大于所述第二时间段,且所述第二时间段大于所述第三时间段。10.  如权利要求6至9任一项所述的网元设备,其特征在于,所述网元设备还包括:清零模块,用于当通信正常时,对所述异常计数清零。

    说明书

    说明书通信异常处理方法及网元设备
    技术领域
    本发明涉及分布式通信技术领域,尤其涉及一种通信异常处理方法及网元设备。
    背景技术
    在分布式系统中,网元设备是由一个或多个机盘或机框组成的、能够独立完成一定的传输功能的组合。网元由主控板和线卡组成,主控板负责管理线卡。在网元设备中,主控板是负责控制、管理和配置的单板。有些网元设备只存在一个主控板,有些网元设备中存在两个主控板,一个为主用主控板,一个是备用主控板,备用主控板作为主用主控板的备份。线卡是负责系统中的报文的交换,转发和处理的单板。
    由于分布式系统通信的复杂性,经常会出现主控板或者线卡通信异常,导致线卡与主控板之间的通信中断,此时如果不及时恢复通信,将会进一步导致主控板无法管理其他单板,主控板和其他单板之间无法同步数据等一系列相关故障。
    上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
    发明内容
    本发明的主要目的在于解决网元设备中的主控板和线卡通信发生异常不能及时处理的技术问题。
    为实现上述目的,本发明提供一种通信异常处理方法,应用于分布式系统的网元设备中,所述通信异常处理方法包括以下步骤:
    对所述网元设备中的线卡及主控板与所述网元设备中的其他通信节点的通信状态进行检测;
    当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;
    当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处 理。
    优选地,所述当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理的步骤包括:
    当在预定的第一时间段内检测到所述主控板与一线卡通信异常时,对所述主控板与所述线卡发生通信异常的第一异常计数进行累加处理;
    当在预定的第二时间段内检测到所述线卡与所述主控板或者其他线卡通信异常时,对所述线卡与主控板或者其他线卡发生通信异常的第二异常计数进行累加处理;
    当在预定的第三时间段内检测到所述主控板与所有的线卡通信异常时,对所述主控板与所有线卡发生通信异常的孤岛异常计数进行累加处理。
    优选地,所述当异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理的步骤包括:
    当所述第一异常计数达到预设的第一阈值时,将所述主控板向线卡发送重启命令;
    当所述第二异常计数达到预设的第二阈值时,记录所述线卡通信异常的信息,上传所述信息至所述主控板并将所述线卡主动重启;
    当所述孤岛异常计数达到预设的孤岛阈值时,将所述主控板主动重启。
    优选地,
    所述第一时间段大于所述第二时间段,且所述第二时间段大于所述第三时间段。
    优选地,所述通信异常处理方法还包括:
    当通信正常时,对所述异常计数清零。
    此外,为实现上述目的,本发明进一步提供一种网元设备,所述网元设备包括:
    检测模块,用于对所述网元设备中的线卡及主控板与所述网元设备中的其他通信节点的通信状态进行检测;
    累加模块,用于当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;
    处理模块,用于当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理。
    优选地,所述累加模块包括:
    第一累加单元,用于当在预定的第一时间段内检测到所述主控板与一线卡通信异常时,对所述主控板与所述线卡发生通信异常的第一异常计数进行累加处理;
    第二累加单元,用于当在预定的第二时间段内检测到所述线卡与所述主控板或者其他线卡通信异常时,对所述线卡与主控板或者其他线卡发生通信异常的第二异常计数进行累加处理;
    第三累加单元,用于当在预定的第三时间段内检测到所述主控板与所有的线卡通信异常时,对所述主控板与所有线卡发生通信异常的孤岛异常计数进行累加处理。
    优选地,所述处理模块包括:
    第一处理单元,用于当所述第一异常计数达到预设的第一阈值时,将所述主控板向线卡发送重启命令;
    第二处理单元,用于当所述第二异常计数达到预设的第二阈值时,记录所述线卡通信异常的信息,上传所述信息至所述主控板并将所述线卡主动重启;
    第三处理单元,用于当所述孤岛异常计数达到预设的孤岛阈值时,将所述主控板主动重启。
    优选地,所述第一时间段大于所述第二时间段,且所述第二时间段大于所述第三时间段。
    优选地,所述网元设备还包括:
    清零模块,用于当通信正常时,对所述异常计数清零。
    本发明的一种通信异常处理方法及网元设备,可对分布式系统的网元设备中的线卡及主控板与该网元设备中的其他通信节点进行检测,在检测到发生通信异常时,对对应异常类型的异常计数进行累加处理,当异常计数达到预设的阈值时,认为所发生的通信异常影响到正常的通信,此时,可以通过重启线卡或者重启主控板的方式来处理该异常状况,以能够及时恢复正常通信,保证线卡与线卡之间、线卡与主控板或者主控板与线卡之间数据的正常传输,提高网元设备的容错性、可靠性及可用性。
    附图说明
    图1为本发明通信异常处理方法第一实施例的流程示意图;
    图2为本发明通信异常处理方法第二实施例的流程示意图;
    图3为本发明网元设备第一实施例的功能模块示意图;
    图4为本发明网元设备第二实施例的功能模块示意图。
    本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
    具体实施方式
    应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
    本发明提供一种通信异常处理方法,参照图1,在一实施例中,该通信异常处理方法包括:
    步骤S101,对所述网元设备中的线卡及主控板与所述网元设备中的其他通信节点的通信状态进行检测;
    本实施例中,网元设备中的线卡可以与其他线卡或者主控板进行通信,线卡主要完成转换功能;而主控板可以与线卡通信,实现对线卡的控制、管理或配置等功能。
    其中,本实施例的主控板为主用主控板。
    其中,在线卡物理在位时,其与其他通信节点可能可以进行正常的通信,也可能不可以进行正常的通信,对于线卡与其他通信节点的通信,本实施例定时地进行检测;另外,对于主控板与其他通信节点的通信,本实施例同样实时地进行检测。
    步骤S102,当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;
    在本实施例中,异常类型包括线卡与其他通信节点(包括其他线卡及主控板)的通信发生通信异常、主控板与一个线卡发生通信异常、以及主控板与所有线卡发生通信异常共三种。其中,主控板与所有线卡发生通信异常的情况也称为孤岛异常。
    在本实施例中,根据不同的异常类型设置不同的时间段进行检测,如预设一时间段,在该时间段内对于线卡与其他通信节点的通信进行检测,若在该时间段内检测到线卡与其他通信节点发生通信异常,对发生异常的异常计 数进行累加处理,即计算共发生该异常类型的通信异常的次数,如线卡与其他的某一线卡发生通信异常,在此之前该线卡的异常计数为3,则该线卡的异常计数在3的基础上加1。
    步骤S103,当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理。
    在本实施例中,对上述的线卡与其他通信节点的通信发生通信异常、主控板与一个线卡发生通信异常、以及主控板与所有线卡发生通信异常的三种异常类型分别预设不同的异常计数的最大值作为其阈值。若发生上述三种类型的通信异常情况,在对对应的异常类型的异常计数进行累加后,将异常计数与预设的阈值进行比较,以便对是否需要做出相应的处理进行判断。
    其中,异常计数的阈值根据实际情况进行预设,如:若不影响正常的通信或者保证数据能够正常传输的情况下,可以将阈值设置大一些。
    在本实施例中,在某一异常类型的通信异常的异常计数达到预设的阈值时,可以通过重启线卡或者重启主控板的方式来进行处理,以及时恢复正常通信,保证线卡与线卡之间、线卡与主控板或者主控板与线卡之间数据的正常传输。
    另外,在本实施例中,处理通信异常的方式可以通过命令行进行定制,如用户可以通过命令行设置线卡或者主控板的重启时间,设置网元设备打开或者关闭的时间等。
    与现有技术相比,本实施例可对分布式系统的网元设备中的线卡及主控板与该网元设备中的其他通信节点进行检测,在检测到发生通信异常时,对对应异常类型的异常计数进行累加处理,当异常计数达到预设的阈值时,认为所发生的通信异常影响到正常的通信,此时,可以通过重启线卡或者重启主控板的方式来处理该异常状况,以能够及时恢复正常通信,保证线卡与线卡之间、线卡与主控板或者主控板与线卡之间数据的正常传输,提高网元设备的容错性、可靠性及可用性。
    在一优选的实施例中,在上述图1的实施例的基础上,上述步骤S102包括以下子步骤:
    当在预定的第一时间段内检测到所述主控板与一线卡通信异常时,对所 述主控板与所述线卡发生通信异常的第一异常计数进行累加处理;
    当在预定的第二时间段内检测到所述线卡与所述主控板或者其他线卡通信异常时,对所述线卡与主控板或者其他线卡发生通信异常的第二异常计数进行累加处理;
    当在预定的第三时间段内检测到所述主控板与所有的线卡通信异常时,对所述主控板与所有线卡发生通信异常的孤岛异常计数进行累加处理。
    其中,检测主控板与线卡是否发生通信异常的时间段为第一时间段;检测线卡与主控板或者其他线卡是否发生通信异常的时间段为第二时间段;检测主控板与所有的线卡是否发生通信异常的时间段为第三时间段。
    本实施例中,由于线卡出现通信异常的概率要高于主板卡出现异常的概率,因此,设置第一时间段大于第二时间段,而又由于主控板发生孤岛异常的概率最小,因此,设置第二时间段大于第三时间段。
    在一优选的实施例中,在上述图1的实施例的基础上,上述步骤S103包括以下子步骤:
    当所述第一异常计数达到预设的第一阈值时,将所述主控板向线卡发送重启命令;
    当所述第二异常计数达到预设的第二阈值时,记录所述线卡通信异常的信息,上传所述信息至所述主控板并将所述线卡主动重启;
    当所述孤岛异常计数达到预设的孤岛阈值时,将所述主控板主动重启。
    本实施例中,若第一异常计数达到预设的第一阈值时,则认为影响到了正常通信,主控板向线卡发送重启命令,使线卡重启,同时记录重启的原因;若第二异常计数达到预设的第二阈值时,也认为影响到了正常通信,此时记录线卡通信异常的信息,上传信息至主控板,线卡主动重启;当孤岛异常计数达到预设的孤岛阈值时,也认为影响到了正常通信,主控板主动重启,同时记录重启的原因。
    值得说明的是,若主用主控板及备用主控板均影响到了正常通信,则令本网元设备重启。
    另外,在本实施例中,第一异常计数大于第二异常计数,且第二异常计数大于孤岛异常计数。
    在一优选的实施例中,如图2所示,在上述图1的实施例的基础上,本实施例在步骤S101之后包括:
    步骤S104,判断是否在预定的时间段内检测到通信异常,若是,则进入步骤S102,否则进入步骤S105;
    步骤S102,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;
    步骤S103,当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理
    步骤S105,不处理异常计数;
    步骤S106,当通信正常时,对异常计数清零。
    在本实施例中,步骤S101、步骤S102及步骤S103与图1的实施例相同。
    在本实施例中,若在预定的时间段内没有检测到通信异常时,不处理异常计数。当通信正常,此时对异常计数清零,对异常计数清零包括:对第一异常计数、第二异常计数及孤岛异常计数清零。
    本发明提供一种网元设备,参照图3,在一实施例中,该网元设备包括:
    检测模块101,用于对所述网元设备中的线卡及主控板与所述网元设备中的其他通信节点的通信状态进行检测;
    本实施例中,网元设备中的线卡可以与其他线卡或者主控板进行通信,线卡主要完成转换功能;而主控板可以与线卡通信,实现对线卡的控制、管理或配置等功能。
    其中,本实施例的主控板为主用主控板。
    其中,在线卡物理在位时,其与其他通信节点可能可以进行正常的通信,也可能不可以进行正常的通信,对于线卡与其他通信节点的通信,本实施例定时地进行检测;另外,对于主控板与其他通信节点的通信,本实施例同样实时地进行检测。
    累加模块102,用于当在预定的时间段内检测到通信异常时,获取该通信异常的异常类型,对所述异常类型的异常计数进行累加处理;
    在本实施例中,异常类型包括线卡与其他通信节点(包括其他线卡及主 控板)的通信发生通信异常、主控板与一个线卡发生通信异常、以及主控板与所有线卡发生通信异常共三种。其中,主控板与所有线卡发生通信异常的情况也称为孤岛异常。
    在本实施例中,根据不同的异常类型设置不同的时间段进行检测,如预设一时间段,在该时间段内对于线卡与其他通信节点的通信进行检测,若在该时间段内检测到线卡与其他通信节点发生通信异常,对发生异常的异常计数进行累加处理,即计算共发生该异常类型的通信异常的次数,如线卡与其他的某一线卡发生通信异常,在此之前该线卡的异常计数为3,则该线卡的异常计数在3的基础上加1。
    处理模块103,用于当所述异常计数达到预设的阈值时,对对应异常计数的通信异常进行处理。
    在本实施例中,对上述的线卡与其他通信节点的通信发生通信异常、主控板与一个线卡发生通信异常、以及主控板与所有线卡发生通信异常的三种异常类型分别预设不同的异常计数的最大值作为其阈值。若发生上述三种类型的通信异常情况,在对对应的异常类型的异常计数进行累加后,将异常计数与预设的阈值进行比较,以便对是否需要做出相应的处理进行判断。
    其中,异常计数的阈值根据实际情况进行预设,如:若不影响正常的通信或者保证数据能够正常传输的情况下,可以将阈值设置大一些。
    在本实施例中,在某一异常类型的通信异常的异常计数达到预设的阈值时,可以通过重启线卡或者重启主控板的方式来进行处理,以及时恢复正常通信,保证线卡与线卡之间、线卡与主控板或者主控板与线卡之间数据的正常传输。
    另外,在本实施例中,处理通信异常的方式可以通过命令行进行定制,如用户可以通过命令行设置线卡或者主控板的重启时间,设置网元设备打开或者关闭的时间等。
    在一优选的实施例中,在上述图3的实施例的基础上,上述累加模块包括:
    第一累加单元,用于当在预定的第一时间段内检测到所述主控板与一线卡通信异常时,对所述主控板与所述线卡发生通信异常的第一异常计数进行 累加处理;
    第二累加单元,用于当在预定的第二时间段内检测到所述线卡与所述主控板或者其他线卡通信异常时,对所述线卡与主控板或者其他线卡发生通信异常的第二异常计数进行累加处理;
    第三累加单元,用于当在预定的第三时间段内检测到所述主控板与所有的线卡通信异常时,对所述主控板与所有线卡发生通信异常的孤岛异常计数进行累加处理。
    其中,检测主控板与线卡是否发生通信异常的时间段为第一时间段;检测线卡与主控板或者其他线卡是否发生通信异常的时间段为第二时间段;检测主控板与所有的线卡是否发生通信异常的时间段为第三时间段。
    本实施例中,由于线卡出现通信异常的概率要高于主板卡出现异常的概率,因此,设置第一时间段大于第二时间段,而又由于主控板发生孤岛异常的概率最小,因此,设置第二时间段大于第三时间段。
    在一优选的实施例中,在上述图3的实施例的基础上,上述处理模块包括:
    第一处理单元,用于当所述第一异常计数达到预设的第一阈值时,将所述主控板向线卡发送重启命令;
    第二处理单元,用于当所述第二异常计数达到预设的第二阈值时,记录所述线卡通信异常的信息,上传所述信息至所述主控板并将所述线卡主动重启;
    第三处理单元,用于当所述孤岛异常计数达到预设的孤岛阈值时,将所述主控板主动重启。
    本实施例中,若第一异常计数达到预设的第一阈值时,则认为影响到了正常通信,主控板向线卡发送重启命令,使线卡重启,同时记录重启的原因;若第二异常计数达到预设的第二阈值时,也认为影响到了正常通信,此时记录线卡通信异常的信息,上传信息至主控板,线卡主动重启;当孤岛异常计数达到预设的孤岛阈值时,也认为影响到了正常通信,主控板主动重启,同时记录重启的原因。
    值得说明的是,若主用主控板及备用主控板均影响到了正常通信,则令 本网元设备重启。
    另外,在本实施例中,第一异常计数大于第二异常计数,且第二异常计数大于孤岛异常计数。
    在一优选的实施例中,如图4所示,在上述图3的实施例的基础上,该网元设备还包括:
    清零模块104,用于当通信正常时,对所述异常计数清零。
    在本实施例中,若在预定的时间段内没有检测到通信异常时,不处理异常计数,当通信正常时,此时对异常计数清零,对异常计数清零包括:对第一异常计数、第二异常计数及孤岛异常计数清零。
    以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

    关 键  词:
    通信 异常 处理 方法 设备
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:通信异常处理方法及网元设备.pdf
    链接地址:https://www.zhuanlichaxun.net/p-1682894.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1