通信网络管理 本发明涉及通信网络,尤其涉及通信网络的管理。
通信网络运营者利用他们提供的服务和它们管理这些服务的效率能够获得竞争性的利益。网络运营者要达到的目标包括减少费用、改善质量以及提高服务的用户控制。可以实现这些用户提议的部分联网基础结构可以恰好是“全球多服务网络(GMSN)”,它们能够使网络运营者向他们的用户提供:
—快速的服务提供
—受控的服务质量
—综合的服务
—网络服务的管理控制
理想的情况是除了提供结合了用户的流动性和可动性的许多新的特点外,这些可能性将与当今可实现语音连接同时地被提供。
为了使网络运营者能够向他们地用户提供以上所需要的广泛的灵活性、质量和控制,GMSN将需要支持:
—多服务提供
—多个卖主
—多个管理者
—灵活的服务管理
预料GMSN的复杂性和操作特性将提出超出目前网络管理方法的能力的要求。GMSN不仅要按照合同向用户提供服务,而且同时要使价格和性能对于网络运营者将是最好的。
“多服务网络(MSN)”是任何能够支持服务范围的网络。在欧洲RACE开始试验的“泛欧综合宽带网络”,报纸称为“宽带通信管理—RACE TMN方法”就是基于“异步传输模式”的MSN的一个例子,它是由R.Smith于1990年在伦敦的“IEE宽带国际会议”上提出的。在美国目前已有是使用常规转换器(例如北方电信的DMS250)的MSN的例子的网络。这种网络可用来发送语音和数据。数据可被分割为各种传输速率,例如从19Kb/秒直到40Mb/秒,因此从文件传送至实时视频的服务范围都可被支持。此外,这种网络的趋势是走向全球网络,在全球网络中的MSN能够跨越许多国家,即GMSN的出现。
至少在一开始MSN的预期用户被预料是大的公司用户,也许在全球有许多部门。这种用户将需要看来似乎是专用交换网的网络,至少提供他们从国际专用租用线路所享受的功能。事实上,服务可由一些可能属于许多不同的网络运营者的基础网络来支持。这种结构称为虚拟网络。
服务级协议(SLA)
这些公司通常利用合同把它们大部分的全球电信需求委托给一个服务提供者。给它们提供在它们的合同中规定的服务等级是非常重要的。服务的准确定义在“服务级协议(SLA)”中规定。可得到的服务的范围可能非常大,由于每种服务有任选范围,所以可进一步对每种服务进行定制。
实例服务包括:
—专用的国际租用线路
—由以下进行控制的路由选择
—时刻
—呼叫标识
—始发位置
—用户控制的拔号方案
后者的一个例子就是不管呼叫从相对于销售部门的哪一地理位置发出,用户都只需拔111来接通相关的销售部门。
可以预料SLA一般将包括:
—服务的分级(阻塞概率,位误差率,无误差秒等)
—目标和保证的最短提供时间
—目标和保证的最短中断时间
—目标和保证的最短修复时间
—目标和保证所得到的服务
国际标准团体(OSI/NMF和CCITT)利用面向对象的软件技术已开发了服务和SLA的模型。这些模型提供了定义服务和SLA的“类属管理对象”(Generic Managed Object)的类别。引入了特征“管理对象”的概念来定义可被提供给用户的服务级部件。“智能网”中允许的逻辑编号方法就是这种特征的一个例子。特征可被“嵌套”,因此一个特征是另一特征的组成部分。在特征对象中还定义了从特征至基础网络资源的映射。在具有包括用于对服务和/或用户数据进行引用的服务控制(SCP)(或其它装置)的结构的已知类型的智能网中,服务控制点(SCP)通常将是许多特征(例如逻辑编号,按日计时路由选择)所依赖的资源。
只要关于记帐、故障处理和性能指标的信息是特征的所有示例所公用的,在该特征内就还可以包含该信息。但例如某些特征的性能指标可能将取决于它们的应用场合。
SLA于是根据支持所讨论的服务的部件特征来定义。除此之外,还包含有关于合同和被SLA覆盖的服务的说明的信息。SLA一般指一些特征,这些特征又可以指其它特征和资源。为了支持这种相互关系,可以定义一些依赖性关系种类(支持,依赖等)。
多服务网络管理
用户还很可能要求能够管理他们自己的虚拟网络:用户根据与服务提供者的设备的在线连接能够请求、改变及中止服务。
所有这种复杂性使网络管理成为非常困难的事情,在需要重新配置的场合和从SLA来看尤其如此。
在一个以上的国家的范围内提供多服务功能很可能需要相当的资金支出。为了使这种网络有前途,必须严格地限制操作成本。为了满足这一操作成本限制,如果网络的管理功能的广泛的自动化不是根本的也将是非常有吸引力的。
根据本发明的实施例,通过利用“协同式智能软件工具(Cooperating Inteligent Software Agent)”技术至少部分地实现这种自动化。这种技术的基本原理在各种出版物中有一般的说明,这些出版物包括:
i)Pitmall、Morgan、Kaufmaun于1987年出版的M.Huhns的“分布式人工智能”,卷I和II;
ii)英国电信杂志1991年7月的9卷3期刊载的D.G.Griffiths和B.K.Purohi”的分布式人工智能基础”;
iii)在英国电信技术杂志同一期上的D.G.Griffiths和C.Whitney的“智能软件工具在综合通信管理中的作用”。
上述各出版物的相关内容在此作为参考文献。
利用本发明的实施例可被自动化的网络管理的各个特定方面共同地或单独地包括了在保证用户需要满意的同时在基础物理网络中建立和修复路由。
长期服务提供
服务提供是任何电信运营者的需要。因为以下特点,所以GMSN的服务提供往往与普通网络的不同:
—大范围的服务
—广泛的用户类型
—带有财政补偿的复杂SLA
—跨越一个以上国家的(一些)网络
很可能要求每当用户请求提供新的服务,他们就应当收到报价和在固定时间内的时标指示。用户可能利用已有用户的管理终端或通过新用户的协商程序)在请求中提出新的服务,并且将会被告知该服务的价格和何时可得到该服务。如果该服务不能够被已有网络配置支持,则显然需要进行某些重新配置并可能恰好涉及到新设备的提供。
实时网络重新配置
一旦一网络单元失效会影响到一些服务。它们会完全失效或者它们会部分失效,但它们的服务质量会降低到低于在用户SLA中规定的质量。当出现这样的故障时,必需找到(利用网络重新配置的)替代方法来恢复相同的服务。
在普通的网络(例如在当今的英国的PSTN中所提供的)中,这种重新配置由在转换器(例如系统-X交换机)中的路由选择表来进行控制。该转换器利用来自中央操作单元的控制动作自动地试图重定网络中问题的路线。这种路由选择不直接考虑正在被发送的通信的类型,因此所有的通信都等同地处理。
在有广泛的服务和大量不同的用户类型的较复杂的网络(例如GMSN)中,这种简单的方法不那么有效。假定所有的网络应用都同等重要不再是安全的。
根据本发明,提供了包括基于协同式智能软件工具的分布式控制系统的通信网络管理系统,在该通信网络管理系统中,可以在这些软件工具的控制下完成通信网络或软件工具的重新配置。
这种重新配置将例如由用户对于新服务的请求来触发或者在软件工具失效时被触发。
特别在软件工具失效的情况下,非常迅速地完成重新配置以便维持或恢复服务是非常重要的。控制系统参看SLA来确定在面临悬而未决或实际上失效的情况下哪些服务具有优选级也将是非常重要的。因此,当出现了网络故障时,需要查明所有(或所有明显)受影响的服务并考察这些服务对被认为正确的SLA的影响。被违反的SLA将按照急迫程度排列并对网络进行重新配置,以便按照将失效的影响减至最小的方式恢复服务。
可以将本发明的一个实施例描述为基于协同地运行来解决在GMSN中服务管理问题的子集的自动软件工具的开放多机种系统的体系结构。所涉及的服务管理问题包括上述实时重新配置以及响应用户请求提供服务。
现在参看附图仅仅作为例子更详细地描述本发明的实施例,附图中:
图1表示GMSN的顶极体系结构以及为此所用的控制网络;
图2表示供图1的控制网络使用的软件工具、特别是服务管理工具5的体系结构;
图3表示供图1的控制网络使用的软件工具、特别是用户工具6的体系结构;
图4表示在图1所示的GMSN1中的服务提供的协商处理的流程图;
图5表示在图1的控制网络中,当软件工具出现故障时招标处理的流程图;
图6表示具有一些附加步骤的图5的流程图。
参看图1,GMSN1一般包括在网络节点或转换器3之间的通信链路2。通信按照由节点3的配置确定的组合沿着通信链路2进行。
GMSN具有包括多个计算机系统或软件工具5、6的相关控制网络4。软件工具5、6有两种,一种是“服务管理工具(SMA)”5,另一种是“用户工具(CA)”6。每一CA6与SMA5相关并在GMSN用户和可能给该用户提供服务的SMA5之间起协商的作用。
软件工具5、6可进入或离开它们所构成的、由控制网络进行控制的区域。软件工具5、6执行的主要功能是:
·在基础GMSN1中建立和修复通信链路2
·满足用户需求
·在软件工具出现故障时恢复GMSN的控制
链路2的建立和修复由SMA5来完成,而用户需求的满足基于CA6和超服务提供者作用的SMA5之间的对话和协商的过程。
值得注意的是服务提供的“人员配备”和用户服务的协商都是在知识不完备和需求受约束的条件下来进行的。本发明的实施例为这些问题的解决提供了处理,这些处理的显著特点是它们是分布式的和对故障有复原能力的。由于有减少传送到中央位置的数据总量的余地和分布式系统的固有复原能力允许适度恶化,所以分布式的特性支持优于集中式系统的改善性能。
方便的做法是在每一GMSN节点3处有一个软件工具SMA5,各个SMA5监测其下面的转换器3以及延伸到该转换器3的链路2。首要的是各个SMA5只控制一个转换器3,但任何给定的SMA5都有同时控制若干转换器3的能力。即SMA5能够确定服务将使用的输入和输出通信链路2。
软件工具5、6组成了单层系统。SAM的责任是利用当前的网络资源来提供用户服务并维护已经安装的服务。就是说,一旦通信链路2失效,则使用该链路2的所有服务都将受到影响,并且将需要向这些服务分配的路由或链路2的组合。由于软件工具5、6的控制网络4只有局部知识但必需在全局范围内进行操作,所以它利用协作来执行这些功能。
软件工具体系结构(a)服务管理工具(SMA)5
参看图2,为了在控制网络4内超作用,各个SMA5必需具有充分结构化的知识以及在与其它软件工具5、6协同操作时运用这种知识的能力。由于在动态地变化的环境中工作,SAM5可以经历各种状态30。状态30被定义为由于软件工具与物理环境的相互作用和/或与其它软件工具的接触所产生的软件工具的知识的实例。SMA的知识可划分为两类,工具数据库31和工具工作存府器32。工具数据库31包含对相邻工具拓扑结构33、相关工具5所负责的局部网络拓扑结构34的说明和通信量简要表35。后者描述了已经安装的、使用了工具的局部网络的服务。工具工作存储器32主要包括由工具接收36和发送37的信息的队列,这些队列36、37在解决网络问题期间产生。
此外,每一SAM5具有对于每一种消息使工具的方法和算法(“类属工具代码”)能够被触发和被恰当地使用的一组“消息处理程序”38。“类属工具代码”包括:
—工具的知识估算和更新算法
—分布式路由选择算法
—用户服务协商算法
—在工具出现故障时重新分配控制所使用的“招标”机制。
工具数据库31在工具存在期间被不断地更新并在问题解决对话期间利用与相邻SMA5的接触来被增强。各个SMA5在其接收的消息、例如告警、部分路由结果、沿着路由以便安装服务时线路的确认和预订等的基础上建立其自己的GMSN1的模型39以及在该模型上运行的服务。(b)用户工具(CA)6
参看图3,为了满足用户对用户的需求,提供了第二种软件工具CA6。每一CA6与SMA5连接并包括以下各部件作为最小子集:
—友善的用户接口60
—包含有关在GMSN1中提供的服务的范围、价格和优先级的信息的数据库61
—协商策略62
—CA-SMA通信协议63
用户接口60允许与用户进行对话以便实现用户需求的收集、允许向用户提供例如关于服务、价格等的通知、允许诸如改变/修改需求和解决办法的认可这样的用户/服务提供者的调停和用户决定的接纳。
服务数据库61包含有关可由服务提供者通过GMSN1提供的服务的范围的信息以及反映该提供者的价格政策的其它信息。它是可更新的。
协商策略62可以用至少两种方法的任一种来实现。首先,可以通过在用户和服务提供者之间进行调停、用户作出全部决定来实现。另一种方法是用户可以提出服务要求和他/她能够接受的价格范围,给予CA6协商最好的可得到服务不满足这些要求和价格范围的自由度。
以下描述的实施例是遵循第一种方法的实现,用户作出全部决定,CA6在用户和服务提供者之间进行调停。CA6代表要求服务的用户的利益,用户可以用最低的价格来请求最大可能的质量和优先级。因为由SMA5代表的服务提供者希望在操作成本最低的条件下利用最小的网络资源来建立服务,所以就产生了调停需求。因此在CA6和相关SMA5之间发生了对话以便达成相互认可的协议。这是由在以下部分中描述的工具协商处理来实现的。
利用工具协商的用户服务提供
在描述响应用户请求的服务提供之前,了解在本发明的当前实施例中如何作出服务的模型和对于服务所作出的主要假设是很重要的。服务定义如下:
服务=(服务名、价格、优先级、带宽、源、目的地)
服务定义还可任选地包括:“服务的质量”。
值得注意的是在服务被认可和被安装之前,服务参数“价格”、“优先级”和“带宽”在SMA5和CA6之间的协商期间被重新考虑并可被改变。这在以后进一步说明。
服务假设如下:
·服务是具有一根路径的端对端的连接。不考虑广播服务。
·服务被认为是双向的,即通信量沿着所提供路径的两个方向流动。
·服务带宽用所需线路的数目来描述。
·服务带宽是恒定的,即不随其路径或不随时间而变化。
·根据(通过协商)事先确定的优先级数按优选序排列服务,在进行服务期间决不改变。
·服务的优选级正比于其销售价格。
·如果较高优先级的另一服务需要被较低优选级的服务占用的某些资源,可以暂时地打乱较低优先级的服务。这对于为新的服务建立价格有效的路由是必不可少的。
一旦接收到用户对新服务的请求,CA6就将该请求与由服务提供者提供的可得到服务的范围进行比较并建立被传递给负责该特定服务的源节点的SMA5的服务说明。被请求服务的说明采用以下的形式:
用户请求=(服务名、价格价格*、优选级*、带宽*、源、目的地)这里的*表示这些参数的初始值。
该说明也可任选地包括“服务的质量”。
一旦负责相关源节点的SMA5要求提供服务的“用户请求”,它就需要与其它SMA5合作,以便确定从源至目的地的最高价格有效的路由。在这种情况下将作为该用户的服务提供者的SMA5接受该“用户请求”,不是启动产生路由的处理就是在未定的项目队列中加入相应于每一“用户请求”的项目,并且触发“监视器”超时来限制对于响应的总的等候时间。
一旦产生路由的处理被启动,就利用分布式路由选择算法来完成路由产生,分布式路由选择算法的一些例子是公知的,因此在此不详述。例如在考虑中的网络这样的网络必需被认为是动态的。即可以给系统增加节点和链路或从系统中删除节点和链路,任何链路的容量可以发生变化。这些约束的包含和处理需要非常适合于变化的算法。正是为了满足这些要求,我们发现将要由软件工具执行的分布式路由选择算法是有吸引力的。
分布式路由选择算法例如能够发掘全部路径,但与此同时,正在产生一组路由的各SMA5保留到目前为止产生的、由另一SMA5利用前向消息传递给它的价格最低的路由的价格。SMA然后将正在产生的部分路由的价格与所保持的最低价格的路由的价格进行比较。如果部分路由较昂贵,则由于它肯定不会产生价格有效的路由,所以放弃它。否则,就被完成(到达目的地),沿该路由向启动搜索的SMA5的传送后向消息。
SMA5的网络于是在起确定一组路由来满足请求的项目并将有望的路由返回给已成为服务提供者的SMA5的作用。这些路由的任一条可以具有以下结构:
路由结果=(自由引出线,价格,[N1,……Nj],[(Si,Pi),………,(Sk,Pk)])这里的“自由引出线”是沿该路由的全局自由容量,“价格”仅是该路由的价格。
参看图1,各网络节点3可被单独地编号为N1,N2。N3等。因此可以通过列出一路由通过的相关节点3来描述在GMSN1内的该路由。一个例子于是可以是路由[N1,N5,N8,N3]。考察在路由链路上可获得的容量,即自由容量,它们可以如下:
链路引出线15=30,链路引出线58=50,链路引出线83=20,自由引出线=最小(链路引出线15,链路引出线58,链路引出线83)=20
[N1,……,Nj]是从源(N1)至目的地(Nj)的作为一系列节点3给定的路由。
[(Si,Pi),……,(Sk,Pk)]是干扰表,即全部服务(Si)的表,它们的优先级(Pi)在被提出的新的服务要沿该路由安装时可被破坏。
随后关于“自由引出线”以降序列出有望的路由。应当指出,该表中的各条路由必需满足在相关的“用户请求”中的“源”和“目的地”的项目。还必需满足“价格”项目(价格*≥价格)。
该表中的第一路由(具有最大“自由引出线”的路由)可以满足:
自由引出线i≥带宽*
在这种情况下不需要干扰其它服务(干扰表应当是空的),由于具有最大可用容量的路由要被选择,所以具有服务的网络的负载处于被控状态下。SP(服务提供者)然后获得该特定的路由Routei并将消息传送给CA6,告诉CA6这一路由,以便得到用户同意在该特定路由上安装服务。
如果相反地
自由引出线<带宽*,则在CCA6和SP之间启动协商处理。
如果没有路由具有足够的“自由引出线”来满足所需的带宽,代表公司利益的SP就利用判定函数来选择可以干扰在其上的服务的最佳路由。这一判定函数描述如下。
对于Routei,i=1,……,n。sp进行以下计算:如上所述,这里的(P1,……,Pk)是一旦要建立Routei就必需被干扰的服务(S1,……,Sk)的优先级。Mi是当服务(S1,……,Sk)被干扰时每服务的平均净优先级损失。
选择使Mi最小的路由是合理的。因此,SP启动对该表进行线性搜索来找出具有最小Mi的路由的循环,使得对于t从1至K的任何值,都有:
优先级>Pt
即t=1,……,k (方程**)
如果该路由确实存在,就可以暂时干扰服务,告诉CA6所选的路由,等待用户同意安装服务。
此时,在这种实施中,负责传送将要被干扰的服务的路由的链接的SMA5自动地区分这些服务并且在可能的情况下为这些服务确定替代的路由(路由修复)是很重要的。如果不可能的话,SMA可以和负责被干扰的服务的CA进行协商。这是为了把由较低优先级的服务的干扰造成的收益的损失减至最小。
否则,SP向CA提供其最佳的可选路由(具有最小Mi的路由),此时用户也许同意降低其带宽要求并接受在建议的路由上可得到的自由容量。如果用户认可了以上协议,就无干扰地沿该路由安装该用户的服务,因此不额外收费。如果用户希望使他的带宽要求保持有效,SP就在增大所需服务的优先级(优先级*)的基础上和CA进行协商。优先级例如可正比于价格。CA为了较大的优先级要付更多的费用。
如果CA认可了新的较大的优先级,SP就根据平均优先级损失(Mi)计算用户需支付的额外费用。服务的总费用是:
总费用=价格*+额外费用
它反映了优先级的提高。
优先级=优先级*+附加优先级
附加优先级是要被增加到优先级*上的量,以便满足上面给出的“方程**”。然后如上所述的路由恢复的相同机理被应用到被干扰的服务。
下面参照图示给出增高处理的简短概述:
开始
步骤20:要求提供服务的CA请求
步骤21、22:选择在网络中可得到的最佳路由
并确定服务的可行性及价格以及将要被干扰(
如果有)的服务。
步骤23:SP确定已有服务是否将要被干扰。如
果没有,系统进到步骤24。如果服务将被干
扰,系统进到步骤25。
步骤24:SP通知CA建议的服务(成本、路由)
和停止。
步骤25:SP检查所要求的服务是否具有高于被
干扰的各服务的优先级。如果具有,系统返回
步骤24。如果不具有较高的优先级,系统进
到步骤26。
步骤26:SP与CA协商
—较低带宽要求
或
—增加服务的优先级(在这种模式中优先级正比于成本)
步骤27:检查CA是否认为这一协商是合理的。
如果是,系统进到步骤24。如果不是,系统
进到步骤28。
步骤28:SP与CA协商改变该服务(步骤28)
然后改变技术服务描述和返回步骤20。
这是一个SMA-CA交互处理的简单例子。然而存在更加复杂的情形。
在上面的描述中,软件工具已被认为是坚固的和不
软件工具故障
上面描述的系统模型基本上包括与基础物理通信网络(称为GSMN网络1)相互作用的两个网络和其功能是管理和控制该GSMN1的软件工具5、6的网络4。为了实现这些功能,这些软件工具具有一定的职责,这些职责最一般的形式有两类:管理上的和合同上的。作为管理器5,软件工具适合控制某些节点3和链路2的职责。作为立约器6,软件工具必须保证已被约定的各服务的提供和维护。
当SMA5出故障时,软件工具网络4的稳定性将首先被干扰。在这种环境下。软件工具网络4的正常操作被损坏,因为由于该软件工具的出故障,它的任务无人管理,从而出现“不正常”软件工具网络状态。这种不正常性持续下去除非或直至,或者该出故障的软件被恢复,或者如果这种操作不能迅速地被恢复,它的任务被垂直地分配给它的邻近软件工具。因为各SMA的任务程序表是随着任何软件工具的故障而被修改的,一所以系统在一个新的移动性阈值上重新获得正常化。涉及该稳定性阈值,每个软件工具被设计为在某个负荷水平(待解决的查询数)的其有效寿命期间工作和在理论上讲它能够管理任何数目的节点3。在实际中存在着一些限制,超出该限制,软件工具控制系统可能不会获得被设计的满意的性能规范。该稳定性阈值是平均负荷(合同上的和管理上的负荷)限制,超过这个限制系统不能以稳定的方式响应于对它的寻址查询。
开始,我们假设在软件网络4的GMSN1之间存在着一种异形同构体。因此,每个SMA5管理它的对应节点3和入射到节点3的可能的一些链路2。让我们假设SMA5(称其为A)。邻近的各SMA将知道A′的故障(通过告警的检测)和因此以某种方式替换A′的任务。为实现这个目的,在知道有关A′出故障的各SMA5之间进行脉冲串通信,以便协商A′的管理上的和合同上的任务的分配。
在软件工具5、6之中的协商的的基础是其值是由根据网络4的当前状态计算出来的招标函数(F)。为了计算招标函数F,已经考虑了四个判据。根据这些判据,招标函数F是某些预计算的参数(每个判据一个)的加权和:
F=W1C+W2R+W3O+W4M这里C、R、B和M是正如下面予以说明的对于每个判据计算的参数,W1到W4是加权,其中W3和W4是负值。
注意:NA=邻近软件工具;FA=出故障的软件工具
判据I:连通性参数(C)
假设:
[邻近软件工具NA的节点已经连接到FA′的链路愈多,它的连通性C愈大]
[连通性C愈大,NA的中标机会愈大]
判据II:服务任务参数(R)假设:
[利用以前由FA管理的链路规定的邻近软件工具NA的服务愈多,管理和保持这些服务的任务R愈大]
[任务R愈大,NA的中标机会愈大]
判据III:占用率(0)假设:
[一个邻近的软件工具NA的负荷愈大,即该软件工具在其来话消息的排队中查询的数目愈大,它的占用率愈大]
[占用率愈大,该NA中标的机会愈小]
判据IV:管理约定(M)假设:
[一个相邻的软件工具NA作为一个管理器M的约定愈多,即,已经通过基础网络4的节点3和链路2控制它的机会愈大,相对于FA的节点和链路成为新的管理器的可能性愈小]
[管理约定M愈大,该NA中标的机会愈小]SMA。
在上述投标处理的例子中,参看投标函数F,加权W1、W2、W3和W4可以被调整,和受经验结果的支配。然而,某些结构可以强加给W0,首先,W1和W2两者是正的。第二,由于其抑制效果,W3和W4是负的。第三,最有支配性的因子必须是连通性参数Cc。因此,加权W1已经在表1中给出。
其他加权已由下列值给出:
W2=1/β
这里β=在该网络中连接到一个节点的链路的平均数(扇出)。
W3=-10/μ
这里μ=在该网络中节点的总数。
W4可以根据软件工具对节点的比率进行调整。各值的正常范围将是0到-1。对于较高的软件工具对节点的比率,该闭合网络的W4将达到-1,这具有通过增加M的F作用,扩展整个管理任务到多个软件工具。对于W4的一种表示可以是在“1/集群规模”的场合,这里集群规模是由一个软件工具管理的平均节点数。当平均集群规模总是相当高的时候,这使中标函数对于由一个软件工具(M)管理的节点实际数有较低的灵敏度。
因此,招标函数可以按下式给出:
F=C+1/βR-1/μO+W1M方案
我们考虑具有平均扇出4的10个节点网络。A、B、C和D是在控制层的四个软件工具和其每个可响应于如下面给出的节点3的数目。取软件工具A为出故障,而B、C和D是它的邻近软件工具的这样的情况:
出故障的软件工具=A邻近的软件工具=B、C和D招标公式加权:W1=1,W2=1/4,W3=-1/10,和W4=-0.4
软件工具的细目:软件工具的名称:B
连通性(B′的节点到A′的节点) =5个链路
规定的服务(与A′的配合) =8个服务
当前待解决的查询 =4
管理的节点 =3软件工具名称:C
连通性(C′的节点到A′的节点) =2个链路
规定的服务(与A′的配合) =10个服务
当前待解决的查询 =5
管理的节点 =1软件工具:D
连通性(B′的节点到A′的节点) =5个链路
规定的服务(与A′的配合) =3个服务
当前待解决的查询 =3
管理的节点 =5
产生的投标值是:
对于软件工具B F=5+0.25*8-0.1*4-0.4*3=5.4
对于软件工具C F=2+0.25*10-0.1*5-0.4*1=3.6
对于软件工具D F=5+0.25*3-0.1*3-0.4*5=3.45结果是软件工具B是中标者,这样它将取代出故障的软件工具A的任务。
参照图4,上面所述的投标处理可以以流程图的形式予以描述。当通过告警以检测一个软件工具知道邻近的软件工具出故障时(步骤40)该程序被触发。告警机制可以视为一种简单和连续的检查,其中每个软件工具周期性地广播一个消息到其邻近的软件工具和然后响应于这个消息将各软件工具的表相对于各邻近的软件工具的表进行比较。如果和仅如果由于与该软件工具未接收到消息相联系的通信链路的一个链路故障告警(切断连接),则丢失消息的软件工具被认为“死了”。转移到邻近软件消息的可以被用来更新它们的知识(即,发送给它们的当前邻近软件工具的表将帮助它们在投标处理中的中标)。
对于每个知道软件工具A′出故障的软件工具的下一个步骤,步骤41计算投标函数F,和发送出其自己的投标值(步骤42)。举一个软件工具的例子,即软件工具B,然后进入步骤50、43、44、51的循环,在该循环期间等待通知和从其他邻近软件工具将要接收的投标值。在步骤50,检查其输入的从其他邻近软件工具接收的夺标或中标者的通知的消息。在步骤43,进行是否中标者已经找到的判断。这可能是因为软件工具B在其输入消息中已经从另外的软件工具接收到中标者的通知(步骤50)。如果有,则离开该循环,如果没有,则继续进行步骤44,初步的计算中标者本身。即,如果来自其他邻近的软件工具的所有投标值都已接收到,则软件工具B将再次离开该循环和此时比较各接收的投标,连同其自身的投标,找到中标者,步骤46。如果所有投标尚未被接收到,则软件工具B将等待一个响应周期,步骤51,然后返回该循环的开始,步骤50。
在步骤43和44,该循环的两个路由完结涉及另外的邻近软件工具在软件工具B之前已经接收到所有投标(步骤43)和软件工具B明显地首先接收所有的投标的情况,和因此在其自己的记录找到中标者(步骤44、46)。
进一步的测试在任何的情况下有待进行,在步骤47,由软件工具B估计是否它自己是中标者,因为如果是中标者,它必须承担软件工具A的任务。因此,如果软件工具B在步骤47找到它是中标者,它将更新它的知识,步骤49,从而接替出故障的软件工具A的任务,和发送一个通知,步骤53,到包括在投标中所有其他邻近的软件工具,并结束该处理,步骤54。如果硬件工具B不是中标者,硬件工具B此时通过分配一个指示位“软件工具A-中标者”,步骤45,保证它的将来与中标者通信,而不是与软件工具A通信。再有,软件工具B而后发出一个中标者的通知,步骤53,到包括在投标中所有其他邻近的软件工具,和结束该处理,步骤54。
参照图6,在另外一种方案中,由各软件工具执行的各处理步骤可能包括一些附加的检查,这些检查使它们保证适当地更新它们自己,而不需要重复更新步骤49、45。
在这种方案中,如果软件工具B在读出其输入消息后知道该中标者(步骤43),则它进入步骤100,进行检查,是否它已经在相对于中标者的其记录中做了更新。如果做了,它简单地进入停止状态(步骤54)。如果它未做,它转到步骤47,和继续按照图5的方式进行。然而,为了为步骤100提供信息,在步骤49或45(更新自己的知识或分配一个指示位),它为自己设置一个标志,步骤52,表示它已经更新了相对于中标者的其记录。
图6的方式提供了软件工具B接收所有的投标(步骤44),比较和找到中标者(步骤46),然而,接着还接收一个来自另外一个软件工具的中标者的通知的情况。在图6的方式中,继之的通知将使软件工具B简单地进入停止状态(步骤54),因为在步骤100的检查将表示它的记录已经被更新。
图6的方式还将涉及这样一种情况,即一个软件工具从多于一个邻近软件工具的中标者接收到通知。再者,当接收第二(和下一个)通知时可以避免更新其自己的记录的附加逻辑。
当然可以存在对上述操作进一步处理,而不脱离本发明的一个实施例。例如,下面开始的处理步骤可能包括检查,以避免重复响应已经处理的告警消息。
在上述投标处理的描述,已经做出某些假设。这些假设如下:
1、一个软件工具可以在该共同体中利用直接或间接通信方式与任何其他软件工具通信。
2、为了简单起见,投标算法被设计为包括仅通过直接通信链路与出故障的软件工具相连的邻近软件工具。这些通信链路以前已被中断的邻近软件工具将不可能“读出”该软件工具的故障告警,但它们可以接收关于由直接与出故障的软件工具相连的软件工具做出的最后投标判断。
从出故障的软件工具的任务转移可能是以两种方式来实现的。中标的软件工具例如可以访问该出故障软件工具的数据库,从那里可以提取由该出故障软件工具自己的信息。这当然是要根据有效/可访问的数据库的假设。第二种方式是根据“中标者”的概念,通过与出故障的软件工具的其他相邻的软件工具的对话在出故障的软件工具的数据库中(该库目前是不能利用的)重建存储的信息。利用这种方式仍有可能恢复诸如节点和链路的连通性,在出故障的软件工具的链路等安装服务的信息。
服务的恢复
上面描述了在控制层4对软件工具的故障的响应。然而,基础层GMSN1的节点3和链路2也可能出故障。当节点3操作出故障时,所有的链路2投射故障到操作中。因此,节点故障等效于多链路故障和因此其解决涉及基本的链路故障问题。因此要对链路问题予以足够的考虑。沿出故障的链路的所有服务“运行”将被检测和重新择径。重新选择的一个现存服务本身可以是一种规定的服务类型。
适合的恢复程序应用相同的转移和边界择径程序,前者用于服务规定并提及在上面。
网络链路2的故障引起一个告警消息,将被自动地发送到对该链路负责任的SMA5。然后SMA5识别将被重新择径的受影响的服务,和以在其将与其优先级的次序有关的队列中发送它们。SMA5发送一个类似于用于新的服务请求(已描述过)的请求的重新择径请求到它的邻近软件工具,该软件工具正在要求它提供围绕该故障链路的可替代的路由。重新择径服务是利用从始发(干扰发生地点)到终点(干扰结束的地点)被干扰的服务的容量建立路由的。当该结果已被返回到对该出故障的链路负责任的SMA时,选择出最低成本的路由。
在某些情况下,可能不存在对于该服务的可替代的路由。这可能是因为:
—利用所要求的容量不存在可替代的路由;
—价格限制太严重;
—仅允许不够的搜索时间。
无论哪种情况,该始发的SMA(被发信号链路出故障的软件工具)必须判断要做出什么。一个简单的做法可能是放宽价格的限制和重新尝试。
应当注意的是,虽然在图1所表示在GMSN1中的SMA5与节点3之间的1∶1的关系,但这不是必须的情况。的确,更趋向于找到比节点3更有效的几个SMA5,因此每个SMA5控制多于一个节点3。
还应当指示,在上述本发明的例子中,软件工具A是出故障和软件工具B是中标者,软件工具B替代软件工具A的任务。实际上,可能更有效地发现软件工具A的任务被多于一个软件工具之干扰的,和因此投标处理可以以另外的方式设计为,其余软件工具的投标仅用于选择出故障的软件工具的任务,或者每个邻近软件工具转移相应于出故障软件工具的不同任务的不同投标函数。
在本说明书中,利用了术语“配合操作智能软件工具。并不限制对于相关技术领域中的技术人员将本说明书的配合操作智能软件工具的目的理解为在本发明的实施例中迄今为止能够执行上面所述的各功能的软件整体。因此,相关的软件整体或许应当包括:数据存储,或者访问一个数据存储,至少某些数据(或访问某些数据),这些数据位于该软件整体而不是相对于通信网络的全局;其中的智能可以进行判决和对它进行操作;通信装置用于与其他软件工具的通信;控制输出用于发出控制信号到分配的节点;和更新装置用于更新它的数据。