监控计算网络背景技术
计算网络可以包括数以千计的被配置成与彼此交互的网络项目。网络项目除其它
之外可以包括软件、模型、方案、诸如过程文档编制的形式文档编制、服务水平协议(SLA)、
服务器、储存器、路由器、交换机、以及处理单元。针对能够影响网络项目的管理的变化监控
这些网络项目。
附图说明
在以下的详细描述中并参考附图描述某些示例,其中:
图1是计算系统的示例的框图;
图2是管理模板的示例的框图;
图3是监控方面的示例的图解;
图4是基于拓扑模式的监控系统和所监控的应用服务的示例的框图;
图5是基于拓扑模式的监控系统的示例的框图;
图6是配置无代理(agent-less)监控应用的基于拓扑模式的监控系统的框图;
图7是配置监控系统的方法的示例的过程流程图;
图8是配置监控系统的方法的示例的过程流程图;
图9是重新配置监控系统的方法的示例的过程流程图;以及
图10是重新配置监控系统的方法的示例的过程流程图。
具体实施方式
本文中描述的技术一般地涉及监控并管理计算网络。信息技术(IT)环境可以包括
数千硬件和软件元件,以及源自内部或外部提供商的服务。由管理系统管理这些元件和服
务。不论何时在IT环境中的元件或服务变化,都可以重新配置该管理系统。诸如新的系统、
应用和网络的按需供应(on-demandprovisioning)和虚拟化技术的IT环境引入了在IT环
境中的高频率的变化。这些变化增加了在以及时、高效、低成本的方式管理服务方面的挑
战。
当监控服务或元件时,在环境的上下文中而不是孤立地考虑元件。例如,服务的应
用可以包括若干组件,除其它之外诸如服务器、中间件、以及数据库。应用的组件与彼此交
互并因此以整体的方式被对待。由于元件在服务中的角色可以影响如何管理该元件,因此
考虑环境的上下文。例如,在数据库服务器上的磁盘I/O可以比应用的应用服务器机器包括
更严格的控制。
当前的监控系统可以是节点中央式(node-centric)的,配置在所监控的服务器的
上下文中的监控系统。然而,节点中央式监控系统使用人类用户来配置监控系统,并来针对
给定的元件或服务激活适当的监控。像这样(assuch),监控系统的效率依赖于用户知道在
哪里以及如何部署应用以及应用的基础设施和服务,以及依赖于用户理解哪些应用正在每
个节点上运行。
节点中央式监控系统对简单的场景来说可以是高效的。然而,节点中央式监控系
统对复杂的IT环境来说是低效的。例如,在动态IT环境中,在发生变化和用户察觉变化并更
新监控系统之间可能发生延迟。在IT环境中的变化和监控系统的调节之间的延迟可能导致
诸如错误警报或未能监控新元件的问题。错误警报是当停用服务时对停止的服务的报告。
另外,节点中央式监控系统可能缺乏模拟所管理的元件的角色上下文的能力。不通过模拟
所管理的元件的角色上下午,节点中央式监控系统不能够向用户提供该上下文,使得当配
置将要如何管理服务器时剥夺了用户的完整信息。
通过监控IT环境的拓扑模式(在计算网络中的网络项目之间的布局和互连),监控
系统可以自动地识别在IT环境中的变化并配置监控系统,而不是依赖人类用户。通过自动
化监控系统,可以增加监控系统的效率,然而同时地降低维持监控系统的成本。
基于拓扑模式的监控系统可以自动地识别形成计算网络的复杂应用的拓扑模式,
并在没有用户干涉的情况下配置计算网络的管理和监控。基于拓扑模式的监控系统可以分
析在配置管理数据库(“CMDB”)中的计算网络的表示。计算网络可以是动态的并随着对网络
项目的修改、添加、或排除而变化。因此,可以设计拓扑模式监控系统以根据在计算网络中
的最新更新实际地(virtually)显示计算网络的拓扑模式,并根据这些变化配置计算网络
的监控。
如本文中使用的那样,术语“监控拓扑模式”指的是可以在IT网络中存在一次或多
次的复合IT系统的结构的定义。例如,拓扑模式可以描述应用服务包括在节点上运行的应
用服务器,并且应用服务器使用在另一节点上运行的数据库。该定义是该拓扑模式。
基于拓扑模式的监控系统可以自动地从在CMDB中的配置项目或配置类型中查询
针对网络项目的配置信息。可以供应基于拓扑模式的监控系统以反映在计算系统中的配置
项目或配置项目类型。另外,通过监控在CMDB中的更新,基于拓扑模式的监控系统可以动态
地更新监控配置以当在计算网络中发生在配置项目类型或配置项目中的变化时反映该变
化。
图1是计算系统的示例的框图。计算系统100包括计算网络102。计算网络可以包括
应用服务104,其被部署在应用服务器106上。应用服务器106可以依赖于数据库108来存储
数据。应用服务器106和数据库106可以在一个节点或多个节点110上运行。例如,应用服务
104可以是web应用,其被部署在运行在节点N1上的WebLogic服务器106上。WebLogic服务器
106可以包括对运行在节点N2上的MySQL数据库108的依赖。
计算系统100可以包括监控应用112。监控应用112根据其监控配置来监控计算网
络(102)的IT元件。监控应用除其它事物之外检查每个IT元件递送的服务的可用性和性能。
例如,监控应用112检查应用服务(104)的响应时间和服务器110的CPU利用。
计算系统100还包括处理单元114。处理单元114可以包括中央处理单元(CPU)116
以执行所存储的指令;以及存储设备118,其存储通过CPU116可执行的指令。CPU116可以是
单核处理器、多核处理器、或任何数目的其它配置。另外,处理单元114可以包括多于一个
CPU116。
处理单元114可以包括存储器118。存储器118可以包括随机存取存储器(RAM)、只
读存储器(ROM)、闪存存储器、或任何其它适当的存储系统。例如,存储器118可以包括动态
随机存取存储器(DRAM)。处理单元114还可以包括操作系统120。可以将操作系统120存储在
存储器118上。
处理单元114还包括运行时间服务模型(RTSM)122。运行时间服务模型122可以是
配置管理数据库(CMDB)。运行时间服务模型包括客户的IT环境的模型,并且随着在IT环境
中发生变化而自动地或手动地更新运行时间服务模型。
配置项目(CI)是在CMDB122中的网络项目或IT元件的表示。配置项目可以包括软
件、模型、方案、诸如过程文档编制的形式文档编制、服务水平协议(SLA)、服务器、储存器、
路由器、交换机、处理单元等的表示。在CMDB中可以采用如同“的组件”、“依赖于”、或“在…
上主控”的关系来表示CI以模拟所管理的应用的结构和在IT组件之间的拓扑关系。对在
CMDB中的CI进行按类型归类(type)以便诸如不同的Unix主机或MySQL数据库实例的类似项
目分享类似的属性并且可以被容易地查询。在CMDB内的配置记录中可以记录关于每个配置
项目的信息。配置记录是包含网络项目的配置细节的记录。
CMDB可以记录每个配置项目的属性,以及其与其它配置项目的关系。配置项目类
型、以及配置记录可以收集关于相对类似的网络项目的活动的信息,然而同时地识别针对
每个网络项目连同在计算网络中的其它网络项目的配置信息。
另外,CMDB可以使用网络发现方法收集针对网络项目的信息并存储关于配置项目
类型的信息。例如,可以使用连续地扫描IT环境和对变化的数据馈送(datafeed)的发现
技术更新CMDB。虽然关于CMDB讨论本文中讨论的示例,但是在一些示例中,可以使用不同的
数据储存设备来存储配置信息。
处理单元114还包括操作管理应用124。操作管理应用124合并来自一个或多个监
控应用112的监控信息并向一组用户呈现该可用性/性能信息以便于在所监控的IT网络102
中的问题的解决。操作管理应用使用运行时间服务模型(CMDB)122来提供所管理的IT网络
102的模型。操作管理应用124还使用基于拓扑的监控系统114来配置监控应用112以根据操
作管理应用124的需要监控IT网络102。
处理单元114还包括基于拓扑的监控系统126。基于拓扑的监控系统126可以是操
作管理应用124的子集或者可以将基于拓扑的监控系统126安装在处理单元114上作为独立
式应用。可以在各种处理环境中实现基于拓扑的监控系统126。
另外,基于拓扑模式的监控系统126可以包括至少一个管理模板128。每个管理模
板128可以包括监控方面(monitoringaspects)130。监控方面130是特定于特殊监控技术
的被封装的监控配置的监控包。可以将监控方面130与CI类型相关联以宣告可以将监控方
面应用于在IT环境中的该类型的CI实例。监控方面130包括监控策略132。监控策略包含向
监控应用指示应如何监控IT元件的详细设置(特定于相关类型的监控应用技术)(例如,要
被检查的日志文件的文件名称和检查间隔,或针对所收集的度量的阈值水平)。命令监控应
用根据策略通过将策略与在应用的监控配置中的IT元件相关联来监控某些IT元件。将关于
图2进一步讨论管理模板128和它们的监控方面130和监控策略132的结构和效用。
基于拓扑模式的监控系统126可以将管理模板128应用于从RTSM122收集的现有的
拓扑模式信息以确定用于计算网络102的精确的监控配置。例如,基于拓扑模式的监控系统
126可以使用从配置项目收集的信息以将对应的管理模板128应用于拓扑模式监控系统
126,以便基于计算网络102的拓扑模式来确定用于计算网络102的监控配置。
要理解的是,图1的框图不意图指示计算系统100要在每个情况中包括在图1中示
出的组件的所有。另外,依赖于具体实现的细节,在计算系统100内可以包括任何数目的附
加组件。
图2是管理模板的示例的框图。管理模板200可以在监控方面202的顶部上提供抽
象(abstraction)以简化计算网络的网络项目的监控。管理模板200定义要将哪个监控方面
202应用于在应用的拓扑模式204中的每个IT组件。每个管理模板200包括拓扑模式204和方
面集202。每个拓扑模式204包括网络项目的表示以阐明在计算网络的网络项目之间的关
系。拓扑模式204阐明在应用服务器208上部署应用服务206。拓扑模式204还阐明应用服务
器208可以依赖于数据库210以存储数据。拓扑模式204还阐明应用服务器208和数据库210
可以在一个节点或多个节点212上运行。方面集描述监控的类型和要将监控应用于其的CI。
管理模板200列出被包括在管理模板200中的方面集202。方面集202寻址组合IT系
统的每个组件。例如,管理模板200可以包括与应用服务、应用服务器、数据库、和拓扑模式
的节点相关联的方面集202。在管理模板200中将方面202关联到拓扑模式204的对象指示将
各个方面202应用于监控在IT网络中的每个组件的各种特征,如果该组件匹配管理模板200
的拓扑模式204。例如,管理模板200可以包括被指向所有应用服务器的监控性能的方面集
202、以及被指向由通过该管理模板200监控的应用服务的实例使用的所有应用服务器的资
源使用监控的方面集202。
管理模板200还可以包括监控策略214。可以将监控策略214与方面202相关联。例
如,可以将策略:(DB)收集DB日志文件与方面:(DB)收集DB日志相关联。当所关联的方面202
被识别为与CI相关时,可以部署监控策略214。监控策略214包含向监控应用指示应如何监
控IT元件的详细设置(特定于相关类型的监控应用技术)(例如,要被检查的日志文件的文
件名称和检查间隔,或针对所收集的度量的阈值水平)。
另外,管理模板200可以是配置项目类型的选择集的拓扑模式204和在计算网络中
的配置项目类型之间的关系的预定义的表达。预定义的管理模板200可以允许基于拓扑模
式的监控系统迅速地匹配配置项目类型的配置。还可以使用管理模板200来包括针对在计
算网络中的变化的动态监控调节,诸如负载平衡、恢复、以及部署配置。
当在CMDB中添加、变化、或移除网络项目时,或者如果在网络项目之间的关系变
化,那么可以激活管理模板200的模式辨识。如果该变化允许新的模式匹配,那么激活管理
模板200。然而,如果管理模板200不再匹配,那么去激活管理模板200。例如,如果出于负载
平衡的原因将新的服务器添加到web集群,那么管理模板200将辨识该新服务器为web集群
的部分并将自动地正确地监控该新服务器并在上下文中。
另外,可以由操作者针对具体的计算网络修改并修整(tailor)管理模板200。例
如,监控计算网络的操作者可以使用至少一个管理模板200将具体的监控方面202分派到特
定的配置项目类型。用户可以根据计算网络的拓扑模式204创建或修改监控方面202。
要理解的是,图2的框图不意图指示管理模板200将在每个情况中包括在图2中示
出的组件中的所有。另外,依赖于具体实现的细节,在管理模板200内可以包括任何数目的
附加组件。
图3是监控方面的示例的图解。监控方面300包括定义302。定义302陈述监控的类
型和监控配置是可应用于其的配置项目类型。方面300还包括方面300的管理策略304。管理
策略304包括指示当使用该方面来监控该IT元件时策略中的哪个将生效以监控该IT元件的
约束定义。约束定义充当过滤表达。例如,当在节点CI的具体的实例(即,将在基于拓扑的监
控系统的配置中的策略对象与表示要被管理的节点的CMDB中的对象(CI)相关联)上应用方
面300时,关于节点CI的OS属性的约束定义可以基于该节点的操作系统(例如,Windows、
Linux等)选择可应用策略,并因此仅在监控应用中配置正确的监控策略以管理该节点。管
理方面300还包括每个管理策略的修订版本306。
要理解的是,图3的图解不意图指示管理方面300将在每个情况中包括在图3中示
出的组件中的所有。另外,依赖于具体实现的细节,在方面300内可以包括任何数目的附加
组件。
图4是基于拓扑模式的监控系统和所监控的应用服务的示例的框图。基于拓扑模
式的监控系统400可以监控计算网络402。计算网络402可以包括应用服务404和应用服务器
406。计算网络还可以包括数据库408和一个或多个节点410。监控应用412根据监控配置监
控计算网络402的IT元件。除其它之外,监控应用412检查每个IT元件递送的服务的可用性
和性能(诸如应用服务404的响应时间、以及服务器410的CPU利用)。
当在计算网络402中发生变化之后,基于拓扑的监控系统416可以重新部署监控配
置。例如,当由第二网络项目(N2)代替第一网络项目N1时,在计算网络402中可以发生变化。
可以从计算网络402完全地移除N1并由N2代替N1,或者可以将数据库408从服务器N1移动到
N2。由于N1和N2被表示为在运行时间服务模型(CMDB)414中的配置项目(CI),因此在
CMDB414中识别配置项目中的变化。例如,可以通过使用针对变化连续地扫描计算网络402
的发现技术来识别在配置项目中的变化。
当识别从N1到N2的变化时,基于拓扑的监控系统416可以识别该变化匹配被与计
算网络402的应用服务404相关联的管理模板的拓扑模式。当基于拓扑的监控系统416识别
该变化匹配管理模板的拓扑模式时,基于拓扑的监控系统416可以自动地重新配置监控应
用412以调节监控配置从监控N1到监控N2。
如果检测到在所管理的IT系统的拓扑模式内的变化(例如,将数据库从N1移动到
N2),那么除了调节监控,基于拓扑的监控系统416还可以将至少一个管理模板(未示出)分
配到应用服务配置项目的新的实例。然后基于拓扑模式的监控系统416可以将管理模板应
用于新的应用服务,并根据管理模板的定义配置监控应用以监控应用服务和应用服务的IT
组件中的所有。
要理解的是,图4的框图不意图指示基于拓扑模式的监控系统400要在每个情况中
包括在图4中示出的组件的所有。另外,依赖于具体实现的细节,在基于拓扑模式的监控系
统400内可以包括任何数目的附加组件。
图5是基于拓扑模式的监控系统的示例的框图。基于拓扑模式的监控系统500可以
包括图形用户接口504。图形用户接口504可以针对至少一个域管理器506显示监控信息。域
管理器506可以包括无代理监控器508和其它类似的域管理器。每个无代理监控器508可以
管理多个配置项目。本文中描述的基于拓扑模式的监控系统500可以以独立式的方式或与
操作管理器502结合操作。基于拓扑模式的监控系统可以配置多个无代理监控器304。将在
图6中进一步解释无代理监控器与配置项目类型的交互和管理。
图形用户接口可以包括事件510管理和状态512窗口。事件510管理窗口可以显示
计算网络的健康,而状态512窗口可以提供针对每个受影响的配置项目的聚焦的视图。
要理解的是,图5的框图不意图指示基于拓扑模式的监控系统500要在每个情况中
包括在图5中示出的组件的所有。另外,依赖于具体实现的细节,在基于拓扑模式的监控系
统500内可以包括任何数目的附加组件。
图6是配置无代理监控应用的基于拓扑模式的监控系统的框图。根据一些示例,基
于拓扑模式的监控系统(TPBMS)600可以配置以基于代理的或无代理的方式操作的监控产
品。基于拓扑模式的监控系统可以在操作管理器602上运行。通常将基于代理的监控系统与
所管理的IT元件并置,而无代理监控应用运行在分离的服务器上并在网络连接上使用远程
访问管理该IT元件。由于基于拓扑模式的监控系统600不仅确定管理哪个IT元件(基于拓扑
模式)、而且确定选择负责监控IT元件604的哪个监控系统606,因此该远程访问对基于拓扑
模式的监控系统600强加了额外的挑战。在无代理监控系统中,如果在RTSM/CMDB上的管理
模板的拓扑模式指示要采用如由管理模板定义的特定的监控策略来监控网络项目,那么
TPBMS600确定正确的无代理监控。
要理解的是,图6的框图不意图指示基于拓扑模式的监控系统600要在每个情况中
包括在图6中示出的组件的所有。另外,依赖于具体实现的细节,在基于拓扑模式的监控系
统600内可以包括任何数目的附加组件。
图7是配置监控系统的方法的示例的过程流程图。可以由诸如基于拓扑模式的监
控系统126的监控系统来实现方法700。在块702,在监控系统中可以接收用户对管理模板到
CI的分配。可以由操作者分配或自动地分配管理模板。在一些示例中,可以将多个管理模板
分配到CI或可以将多个管理模板分配到多个CI。
在块704,可以识别相关CI。可以基于管理模板的拓扑模式识别相关CI。例如,可以
识别数据库的正确实例、应用的应用服务器的正确实例、主控应用服务器的节点实例、以及
主控数据库的节点。
在块706,可以识别与在管理模板的拓扑模式中的每个项目(CI)相关的监控方面。
监控方面是监控配置,并且是基于在计算网络中所辨识的监控配置。可以由操作者手动地
或自动地确定监控方面和它们的要被应用于管理CI的相关联的策略。
在块708,可以基于CI(或与该CI相关的其它CI)应用来自监控方面的策略约束,并
且可以确定用于应用于管理CI的方面策略。应用约束确保将只使用来自监控方面的可应用
的策略(例如,正确的操作系统)来监控CI。约束充当过滤器以选择来自监控方面的策略的
适当的子集(诸如基于在其上运行所管理的IT元件的操作系统)。
在块710,可以根据所确定的方面策略来配置监控应用以管理CI。基于拓扑模式的
监控系统可以根据拓扑模式确定所有的相关配置项目,识别与在特定的拓扑上下文中的网
络项目相关的所有的方面,并且相应地将监控策略部署到监控应用。在一些示例中,基于拓
扑模式的监控系统可以根据所识别的配置项目调节管理模板的配置。另外,可以更新拓扑
以便基于拓扑模式的监控系统连续地反映配置项目的最新状态。在示例中,可以经由图形
用户接口访问配置项目的状态。
要理解的是,图7的过程流程图不意图指示方法700要在每个情况中包括在图7中
示出的块的所有。另外,依赖于具体实现的细节,在方法700内可以包括任何数目的附加的
块。
图8是配置监控系统的方法的示例的过程流程图。在块802,可以在监控系统中接
收过滤器配置。过滤器充当对管理模板到配置项目的自动分配。可以由用户配置过滤器。用
户可以配置过滤器以选择CMDB的对象的子集。
在块804,可以将过滤器与管理模板相关联。可以由用户将过滤器与管理模板相关
联。在另一示例中,可以自动地将过滤器与管理模板相关联。在块806,可以将过滤器应用于
拓扑。监控系统可以连续地将过滤器应用于计算网络的拓扑。
在块808,可以将管理模板(MT)分配到匹配过滤器的对应于该MT的根CI的CI。可以
将该MT分配到匹配该过滤器的所有CI。例如,过滤器可以选择所有的应用服务对象以及它
们的相关的客户对象,其中客户重要性是“高”。在该示例中,过滤器返回拓扑的子集,并且
监控系统将MT分配到“应用服务”的所有实例(其为MT的根CI)。
在块810,可以确定监控系统配置。例如,可以如在上面描述的方法700的块704-
710中描述的那样确定监控系统配置。在块812,可以配置监控应用。可以根据在块810中确
定的配置来配置监控应用。
要理解的是,图8的过程流程图不意图指示方法800要在每个情况中包括在图8中
示出的块的所有。另外,依赖于具体实现的细节,在方法800内可以包括任何数目的附加的
块。
图9是重新配置监控系统的方法的示例的过程流程图。在块902,可以检测在CMDB
中的变化。在CMDB中的变化对应于在计算网络中的变化。所述变化除其它之外可以包括例
如配置变化、网络项目的添加、网络项目的排除、以及软件更新。可以通过使用针对变化连
续地扫描计算网络的发现技术来检测变化。
在块904,监控系统可以确定在其中将管理模板(MT)分配到配置项目(CI)的拓扑
的一部分中是否发生变化。如果变化没有发生在其中将MT分配到CI的拓扑的一部分中,那
么方法将在块906结束。
如果变化确实发生在其中将MT分配到CI的拓扑的一部分中,那么在块908,监控系
统可以确定变化的CI是否落入MT的拓扑模式的范围内。如果变化的CI没有落入MT的拓扑模
式的范围内,那么方法将在块910结束。如果变化的CI落入了MT的拓扑模式的范围内,那么
在块912监控系统可以确定新的监控系统配置。例如,基于拓扑模式的监控系统可以如在方
法700中描述的那样确定新的监控系统配置。在块914,可以重新配置监控系统。
要理解的是,图9的过程流程图不意图指示方法900要在每个情况中包括在图9中
示出的块的所有。另外,依赖于具体实现的细节,在方法900内可以包括任何数目的附加的
块。
图10是重新配置监控系统的方法的示例的过程流程图。可以由诸如基于拓扑模式
的监控系统126的监控系统来实现方法1000。在块1002,可以在计算网络中识别拓扑模式。
在块1004,可以针对拓扑模式的配置项目类型分配管理模板。可以由操作者分配
或自动地分配管理模板。在一些示例中,可以将多个管理模板分配到CI或者可以将多个管
理模板分配到多个CI。在块1006,可以将管理模板应用于配置项目类型的配置项目实例。
要理解的是,图10的过程流程图不意图指示方法1000要在每个情况中包括在图10
中示出的块的所有。另外,依赖于具体实现的细节,在方法1000内可以包括任何数目的附加
的块。
本示例可以易受到各种修改和替代形式,并且可以被提供仅用于说明性目的。例
如,本技术支持对数据结构高速缓冲存储器的读和写操作。另外,要理解的是,本技术不意
图被限制于本文中描述的特定的示例。实际上,随附的权利要求的范围被相信以包括对所
公开的主题所涉及的领域技术的人员来说显然的所有的替代、修改、以及等价。