云化系统健康检测的方法和系统.pdf

上传人:le****a 文档编号:10138042 上传时间:2021-06-05 格式:PDF 页数:12 大小:707.58KB
收藏 版权申诉 举报 下载
云化系统健康检测的方法和系统.pdf_第1页
第1页 / 共12页
云化系统健康检测的方法和系统.pdf_第2页
第2页 / 共12页
云化系统健康检测的方法和系统.pdf_第3页
第3页 / 共12页
文档描述:

《云化系统健康检测的方法和系统.pdf》由会员分享,可在线阅读,更多相关《云化系统健康检测的方法和系统.pdf(12页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010862472.3 (22)申请日 2020.08.25 (71)申请人 北京思特奇信息技术股份有限公司 地址 100086 北京市海淀区中关村南大街6 号14层 (72)发明人 李耀昌 (74)专利代理机构 北京汇信合知识产权代理有 限公司 11335 代理人 林聪源 (51)Int.Cl. G06F 11/22(2006.01) (54)发明名称 一种云化系统健康检测的方法和系统 (57)摘要 本发明公开了一种云化系统健康检测的方 法和系统, 涉及计算机技术领域, 。

2、所述云化系统 包括至少两个子系统, 所述子系统包括至少一个 单元, 所述方法包括: 通过一个子系统的每个单 元分别向另一个子系统的每个单元发送检测请 求; 根据所述请求检测所述请求的接收单元, 获 取检测结果; 将所述结果返回给所述请求的发送 单元; 根据返回的结果判断云化系统的健康状 态。 通过返回结果缺失或延时的情况判断发送单 元、 接收单元或连接线路的健康状态, 从而判断 云化系统的总体健康状态; 通过检测每条连接线 路, 检测云化系统的健康; 便于快速定位、 快速分 析云化系统的故障点。 权利要求书2页 说明书5页 附图4页 CN 112131058 A 2020.12.25 CN 1。

3、12131058 A 1.一种云化系统健康检测的方法, 其特征在于, 所述云化系统包括至少两个子系统, 所 述子系统包括至少一个单元, 所述方法包括: 通过一个子系统的每个单元分别向另一个子系统的每个单元发送检测请求; 根据所述请求检测所述请求的接收单元, 获取检测结果; 将所述结果返回给所述请求的发送单元; 根据返回的结果判断云化系统的健康状态。 2.根据权利要求1所述的云化系统健康检测的方法, 其特征在于, 所述检测请求包括检 测任务, 根据所述请求检测接收单元的方法包括: 所述接收单元执行所述检测任务, 并向所述发送单元返回执行结果; 根据所述发送单元是否接收到执行结果或接收执行结果的时。

4、间判断接收单元的健康 状态。 3.根据权利要求2所述的云化系统健康检测的方法, 其特征在于, 所述检测任务包括以 下任务之一或它们的组合: 存储数据、 读取数据、 数据计算或执行操作。 4.根据权利要求2所述的云化系统健康检测的方法, 其特征在于, 所述执行操作包括获 取所述接收单元的负载情况。 5.根据权利要求1所述的云化系统健康检测的方法, 其特征在于, 所述单元包括节点 和/或实例。 6.根据权利要求1所述的云化系统健康检测的方法, 其特征在于, 所述发送单元根据接 收单元的地址和端口发送检测请求。 7.根据权利要求1所述的云化系统健康检测的方法, 其特征在于, 还包括异常告警的方 法:。

5、 获取没有接收到或超时接收到返回结果的异常接收单元; 根据所述异常接收单元及其返回结果的情况向管理员发送告警信息。 8.根据权利要求1所述的云化系统健康检测的方法, 其特征在于, 所述云化系统包括第 一系统、 第二系统和第三系统, 所述第一系统与第二系统连接, 所述第二系统和第三系统连 接, 所述云化系统健康检测方法包括: 所述第一系统的单元向第二系统的每个单元发送第一检测请求; 所述第二系统的接收单元响应所述第一检测请求, 获取第一检测结果; 向第一系统的发送单元返回第一检测结果; 所述第二系统的单元向第三系统的每个单元发送第二检测请求; 所述第三系统的接收单元响应所述第二检测请求, 获取第。

6、二检测结果; 向所述第二系统的发送单元返回第二检测结果; 根据所述第一检测结果或第二检测结果的返回情况判断接收单元的健康; 根据接收单元的健康判断所述云化系统的健康状态。 9.一种云化系统健康检测的系统, 其特征在于, 包括检测管理模块和检测执行模块, 所述云化系统包括至少两个子系统, 所述子系统包括至少一个单元, 所述检测管理模块用于通过一个子系统的每个单元分别向另一个子系统的每个单元 发送检测请求, 用于根据返回的结果判断云化系统的健康状态; 所述检测执行模块用于根据所述请求检测所述请求接收单元, 获取检测结果, 用于将 权利要求书 1/2 页 2 CN 112131058 A 2 所述结。

7、果返回给所述请求的发送单元。 10.根据权利要求9所述的云化系统健康检测的系统, 其特征在于, 还包括告警模块, 所述告警模块用于获取没有接收到或超时接收到返回结果的异常接收单元; 根据所述 异常接收单元及其返回结果的情况向管理员发送告警信息。 权利要求书 2/2 页 3 CN 112131058 A 3 一种云化系统健康检测的方法和系统 技术领域 0001 本发明涉及计算机技术领域, 具体涉及一种云化系统健康检测的方法和系统。 背景技术 0002 云技术(Cloud technology)是基于云计算应用的网络技术、 信息技术、 整合技术、 管理平台技术、 应用技术等的总称, 可以组成资源池。

8、, 按需所用, 灵活便利。 云计算技术已变 成生产和商业领域的重要支撑。 现有的应用和服务器系统已逐渐替换为云化系统, 云化系 统的特点是不依赖单个单元的稳定性, 通过互备管理机制保障整个云化系统。 然而, 云化系 统的单个单元的稳定性较非云化系统的单个应用或服务器的稳定性差, 单个单元的管理难 度大且实时运营情况不易管控, 整个云化系统在随机性调度中, 不容易发现部分坏的单元。 0003 目前, 单元通常通过单元是否能正常连接来衡量单元的健康状态, 然而在实际应 用中, 单元虽然能正常连接, 却可能无法正常受理业务。 发明内容 0004 针对现有技术存在的上述技术问题, 本发明提供一种云化系。

9、统健康检测的方法和 系统, 以检测系统单元的健康, 从而确定云化系统的健康状态。 0005 本发明公开了一种云化系统健康检测的方法, 所述云化系统包括至少两个子系 统, 所述子系统包括至少一个单元, 所述方法包括: 通过一个子系统的每个单元分别向另一 个子系统的每个单元发送检测请求; 根据所述请求检测所述请求的接收单元, 获取检测结 果; 将所述结果返回给所述请求的发送单元; 根据返回的结果判断云化系统的健康状态。 0006 优选的, 所述检测请求包括检测任务, 根据所述请求检测接收单元的方法包括: 0007 所述接收单元执行所述检测任务, 并向所述发送单元返回执行结果; 0008 根据所述发。

10、送单元是否接收到执行结果或接收执行结果的时间判断接收单元的 健康状态。 0009 优选的, 所述检测任务包括以下任务之一或它们的组合: 存储数据、 读取数据、 数 据计算或执行操作。 0010 优选的, 所述执行操作包括获取所述接收单元的负载情况。 0011 优选的, 所述单元包括节点和/或实例。 0012 优选的, 所述发送单元根据接收单元的地址和端口发送检测请求。 0013 优选的, 本发明的方法还包括异常告警的方法: 0014 获取没有接收到或超时接收到返回结果的异常接收单元; 0015 根据所述异常接收单元及其返回结果的情况向管理员发送告警信息。 0016 优选的, 所述云化系统包括第。

11、一系统、 第二系统和第三系统, 所述第一系统与第二 系统连接, 所述第二系统和第三系统连接, 所述云化系统健康检测方法包括: 0017 所述第一系统的单元向第二系统的每个单元发送第一检测请求; 0018 所述第二系统的接收单元响应所述第一检测请求, 获取第一检测结果; 说明书 1/5 页 4 CN 112131058 A 4 0019 向第一系统的发送单元返回第一检测结果; 0020 所述第二系统的单元向第三系统的每个单元发送第二检测请求; 0021 所述第三系统的接收单元响应所述第二检测请求, 获取第二检测结果; 0022 向所述第二系统的发送单元返回第二检测结果; 0023 根据所述第一检。

12、测结果或第二检测结果的返回情况判断接收单元的健康; 0024 根据接收单元的健康判断所述云化系统的健康状态。 0025 本发明还提供一种云化系统健康检测的系统, 包括检测管理模块和检测执行模 块, 0026 所述云化系统包括至少两个子系统, 所述子系统包括至少一个单元, 0027 所述检测管理模块用于通过一个子系统的每个单元分别向另一个子系统的每个 单元发送检测请求, 用于根据返回的结果判断云化系统的健康状态; 0028 所述检测执行模块用于根据所述请求检测所述请求接收单元, 获取检测结果, 用 于将所述结果返回给所述请求的发送单元。 0029 优选的, 本发明的系统还包括告警模块, 0030。

13、 所述告警模块用于获取没有接收到或超时接收到返回结果的异常接收单元; 根据 所述异常接收单元及其返回结果的情况向管理员发送告警信息。 0031 与现有技术相比, 本发明的有益效果为: 0032 坏的单元无法响应检测请求, 或响应速度慢于正常值, 造成返回结果的缺失或延 时, 通过返回结果缺失或延时的情况判断发送单元、 接收单元或连接线路的健康状态, 从而 判断云化系统的总体健康状态; 一个子系统的每个单元分别对另一个子系统的每个单元进 行检测, 涉及两个或多个系统的交互, 构成笛卡尔积检测的方法, 通过检测每条连接线路, 检测云化系统的健康; 便于快速定位、 快速分析云化系统的故障点。 附图说。

14、明 0033 图1是本发明的云化系统健康检测的方法流程图; 0034 图2是根据所述请求检测接收单元的方法流程图; 0035 图3是异常告警的方法流程图; 0036 图4是实施例2的云化系统健康检测方法流程图; 0037 图5是实施例2的云化系统的逻辑框图; 0038 图6是实施例3的逻辑框图; 0039 图7是本发明的云化系统健康检测系统的逻辑框图。 具体实施方式 0040 为使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本发明实施例 中的附图, 对本发明实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例是 本发明的一部分实施例, 而不是全部的实施例。 基于本发。

15、明中的实施例, 本领域普通技术人 员在没有做出创造性劳动的前提下所获得的所有其他实施例, 都属于本发明保护的范围。 0041 下面结合附图对本发明做进一步的详细描述: 0042 一种云化系统健康检测的方法, 如图1所示, 所述云化系统包括至少两个子系统, 说明书 2/5 页 5 CN 112131058 A 5 所述子系统包括至少一个单元, 所述方法包括: 0043 步骤101: 通过一个子系统的每个单元分别向另一个子系统的每个单元发送检测 请求。 一个完整的业务流程, 涉及多个系统的多次交互, 可以在梳理业务流程中获取每个交 互子过程, 通常每个交互子过程包含调用方单元和服务方单元。 云化系。

16、统可以包括云服务 器和/或云应用系统, 其中, 单元可以是节点和/或实例, 可以将实例分为单节点实例和副本 集实例, 单节点实例架构在一个节点上, 副本集实例提供多个节点供用户访问。 其中, 根据 业务的划分, 一个子系统定义为调用方, 另一个子系统定义为服务方。 0044 步骤102: 根据所述请求检测所述请求的接收单元, 获取检测结果。 检测请求的发 送方定义为发送单元, 检测请求的接收方定义为接收单元。 0045 步骤103: 将所述结果返回给所述请求的发送单元。 0046 步骤104: 根据返回的结果判断云化系统的健康状态。 0047 坏的单元无法响应检测请求, 或响应速度慢于正常值,。

17、 造成返回结果的缺失或延 时, 通过返回结果缺失或延时的情况判断发送单元、 接收单元或连接线路的健康状态, 从而 判断云化系统的总体健康状态; 一个子系统的每个单元分别对另一个子系统的每个单元进 行检测, 涉及两个或多个系统的交互, 构成笛卡尔积检测的方法, 通过检测每条连接线路, 检测云化系统的健康; 便于快速定位、 快速分析云化系统的故障点。 应当指出的是, 具体实 施中, 可以简化检测请求的检测逻辑, 或在闲时执行本发明的方法, 避免对云化系统造成负 担, 影响正常业务的执行。 0048 其中, 所述检测请求可以包括检测任务, 如图2所示, 根据所述请求检测接收单元 的方法包括: 004。

18、9 步骤201: 所述接收单元执行所述检测任务, 并向所述发送单元返回执行结果。 检 测任务以下任务之一或它们的组合: 存储一段数据返回存储目录、 读取一段数据、 简单计 算、 执行一段操作。 其中操作任务可以是获取接收单元的负载情况, 如CPU和内存的使用情 况, 检测任务的逻辑可以根据业务类型进行调整或选择, 逻辑可以简化。 0050 步骤202: 根据所述发送单元是否接收到执行结果或接收执行结果的时间判断接 收单元的健康状态。 正确接收到执行结果时, 判断接收单元的健康状态良好, 没有接收到正 确执行结果或超时接收到时, 判断接收单元健康状状不佳, 可以通过接收单元的健康状态 判断云化系。

19、统的健康状态。 不限于此, 执行结果的返回情况也可以用于判断发送单元、 接收 单元以及两者之间链路的健康状态。 0051 其中, 所述发送单元根据接收单元的地址和端口发送检测请求。 0052 实施例1 0053 如图3, 本实施例提供异常告警的方法: 0054 步骤301: 获取没有接收到或超时接收到返回结果的异常检测线路, 所述检测线路 包括发送单元和接收单元。 0055 步骤302: 根据所述异常检测线路及其返回结果的情况向管理员发送告警信息。 可 以通过短信、 邮件或即时聊天工具发送告警信息。 便于管理员即时了解坏单元的情况, 并及 时作出处理。 管理员可以通过重启接收单元或其它技术手段。

20、进行修复。 0056 实施例2 0057 如图4, 所述云化系统的子系统包括第一系统、 第二系统和第三系统, 所述第一系 说明书 3/5 页 6 CN 112131058 A 6 统与第二系统连接, 所述第二系统和第三系统连接, 所述云化系统健康检测方法包括: 0058 步骤401: 所述第一系统的每个单元向第二系统的每个单元发送第一检测请求。 如 图5, 第一系统的单元A1、 A2和A3, 分别向第二系统的单元B1、 B2和B3发送第一检测请求, 其 检测线路为: A1-B1、 A1-B2、 A1-B3; A2-B1、 A2-B2、 A2-B3; A3-B1、 A3-B2、 A3-B3。 0。

21、059 步骤402: 所述第二系统的接收单元响应所述第一检测请求, 获取第一检测结果。 0060 步骤403: 向第一系统的发送单元返回第一检测结果。 0061 步骤404: 所述第二系统的每个单元向第三系统的每个单元发送第二检测请求。 第 二系统的单元B1、 B2和B3, 分别向第三系统的单元C1、 C2和C3发送第二检测请求。 0062 步骤405: 所述第三系统的接收单元响应所述第二检测请求, 获取第二检测结果。 0063 步骤406: 向所述第二系统的发送单元返回第二检测结果。 0064 步骤407: 根据所述第一检测结果或第二检测结果的返回情况判断接收单元的健 康。 0065 步骤4。

22、08: 根据接收单元的健康判断所述云化系统的健康状态。 0066 云化系统的检测方法构成笛卡尔积检测法。 0067 实施例3 0068 如图6所示, 云化系统包括管理系统、 ESB系统、 云订单中心、 云资源中心和云用户 中心, 其中管理系统包括管理节点, ESB系统包括节点1、 节点2和节点3, 云订单中心、 云资源 中心和云用户中心分别设有3个实例, 为便于查看, 仅示出节点1的检测线路。 其中管理系统 与ESB系统连接, ESB系统分别与云订单中心、 云资源中心和云用户中心连接。 0069 管理节点设有检测管理模块, ESB系统的节点、 云订单中心的实例、 云资源中心的 实例和云用户中心。

23、的实例分别设有检测执行模块。 0070 检测管理模块通过轮巡调用的方式调用ESB系统节点的第一检测执行模块, 检测 管理模块通过节点的IP地址和端口调用第一检测执行模块, 第一检测执行模块将检测结果 返回给检测管理模块。 ESB系统的节点的第一检测执行模块依次调用云订单中心、 云资源中 心和云用户中心的实例的第二检测执行模块, 所述第二检测执行模块将执行结果通过第一 检测执行模块发送给检测管理模块。 0071 本发明还提供一种云化系统健康检测的系统, 如图6和图7所示, 包括检测管理模 块1和检测执行模块2, 0072 所述云化系统包括至少两个子系统, 所述子系统包括至少一个单元, 0073 。

24、检测管理模块1用于通过一个子系统的每个单元分别向另一个子系统的每个单元 发送检测请求, 用于根据返回的结果判断云化系统的健康状态; 0074 检测执行模块2用于根据所述请求检测所述请求的接收单元, 获取检测结果, 用于 将所述结果返回给所述请求的发送单元。 具体的, 返回给检测管理模块1。 0075 所述云化系统健康检测的系统还可以包括告警模块3, 告警模块3用于获取没有接 收到或超时接收到返回结果的异常接收单元; 根据所述异常接收单元及其返回结果的情况 向管理员发送告警信息。 0076 本发明提供的方法的检测频率可以根据云化系统的承载能力及其可承受异常时 限进行综合评估, 云化系统有负载压力。

25、时, 检测量可以设置在总业务量的1以下, 可以在 负载闲时提高检测频率, 忙时降低检测频率。 说明书 4/5 页 7 CN 112131058 A 7 0077 以上仅为本发明的优选实施例而已, 并不用于限制本发明, 对于本领域的技术人 员来说, 本发明可以有各种更改和变化。 凡在本发明的精神和原则之内, 所作的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。 说明书 5/5 页 8 CN 112131058 A 8 图1 图2 图3 说明书附图 1/4 页 9 CN 112131058 A 9 图4 图5 说明书附图 2/4 页 10 CN 112131058 A 10 图6 说明书附图 3/4 页 11 CN 112131058 A 11 图7 说明书附图 4/4 页 12 CN 112131058 A 12 。

展开阅读全文
内容关键字: 系统 健康 检测 方法
关于本文
本文标题:云化系统健康检测的方法和系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10138042.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1