微服务系统根因定位方法、设备及存储介质.pdf

上传人:jo****n 文档编号:14526210 上传时间:2024-05-19 格式:PDF 页数:11 大小:1.65MB
收藏 版权申诉 举报 下载
微服务系统根因定位方法、设备及存储介质.pdf_第1页
第1页 / 共11页
微服务系统根因定位方法、设备及存储介质.pdf_第2页
第2页 / 共11页
微服务系统根因定位方法、设备及存储介质.pdf_第3页
第3页 / 共11页
文档描述:

《微服务系统根因定位方法、设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《微服务系统根因定位方法、设备及存储介质.pdf(11页完成版)》请在专利查询网上搜索。

1、(19)国家知识产权局(12)发明专利申请(10)申请公布号 (43)申请公布日 (21)申请号 202410006734.4(22)申请日 2024.01.03(71)申请人 安徽思高智能科技有限公司地址 230088 安徽省合肥市高新区望江西路900号中安创谷科技园A1栋408(72)发明人 张竞超张泽锟余螯王健(74)专利代理机构 武汉知产时代知识产权代理有限公司 42238专利代理师 朱佶(51)Int.Cl.G06F 11/07(2006.01)G06F 11/34(2006.01)(54)发明名称一种微服务系统根因定位方法、设备及存储介质(57)摘要本发明涉及一种微服务系统根因定位。

2、方法、设备及存储介质,方法包括步骤:生成微服务系统指标异常点事件;生成微服务系统审计日志异常点事件;对齐所述指标异常点事件与所述审计日志异常点事件;构建基于多维霍克斯过程的异常点事件因果图;推断因果图边权重;排序异常事件根因;本发明有益效果是:以离散事件的形式刻画了异常事件,实现了审计日志数据和指标数据的对齐,同时采用基于多维霍克斯过程的因果图构建方法进行根因定位工作,具有很好的可解释性和实用性。权利要求书2页 说明书5页 附图3页CN 117493068 A2024.02.02CN 117493068 A1.一种微服务系统根因定位方法,其特征在于:包括以下步骤:S1、生成微服务系统指标异常点。

3、事件;S2、生成微服务系统审计日志异常点事件;S3、对齐所述指标异常点事件与所述审计日志异常点事件;S4、构建基于多维霍克斯过程的异常点事件因果图;S5、推断因果图边权重;S6、排序异常事件根因。2.如权利要求1所述的一种微服务系统根因定位方法,其特征在于:步骤S1具体如下:S11、收集系统性能指标的时间序列数据,并按时间顺序排列;S12、使用STL分解系统所述时间序列数据,分解成趋势、季节性和残差三个部分;S13、对于步骤S12中分解出的残差,通过3Sigma方法界定残差范围,位于所述残差范围外的数据点为指标异常点,并触发报警,生成指标异常点事件;记录所述指标异常点事件发生的时间点,并记为指。

4、标异常事件序列,其中a和t分别表示报警类型和发生时间,Am表示不同类型的指标异常。3.如权利要求1所述的一种微服务系统根因定位方法,其特征在于:步骤S2具体为:将每个审计日志报警转化为一个审计日志报警事务序列,表示为,其中a和t分别表示报警类型和发生时间,表示审计日志异常类型集合;按照时间顺序将审计日志异常类型集合中的报警事件进行排列,得到微服务系统审计日志异常点事件。4.如权利要求2所述的一种微服务系统根因定位方法,其特征在于:步骤S3具体如下:S31、创建一个长度和指标异常事件序列长度相同的空序列用于存储对齐后的日志数据,其中Stmp的时间戳和Sm一致,事件类型值记为0;S32、遍历审计日。

5、志报警事务序列Sl条目,检查每个条目的时间戳t是否在指标异常事件序列Stmp包含的时间戳 (ti,ti+1)范围内;如果在,将时刻的值设为1,表示该审计日志报警事务序列在指标异常事件序列范围内,将审计日志报警事务序列与指标异常事件序列对齐;S33、用对齐后的Stmp替换Sl,组合Sm和Stmp得到最终事件集合S。5.如权利要求4所述的一种微服务系统根因定位方法,其特征在于:步骤S4具体如下:S41、对于最终事件集合S中的K个事件类型的多维霍克斯过程,每个事件类型i的强度函数i(t)表示为:其中,i(t)是事件类型i的基础强度,表示在没有其他事件影响的情况下,事件i在时刻t的发生率;ij是事件类。

6、型j对事件类型i的影响强度,ij是衰减系数,用于表示事件类型j的影响随时间的衰减速度;tj 是事件类型j的历史事件发生时刻;以ij作为构建加权图边的权重,根据最终事件序列S,获得初始的加权图G;S42、利用条件独立性测试从图G中去除(ai,aj)之间冗余的边和间接因果边。权利要求书1/2 页2CN 117493068 A26.如权利要求5所述的一种微服务系统根因定位方法,其特征在于:所述条件独立性测试,具体为:对于每一对警报事件 (ai,aj),使用CI测试来确定它们是否在给定条件下独立;假设CI测试的结果为CI(Ni,NjC)=1,其中C表示一组条件,则表示Ni和Nj在给定条件下独立,从图G。

7、中去除 (ai,aj)之间的边。7.如权利要求6所述的一种微服务系统根因定位方法,其特征在于:步骤S5具体为:S51、设定N(u)作为节点u的因果上下文集合,其中N(u)由与节点 u有因果关系的所有节点组成;S52、应用Skipgram模型生成嵌入向量;S53、对于任意两个节点 u和 v,计算它们的嵌入向量Zu和Zv之间的余弦相似度 cosine(Zu,Zv);S54、构建加权图G;将计算得到的边权重加入图 G,得到加权图G。8.如权利要求7所述的一种微服务系统根因定位方法,其特征在于:步骤S6具体如下:S61、对于图G中的每个节点 u,构建一个线性方程,表示节点 u 的影响力计算,方程如下:。

8、其中,Neighbors(u)表示节点 u的邻居节点集合;S62、将所有节点的线性方程组合并为一个包含n个变量的线性方程组,其中 n是图G中的节点数,通过求解这个线性方程组,得到每个节点u的影响力值r(u);S63:根据求解得到的节点影响力值r(u),对节点进行排名,排名值越高的节点表示在网络中具有更大的影响力,即视为导致系统异常的根因事件。9.一种存储介质,其特征在于:所述存储介质存储指令及数据用于实现权利要求18任一项所述的一种微服务系统根因定位方法。10.一种微服务系统根因定位设备,其特征在于:包括:处理器及存储介质;所述处理器加载并执行存储介质中的指令及数据用于实现权利要求18任一项所。

9、述的一种微服务系统根因定位方法。权利要求书2/2 页3CN 117493068 A3一种微服务系统根因定位方法、设备及存储介质技术领域0001本发明涉及智能运维领域,尤其涉及一种微服务系统根因定位方法、设备及存储介质。背景技术0002随着互联网和云计算的飞速发展,基于微服务的软件架构已成为软件高可用 性、可扩展性、弹性伸缩的代名词,大型软件系统借助微服务架构可以更好地进行软件开发设计、职责划分和业务支撑。在微服务系统中,智能运维是确保系统稳定性和性能优越性的关键。0003基于以上微服务根因定位的传统过程,在监控系统进行数据收集和汇总之后,需要人为进行介入和判断,在大型系统中,异常的发生通常呈现。

10、出复杂的表现状态,人为介入通常难以及时有效地捕获异常信息,更难以将异常信息进行有效利用,在整个过程中还参杂了大量的主观因素,最终导致错误判断的可能性激增,更难以及时有效地定位异常根因。发明内容0004为了更高效、更准确的对微服务系统异常根因进行定位,解决现有技术存在的上述定位缓慢、不精确的技术问题,本发明提出了一种微服务系统根因定位方法,该方法基于基于霍克斯过程,包括以下步骤:S1、生成微服务系统指标异常点事件;S2、生成微服务系统审计日志异常点事件;S3、对齐所述指标异常点事件与所述审计日志异常点事件;S4、构建基于多维霍克斯过程的异常点事件因果图;S5、推断因果图边权重;S6、排序异常事件。

11、根因。0005一种存储介质,所述存储介质存储指令及数据用于实现一种微服务系统根因定位方法。0006一种微服务系统根因定位设备,包括:处理器及所述存储介质;所述处理器加载并执行所述存储介质中的指令及数据用于实现一种微服务系统根因定位方法。0007本发明提供的有益效果是:以离散事件的形式刻画了异常事件,实现了审计日志数据和指标数据的对齐,同时采用基于多维霍克斯过程的因果图构建方法进行根因定位工作,具有很好的可解释性和实用性。附图说明0008图1是本发明方法流程示意图;图2是STL分解时间序列数据后的结果示意图;图3是本发明中删除冗余因果边的示意图;说明书1/5 页4CN 117493068 A4图。

12、4是本发明在基准微服务系统Bookinfo上测试的实施例;图5是本发明硬件设备工作示意图。具体实施方式0009为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地描述。0010请参考图1,图1是本发明方法流程的示意图;本发明提供的一种基于霍克斯过程的微服务系统根因定位方法,具体包括以下步骤:S1、生成微服务系统指标异常点事件;需要说明的是,步骤S1具体如下:S11、收集系统性能指标的时间序列数据,并按时间顺序排列;作为一种实施例而言,系统性能指标可以包括:各微服务实例的CPU利用率、内存使用率、网络流量等。当然,在一些其它实施例中,也可以包括其它指标。同时需要说明。

13、的是,确保指标数据是按时间顺序进行排列的。0011S12、使用STL分解系统所述时间序列数据,分解成趋势、季节性和残差三个部分;请参考图2,图2是STL分解时间序列数据后的结果示意图。0012需要说明的是,STL(Seasonal and Trend decomposition using Loess)是一个非常通用和稳健强硬的分解时间序列的方法,其中Loess是一种估算非线性关系的方法。0013STL也是将时间序列分解成三个主要分量:趋势、季节项和残差。STL使用LOESS(locally estimated scatterplot smoothing)来提取三个分量的平滑估计,该方法的实现。

14、可以在python中进行。0014作为一种实施例而言,可以通过调用statsmodels类库的STL方法来实现。0015S13、对于步骤S12中分解出的残差,通过3Sigma方法界定残差范围,位于所述残差范围外的数据点为指标异常点,并触发报警,生成指标异常点事件。0016作为一种实施例而言,3Sigma方法具体如下:计算残差数据序列的平均值()和标准偏差(),然后确定上下限(上限为+3,下限为3),具体如下式:0017式中,Xi表示第i个时间序列数据点,N表示数据总量。0018作为一种实施例,记录所述指标异常点事件发生的时间点,并记为指标异常事件序列,其中a和t分别表示报警类型和发生时间,Am。

15、表示不同类型的指标异常。0019S2、生成微服务系统审计日志异常点事件;需要说明的是,步骤S2具体为:将每个审计日志报警转化为一个审计日志报警事务序列,表示为,其中a和t分别表示报警类型和发生时间,表示审计日志异常类型集合;按照时间顺序将审计日志异常类型集合中的报警事件进行排列,得到微服务系统审说明书2/5 页5CN 117493068 A5计日志异常点事件。0020作为一种实施例,在审计日志报警事务序列中,记录其中报警类型a为“runc、error、init”等的审计记录上述异常事件发生的时间段,将该时间段的异常值设为1。当然,在一些其它实施例中,报警类型a还可以为其它类型。0021S3、对。

16、齐所述指标异常点事件与所述审计日志异常点事件;作为一种实施例而言,步骤S3具体如下:S31、创建一个长度和指标异常事件序列长度相同的空序列用于存储对齐后的日志数据,其中Stmp的时间戳和Sm一致,事件类型值记为0;0022S32、遍历审计日志报警事务序列Sl条目,检查每个条目的时间戳t是否在指标异常事件序列Stmp包含的时间戳 (ti,ti+1)范围内;如果在,将时刻的值设为1,表示该审计日志报警事务序列在指标异常事件序列范围内,将审计日志报警事务序列与指标异常事件序列对齐;0023S33、用对齐后的Stmp替换Sl,组合Sm和Stmp得到最终事件集合S。0024S4、构建基于多维霍克斯过程的。

17、异常点事件因果图;作为一种实施例,步骤S4具体如下:需要说明的是,步骤S41中使用了无惩罚的多维Hawkes过程来捕捉报警类型之间的影响强度。0025S41、对于最终事件集合S中的K个事件类型的多维霍克斯过程,每个事件类型i的强度函数i(t)表示为:0026其中,i(t)是事件类型i的基础强度,表示在没有其他事件影响的情况下,事件i在时刻t的发生率;ij是事件类型j对事件类型i的影响强度,ij是衰减系数,用于表示事件类型j的影响随时间的衰减速度;tj是事件类型j的历史事件发生时刻;需要说明的是,在霍克斯过程中,事件类型i和j之间的影响强度由参数ij决定。如果ij为正,表示事件类j的发生会增加事。

18、件类型i的发生概率。因此,ij可以作为构建加权图边的权重。0027本申请中,以ij作为构建加权图边的权重,根据最终事件序列S,获得初始的加权图G;需要说明的是,在该图中,每个事件类型i和j之间的边(u,v)上的正权重ij表示事件v发生后,事件u发生的期望,反映了事件v对事件u的影响程度。保留仅具有正向影响的边,即ij0的边,以关注具有实质性影响的事件关系。0028S42、利用条件独立性测试从图G中去除(ai,aj)之间冗余的边和间接因果边。0029请参考图3,图3是本发明中删除冗余因果边的示意图。0030作为一种实施例而言,所述条件独立性测试,具体为:对于每一对警报事件 (ai,aj),使用C。

19、I测试来确定它们是否在给定条件下独立;假说明书3/5 页6CN 117493068 A6设CI测试的结果为CI(Ni,NjC)=1,其中C表示一组条件,则表示Ni和Nj在给定条件下独立,从图G中去除 (ai,aj)之间的边。0031S5、推断因果图边权重;需要说明的是,步骤S5具体为:S51、设定N(u)作为节点u的因果上下文集合,其中N(u)由与节点u有因果关系的所有节点组成;S52、应用Skipgram模型生成嵌入向量;作为一种实施例而言,对于每个节点u,使用Skipgram模型,将N(u)作为输入,得到节点u的嵌入向量。00320033其中,Skipgram(N(u)表示将因果上下文集合。

20、N(u)应用于Skipgram模型得到的向量表示。0034S53、对于任意两个节点u和v,计算它们的嵌入向量Zu和Zv之间的余弦相似度cosine(Zu,Zv);作为一种实施例而言,其中,EdgeWeight(u,v)表示节点u和v之间的边权重,基于它们的嵌入向量余弦相似度计算得出。0035S54、构建加权图G;将计算得到的边权重加入图G,得到加权图G。其中,。0036S6、排序异常事件根因。0037需要说明的是,步骤S6具体如下:S61、对于图G中的每个节点u,构建一个线性方程,表示节点 u 的影响力计算,方程如下:其中,Neighbors(u)表示节点u的邻居节点集合;0038S62、将所。

21、有节点的线性方程组合并为一个包含n个变量的线性方程组,其中n是图G中的节点数,通过求解这个线性方程组,得到每个节点u的影响力值r(u);S63:根据求解得到的节点影响力值r(u),对节点进行排名,排名值越高的节点表示在网络中具有更大的影响力,即视为导致系统异常的根因事件。0039作为一种实施例,请参考图4,图4是本发明在基准微服务系统Bookinfo上测试的实施例。0040从图4中将本发明方法与经典因果方法进行了对比,从图4中可以看出本发明所提出的根因定位方法优于其他基线方法,其中PRk表示最终排序前k个事件命中真实根因的精确率。0041请参考图5,图5是本发明硬件设备工作示意图。0042所述。

22、硬件设备具体包括:一种微服务系统根因定位设备401、处理器402及存储介质403。说明书4/5 页7CN 117493068 A70043一种微服务系统根因定位设备401:所述一种微服务系统根因定位设备401实现所述一种微服务系统根因定位方法。0044处理器402:所述处理器402加载并执行所述存储介质403中的指令及数据用于实现所述一种微服务系统根因定位方法。0045存储介质403:所述存储介质403存储指令及数据;所述存储介质403用于实现所述一种微服务系统根因定位方法。0046综合来看,本发明的有益效果是:构建点事件能够个离散的指标数据可能表示了一个设备的状态(比如正常、警告、错误),这。

23、样的数据更容易理解和解释,无需深入了解连续数值的变化。同时实现了实现了审计日志数据和指标数据的对齐,消除了不同模态数据的差异。融合多模态数据构建基于霍克斯过程的因果图,能够刻画事件之间的因果关系,具有一定的可解释性。3 解决了现有技术存在的上述定位缓慢、不精确的技术问题。0047以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。说明书5/5 页8CN 117493068 A8图1说明书附图1/3 页9CN 117493068 A9图2图3图4说明书附图2/3 页10CN 117493068 A10图5说明书附图3/3 页11CN 117493068 A11。

展开阅读全文
内容关键字: 微服 系统 定位 方法 设备 存储 介质
关于本文
本文标题:微服务系统根因定位方法、设备及存储介质.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/14526210.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1