《应用性能受影响的用户分布检测方法及系统.pdf》由会员分享,可在线阅读,更多相关《应用性能受影响的用户分布检测方法及系统.pdf(7页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102868548 A (43)申请公布日 2013.01.09 C N 1 0 2 8 6 8 5 4 8 A *CN102868548A* (21)申请号 201210288175.8 (22)申请日 2012.08.15 H04L 12/24(2006.01) H04L 12/26(2006.01) G06F 17/30(2006.01) (71)申请人苏州迈科网络安全技术股份有限公 司 地址 215021 江苏省苏州市工业园区金鸡湖 大道1355号国际科技园三期8B (72)发明人高华 姚春秋 (74)专利代理机构南京苏科专利代理有限责任 公司 32102 代。
2、理人陆明耀 陈忠辉 (54) 发明名称 应用性能受影响的用户分布检测方法及系统 (57) 摘要 本发明提供了一种应用性能受影响的用户分 布检测方法及系统,其中,所述方法包括:S1、将 用户根据IP划分区域,形成区域树;S2、设置访问 时间阈值,记录超过所述阈值的超时时间;S3、获 取并处理设备日志数据;S4、将处理后的日志数 据根据用户和域名聚类汇总,获取不同用户访问 不同域名的平均访问时间;S5、遍历区域树,对每 个节点上不同域名的访问时间进行汇总,求不同 域名平均访问时间,和所有域名的平均访问时间; S6、遍历区域树,通过计算检测受影响用户分布。 本发明可以准确的定位应用性能受影响用户的分。
3、 布情况,及时的发现网络性能不健康或潜在不健 康的用户区域,防止网络瘫痪。 (51)Int.Cl. 权利要求书2页 说明书3页 附图1页 (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 2 页 说明书 3 页 附图 1 页 1/2页 2 1.一种应用性能受影响的用户分布检测方法,其特征在于,所述方法包括: S1、将用户根据IP划分区域,形成区域树; S2、设置访问时间阈值,记录超过所述阈值的超时时间; S3、获取并处理设备日志数据; S4、将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平 均访问时间; S5、遍历区域树,对每个节点上不同域名的访问时。
4、间进行汇总,求不同域名平均访问时 间,和所有域名的平均访问时间; S6、遍历区域树,通过计算检测受影响用户分布。 2.根据权利要求1所述的应用性能受影响的用户分布检测方法,其特征在于,所述区 域树的的叶子节点为IP,根节点为整个局域网顶层设备。 3.根据权利要求1所述的应用性能受影响的用户分布检测方法,其特征在于,所述S3 步骤具体包括: 获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应 时间。 4.根据权利要求1所述的应用性能受影响的用户分布检测方法,其特征在于,所述S4 步骤包括: 将聚类汇总后的汇总值存储在区域树对应的叶子节点。 5.根据权利要求1所述的。
5、应用性能受影响的用户分布检测方法,其特征在于,所述S6 步骤包括: 根据计算结果标记所有区域树上的节点网络健康情况。 6.一种应用性能受影响的用户分布检测系统,其特征在于,所述系统包括: 划分单元,用于将用户根据IP划分区域,形成区域树; 设置单元,用于设置访问时间阈值,记录超过所述阈值的超时时间; 日志单元,用于获取并处理设备日志数据; 聚类单元,用于将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不 同域名的平均访问时间; 统计单元,用于遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名 平均访问时间,和所有域名的平均访问时间; 计算单元,用于遍历区域树,通过计算检测。
6、受影响用户分布。 7.根据权利要求6所述的应用性能受影响的用户分布检测系统,其特征在于,所述区 域树的的叶子节点为IP,根节点为整个局域网顶层设备。 8.根据权利要求6所述的应用性能受影响的用户分布检测系统,其特征在于,所述日 志单元具体用于: 获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应 时间。 9.根据权利要求6所述的应用性能受影响的用户分布检测系统,其特征在于,所述聚 类单元还用于: 将聚类汇总后的汇总值存储在区域树对应的叶子节点。 权 利 要 求 书CN 102868548 A 2/2页 3 10.根据权利要求6所述的应用性能受影响的用户分布检测系。
7、统,其特征在于,所述计 算单元还用于: 根据计算结果标记所有区域树上的节点网络健康情况。 权 利 要 求 书CN 102868548 A 1/3页 4 应用性能受影响的用户分布检测方法及系统 0001 【技术领域】 本发明涉及一种应用性能受影响的用户分布检测方法及系统,尤其是涉及一种基于数 据挖掘技术的应用性能受影响的用户分布检测方法及系统。 0002 【背景技术】 在一个大型局域网中,经常会出现局部网速比较慢甚至瘫痪的情况,影响正常的工作 和学习。然而,因当前没有这样一种技术,可对网络日志进行挖掘分析,获取应用性能受影 响用户的分布状况,故,无法优化受影响用户的网络,造成受影响用户的网络瘫痪。
8、。 0003 【发明内容】 为了解决上述问题,本发明的目的是提供一种应用性能受影响的用户分布检测方法。 该方法基于数据挖掘技术,通过对用户访问日志数据的挖掘和分析,获取网络性能较差用 户的分布区域,以便及时优化网络性能差分布区域用户的网络。 0004 本发明的另一目的是提供一种应用性能受影响的用户分布检测系统。 0005 其中,本发明一实施方式的应用性能受影响的用户分布检测方法包括以下步骤: S1、将用户根据IP划分区域,形成区域树; S2、设置访问时间阈值,记录超过所述阈值的超时时间; S3、获取并处理设备日志数据; S4、将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的。
9、平 均访问时间; S5、遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名平均访问时 间,和所有域名的平均访问时间; S6、遍历区域树,通过计算检测受影响用户分布。 0006 作为本发明的进一步改进,所述区域树的的叶子节点为IP,根节点为整个局域网 顶层设备。 0007 作为本发明的进一步改进,所述S3步骤具体包括: 获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应 时间。 0008 作为本发明的进一步改进,所述S4步骤包括: 将聚类汇总后的汇总值存储在区域树对应的叶子节点。 0009 作为本发明的进一步改进,所述S6步骤包括: 根据计算结果标记所。
10、有区域树上的节点网络健康情况。 0010 相应地,本发明一实施方式的应用性能受影响的用户分布检测系统包括: 划分单元,用于将用户根据IP划分区域,形成区域树; 设置单元,用于设置访问时间阈值,记录超过所述阈值的超时时间; 日志单元,用于获取并处理设备日志数据; 聚类单元,用于将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不 同域名的平均访问时间; 说 明 书CN 102868548 A 2/3页 5 统计单元,用于遍历区域树,对每个节点上不同域名的访问时间进行汇总,求不同域名 平均访问时间,和所有域名的平均访问时间; 计算单元,用于遍历区域树,通过计算检测受影响用户分布。 0011。
11、 作为本发明的进一步改进,所述区域树的的叶子节点为IP,根节点为整个局域网 顶层设备。 0012 作为本发明的进一步改进,所述日志单元具体用于: 获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL响应 时间。 0013 作为本发明的进一步改进,所述聚类单元还用于: 将聚类汇总后的汇总值存储在区域树对应的叶子节点。 0014 作为本发明的进一步改进,所述计算单元还用于: 根据计算结果标记所有区域树上的节点网络健康情况。 0015 相比于现有技术,本发明通过对海量日志的分析,可以准确的定位应用性能受影 响用户的分布情况,及时的发现网络性能不健康或潜在不健康的用户区域,防。
12、止网络瘫痪。 0016 【附图说明】 图1是本发明一实施例的应用性能受影响的用户分布检测方法的流程图; 图2是本发明一实施例的应用性能受影响的用户分布检测系统的模块图。 0017 【具体实施方式】 为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发 明进行详细描述。 0018 如图1所示,在本发明一实施方式中,应用性能受影响的用户分布检测方法,包括 以下步骤: S1、将用户根据IP划分区域,形成区域树;优选地,区域标记为Z1,Z11,Z12,Z2,Z22, 树的叶子节点为IP,根节点为整个局域网顶层设备,区域树命名为ZoneTree; S2、设置访问时间阈值RTT(Re。
13、quest time threshold),如果访问时间超过阈值,认为 是网络性能较差的用户,记录访问超时时间RTO(Request time out); S3、获取并处理设备日志数据,清理和裁剪数据,只保留用户信息、访问URL,以及URL 响应时间,提高下一步统计的效率,以及内存的利用率; S4、将处理后的日志数据根据用户和域名聚类汇总,获取不同用户访问不同域名的平 均访问时间,优选地,通过汇总条件的哈希算法进行数据归类,并求平均访问时间,将汇总 值存储在区域树对应的叶子节点; S5、二次统计,自底向上遍历区域树,对每个节点上不同域名的访问时间进行汇总,求 不同域名平均访问时间,和所有域名的。
14、平均访问时间; S6、自顶向下遍历区域树,通过计算检测受影响用户分布,计算公式为,影响用户区域: AVGRTT&MAXRTT&MAXRTO;健康度:(1-AVG/RTT)*100%;标记所有区域树上的节点网 络健康情况,如果父区域不健康且该区域的所有子区域都不健康,则标记父区域不健康,否 父区域健康,标记为不健康的字区域不健康,依次递归查找。 0020 综上所述,本发明通过对海量日志的分析,可以准确的定位应用性能受影响用户 的分布情况,及时的发现网络性能不健康或潜在不健康的用户区域,防止网络瘫痪。 0021 应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一 个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说 明书作为一个整体,各实施方式中的技术方案也可以经适当组合,形成本领域技术人员可 以理解的其他实施方式。 0022 上文所列出的一系列的详细说明仅仅是针对本发明的可行性实施方式的具体说 明,它们并非用以限制本发明的保护范围,凡未脱离本发明技艺精神所作的等效实施方式 或变更均应包含在本发明的保护范围之内。 说 明 书CN 102868548 A 1/1页 7 图1 图2 说 明 书 附 图CN 102868548 A 。