轨迹异常检测方法和系统.pdf

上传人:小** 文档编号:10579963 上传时间:2021-06-24 格式:PDF 页数:29 大小:2.48MB
收藏 版权申诉 举报 下载
轨迹异常检测方法和系统.pdf_第1页
第1页 / 共29页
轨迹异常检测方法和系统.pdf_第2页
第2页 / 共29页
轨迹异常检测方法和系统.pdf_第3页
第3页 / 共29页
文档描述:

《轨迹异常检测方法和系统.pdf》由会员分享,可在线阅读,更多相关《轨迹异常检测方法和系统.pdf(29页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010330737.5 (22)申请日 2020.04.24 (71)申请人 中国人民解放军国防科技大学 地址 410003 湖南省长沙市开福区德雅路 109号 (72)发明人 汤俊阮逸润秦婉亭老松杨 白亮 (74)专利代理机构 北京风雅颂专利代理有限公 司 11403 代理人 曾志鹏 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 50/26(2012.01) G06K 9/62(2006.01) (54)发明名称 轨迹异常检测方法和系统 (57。

2、)摘要 本发明的一个或多个实施例公开了一种轨 迹异常检测方法和系统。 所述轨迹异常检测方法 包括: 采样得到待检测轨迹的轨迹点后, 根据每 个轨迹点的空间和时间状态, 从采样的轨迹点中 提取特征点; 根据提取的特征点对所述待检测轨 迹进行分段; 将分段得到的轨迹段与预先得到的 正常、 异常模式轨迹段进行比较, 根据比较结果 识别出异常的轨迹段; 其中, 所述正常、 异常模式 轨迹段是通过对训练集中的轨迹段进行聚类后 得到的; 所述训练集中的轨迹段是根据历史轨迹 的轨迹点的空间和时间状态提取特征点并对所 述历史轨迹分段后得到的。 应用上述轨迹异常检 测方法和系统能够检测出更符合实际情况的异 常轨。

3、迹。 权利要求书3页 说明书17页 附图8页 CN 111242521 A 2020.06.05 CN 111242521 A 1.一种轨迹异常检测方法, 其特征在于, 包括: 采样得到待检测轨迹的轨迹点后, 根据每个轨迹点的空间和时间状态, 从采样的轨迹 点中提取特征点: 若所述轨迹中第 个轨迹点和第 个轨迹点 满足以下2个条件, 则判断为特征点; 其中, ; 根据提取的特征点对所述待检测轨迹进行分段; 将分段得到的轨迹段与预先得到的正常、 异常模式轨迹段进行比较, 根据比较结果识 别出异常的轨迹段; 其中, 所述2个条件为: 条件1:和为特征点的最小描述长度MDL代价小于等于和不是特征点的。

4、代 价; 条件2:和为特征点的状态离散指标小于等于设定的阈值; 其中, 所述正常、 异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的; 所述 训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史 轨迹分段后得到的。 2.根据权利要求1所述的方法, 其特征在于, 所述和为特征点的状态离散指标 的计算公式如下: 其中, 各轨迹点的时间状态参数指标用来衡量轨迹随着时间的 变化状态发生的变化;m代表时间状态参数的个数, 为轨迹中的 第k个子轨迹段,表示子轨迹段的m个时间状态参数中第 个时间状态参数的值, 表示 个子轨迹段第 个时间状态参数的平均值。 3.根据权利要求2所述。

5、的方法, 其特征在于, 所述轨迹包括飓风的轨迹, 所述轨迹点的 时间状态参数指标, 其中表示最大持续风速, 表示中心最低气压; ; 其中, 代表由轨迹点形成的多个子轨迹段的最大持续风速的均值, 代 表由轨迹点形成的多个子轨迹段的中心最低气压的均值,为子轨迹段的 最大持续风速, 为子轨迹段的中心最低气压; 其中, 一个子轨迹段是通过连接相邻轨迹 点形成的。 4.根据权利要求2所述的方法, 其特征在于, 所述正常、 异常模式轨迹段是通过对训练 集中的轨迹段进行聚类后得到的, 包括: 对所述训练集中的任意两个轨迹段, 根据这两个轨迹段的时间、 空间状态, 计算这两个 权利要求书 1/3 页 2 CN。

6、 111242521 A 2 轨迹段之间的时空状态距离; 根据计算出的轨迹段之间的时空状态距离, 对轨迹段进行聚类。 5.根据权利要求4所述的方法, 其特征在于, 所述根据这两个轨迹段的时间、 空间状态, 计算这两个轨迹段之间的时空状态距离包括: 根据如下公式八计算两个轨迹段之间的时空状态距离: (公式八) 其中,表示轨迹段和轨迹段之间的距离; 其中, 表示的是轨迹段和轨迹段之间的空 间距离; 、 分别表示轨迹段和轨迹段之间的空间垂直距离、 平行距离和角度 距离; 、 、 是根据和的空间状态计算得到; 其中,;表示轨迹段 和轨迹段的第k个时间状态参数之间的距离;表示轨迹段的第k个时间状态参 数。

7、的平均值,表示轨迹段的第k个时间状态参数的平均值。 6.根据权利要求4所述的方法, 其特征在于, 所述根据计算出的轨迹段之间的时空状态 距离, 对轨迹段进行聚类包括: 根据所述训练集中的轨迹段之间的时空状态距离, 确定所述训练集中每个轨迹段的 - 近邻; 其中, 为设定的近邻阈值; 对于所述训练集中每个轨迹段, 统计该轨迹段的 -近邻总数, 作为该轨迹段的密度值; 并判断该轨迹段的密度值是否小于密度阈值; 若是, 则确定该轨迹段为低密度轨迹 段, 否则确定该轨迹段为高密度轨迹段; 对于所述训练集中的每个高密度轨迹段, 判断该轨迹段是否为其它高密度轨迹段的 - 近邻; 若是, 则将两者聚类为同一。

8、簇的轨迹段, 并将两者确认为聚类得到的正常模式轨迹 段; 对于所述训练集中的每个低密度轨迹段, 判断该该轨迹段是否为任一高密度轨迹段的 -近邻; 若否, 则确认该低密度轨迹段为异常模式轨迹段。 7.根据权利要求4所述的方法, 其特征在于, 所述将分段得到的轨迹段与预先得到的正 常、 异常模式轨迹段进行比较, 根据比较结果识别出异常的轨迹段包括: 对于分段得到的每个轨迹段, 根据该轨迹段的空间和时间状态, 计算该轨迹段与各正 常、 异常模式轨迹段之间的时空状态距离, 并根据计算出的时空状态距离, 确定该轨迹段的 -近邻; 根据该轨迹段的 -近邻中的正常、 异常模式轨迹段数量, 判断该轨迹段是否为。

9、异常 的轨迹段; 其中, 为设定的近邻阈值。 8.根据权利要求1-7任一所述的方法, 其特征在于, 在所述识别出异常的轨迹段后, 还 包括: 在所述异常的轨迹段中进行细粒度异常检测: 对于识别出的异常的轨迹段, 依次连接该轨迹段的起始点之间的轨迹点, 得到该轨迹 段的各子轨迹段; 权利要求书 2/3 页 3 CN 111242521 A 3 针对每个子轨迹段, 将该子轨迹段的起点与所述异常的轨迹段的起点相连得到该子轨 迹段的前分段, 将该子轨迹段的终点与所述异常的轨迹段的起点相连得到该子轨迹段的后 分段; 将该子轨迹段的前、 后分段与预先得到的正常、 异常模式轨迹段进行比较, 根据比较 结果若。

10、确认该子轨迹段的前、 后分段均为正常, 则判断该子轨迹段为正常; 否则, 判断该子 轨迹段为异常。 9.一种轨迹异常检测系统, 其特征在于, 包括: 特征点提取模块, 用于采样得到待检测轨迹的轨迹点后, 根据每个轨迹点的空间和时 间状态, 从采样的轨迹点中提取特征点: 若所述轨迹中第 个轨迹 点和第 个轨迹点满足以下2个条件, 则判断为特征点; 其中, ; 轨迹分段模块, 用于根据提取的特征点对所述待检测轨迹进行分段, 得到所述待检测 轨迹的轨迹段; 异常轨迹段识别模块, 用于将所述待检测轨迹的轨迹段与预先得到的正常、 异常模式 轨迹段进行比较, 根据比较结果识别出异常的轨迹段; 其中, 所述。

11、2个条件为: 条件1:和为特征点的最小描述长度MDL代价小于等于和不是特征点的代 价; 条件2: 和为特征点的状态离散指标小于等于设定的阈值; 其中, 所述正常、 异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的; 所述 训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史 轨迹分段后得到的。 10.一种电子设备, 包括存储器、 处理器及存储在存储器上并可在处理器上运行的计算 机程序, 其特征在于, 所述处理器执行所述程序时实现如权利要求1-8任一所述的方法。 权利要求书 3/3 页 4 CN 111242521 A 4 轨迹异常检测方法和系统 技术领域 0001。

12、 本发明涉及轨迹检测技术领域, 特别是指一种轨迹异常检测方法和系统。 背景技术 0002 飓风破坏力极强, 每年造成严重人员伤亡和财产损失。 从大量的轨迹数据中挖掘 出异常轨迹模式来预防突发事件的发生具有十分重要的意义。 0003 TRAOD(Trajectory Outlier Detection Algorithm)算法是一种经典的异常轨迹 检测算法, 该算法首先采用两种分段粒度将每条轨迹分为若干轨迹线段, 然后, 在基于距 离的异常检测方法的基础上, 引入调整系数的概念, 采用密度与距离相结合的方法进行异 常轨迹检测。 0004 然而, 在实际应用中, 通过上述TRAOD算法检测出的飓风。

13、异常轨迹与实际情况的符 合效果不佳; 因此, 有必要提供一种飓风异常轨迹方法, 可以相比于经典的TRAOD算法更加 符合实际情况。 发明内容 0005 有鉴于此, 本发明的一个或多个实施例提供了一种轨迹异常检测方法和系统, 能 够检测出更符合实际情况的异常轨迹。 0006 上述轨迹异常检测方法包括: 采样得到待检测轨迹的轨迹点后, 根据每个轨迹点的空间和时间状态, 从采样的轨迹 点中提取特征点; 若所述轨迹中第 个轨迹点和第个轨迹点 满足以下2个条件, 则判断为特征点; 其中, ; 根据提取的特征点对所述待检测轨迹进行分段; 将分段得到的轨迹段与预先得到的正常、 异常模式轨迹段进行比较, 根据。

14、比较结果识 别出异常的轨迹段; 其中, 所述2个条件为: 条件1:和为特征点的最小描述长度MDL代价小于等于和不是特征点的代 价; 条件2: 和为特征点的状态离散指标小于等于设定的阈值; 其中, 所述正常、 异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的; 所述 训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史 轨迹分段后得到的。 0007较佳地, 所述和为特征点的状态离散指标的计算公式如 下: 说明书 1/17 页 5 CN 111242521 A 5 其中, 各轨迹点的时间状态参数指标用来衡量轨迹随着时间的变 化状态发生的变化;m代表时间状态参数的个数,。

15、 为轨迹中的第 k个子轨迹段,表示子轨迹段的m个时间状态参数中第 个时间状态参数的值, 表 示 个子轨迹段第 个时间状态参数的平均值。 0008较佳地, 所述轨迹具体为飓风的轨迹, 所述轨迹点的时间状态参数指标, 其中表示最大持续风速, 表示中心最低气压; ; 其中, 代表由轨迹点形成的多个子轨迹段的最大持续风速的均值, 代表由轨迹点形成的多个子轨迹段的中心最低气压的均值,为子轨迹段 的最大持续风速, 为子轨迹段的中心最低气压; 其中, 一个子轨迹段是通过连接相邻 轨迹点形成的。 0009 较佳地, 所述正常、 异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到 的, 具体包括: 对所述训练。

16、集中的任意两个轨迹段, 根据这两个轨迹段的时间、 空间状态, 计算这两个 轨迹段之间的时空状态距离; 根据计算出的轨迹段之间的时空状态距离, 对轨迹段进行聚类。 0010 较佳地, 所述根据这两个轨迹段的时间、 空间状态, 计算这两个轨迹段之间的时空 状态距离, 具体包括: 根据如下公式八计算两个轨迹段之间的时空状态距离: (公式八) 其中,表示轨迹段和轨迹段之间的距离; 其中, 表示的是轨迹段和轨迹段之间的 空间距离; 、 、 分别表示轨迹段和轨迹段之间的空间垂直距离、 平行距离和角 度距离; 、 是根据和的空间状态计算得到; 其中,;表示轨迹段 和轨迹段的第k个时间状态参数之间的距离;表示。

17、轨迹段的第k个时间状态参 数的平均值,表示轨迹段的第k个时间状态参数的平均值。 0011 较佳地, 所述根据计算出的轨迹段之间的时空状态距离, 对轨迹段进行聚类, 具体 说明书 2/17 页 6 CN 111242521 A 6 包括: 根据所述训练集中的轨迹段之间的时空状态距离, 确定所述训练集中每个轨迹段的 - 近邻; 其中, 为设定的近邻阈值; 对于所述训练集中每个轨迹段, 统计该轨迹段的 -近邻总数, 作为该轨迹段的密度值; 并判断该轨迹段的密度值是否小于密度阈值; 若是, 则确定该轨迹段为低密度轨迹 段, 否则确定该轨迹段为高密度轨迹段; 对于所述训练集中的每个高密度轨迹段, 判断该。

18、轨迹段是否为其它高密度轨迹段的 - 近邻; 若是, 则将两者聚类为同一簇的轨迹段, 并将两者确认为聚类得到的正常模式轨迹 段; 对于所述训练集中的每个低密度轨迹段, 判断该该轨迹段是否为任一高密度轨迹段的 -近邻; 若否, 则确认该低密度轨迹段为异常模式轨迹段。 0012 较佳地, 所述将分段得到的轨迹段与预先得到的正常、 异常模式轨迹段进行比较, 根据比较结果识别出异常的轨迹段, 具体包括: 对于分段得到的每个轨迹段, 根据该轨迹段的空间和时间状态, 计算该轨迹段与各正 常、 异常模式轨迹段之间的时空状态距离, 并根据计算出的时空状态距离, 确定该轨迹段的 -近邻; 根据该轨迹段的 -近邻中。

19、的正常、 异常模式轨迹段数量, 判断该轨迹段是否为异常 的轨迹段; 其中, 为设定的近邻阈值。 0013 较佳地, 在所述识别出异常的轨迹段后, 还包括: 在所述异常的轨迹段中进行细粒 度异常检测: 对于识别出的异常的轨迹段, 依次连接该轨迹段的起始点之间的轨迹点, 得到该轨迹 段的各子轨迹段; 针对每个子轨迹段, 将该子轨迹段的起点与所述异常的轨迹段的起点相连得到该子轨 迹段的前分段, 将该子轨迹段的终点与所述异常的轨迹段的起点相连得到该子轨迹段的后 分段; 将该子轨迹段的前、 后分段与预先得到的正常、 异常模式轨迹段进行比较, 根据比较 结果若确认该子轨迹段的前、 后分段均为正常, 则判断。

20、该子轨迹段为正常; 否则, 判断该子 轨迹段为异常。 0014 本发明的一个或多个实施例还提供一种轨迹异常检测系统, 包括: 特征点提取模块, 用于采样得到待检测轨迹的轨迹点后, 根据每个轨迹点的空间和时 间状态, 从采样的轨迹点中提取特征点: 若所述轨迹中第 个轨 迹点和第个轨迹点满足以下2个条件, 则判断为特征点; 其中,; 轨迹分段模块, 用于根据提取的特征点对所述待检测轨迹进行分段, 得到所述待检测 轨迹的轨迹段; 异常轨迹段识别模块, 用于将所述待检测轨迹的轨迹段与预先得到的正常、 异常模式 轨迹段进行比较, 根据比较结果识别出异常的轨迹段; 其中, 所述2个条件为: 条件1:和为特。

21、征点的最小描述长度MDL代价小于等于和不是特征点的代 价; 说明书 3/17 页 7 CN 111242521 A 7 条件2:和为特征点的状态离散指标小于等于设定的阈值; 其中, 所述正常、 异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到的; 所述 训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所述历史 轨迹分段后得到的。 0015 本发明的一个或多个实施例还提供一种电子设备, 包括存储器、 处理器及存储在 存储器上并可在处理器上运行的计算机程序, 其中, 所述处理器执行所述程序时实现如上 所述的轨迹异常检测方法。 0016 本发明的技术方案中, 在采样得到待检测。

22、轨迹的轨迹点后, 根据每个轨迹点的空 间和时间状态, 从采样的轨迹点中提取特征点; 根据提取的特征点对所述待检测轨迹进行 分段; 将分段得到的轨迹段与预先得到的正常、 异常模式轨迹段进行比较, 根据比较结果识 别出异常的轨迹段; 其中, 所述正常、 异常模式轨迹段是通过对训练集中的轨迹段进行聚类 后得到的; 所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点 并对所述历史轨迹分段后得到的。 0017 这样, 在分段阶段考虑了时间因素的影响, 通过轨迹状态的约束来分段, 从而发现 轨迹行为变化特别大的特征点, 并通过这些点将轨迹划分为若干轨迹段, 既能够减少运算 数据又能有效地。

23、保持轨迹局部特征, 同时又不会丢失轨迹的全局特征; 使得分段的轨迹更 符合轨迹状态的变化, 在分段结果上更具有实际意义; 而且, 在训练正常、 异常模式轨迹段的聚类阶段也考虑了时间因素的影响, 并据此重新 定义轨迹段间测距离计算对分段后的轨迹聚类, 最后根据聚类结果的正常、 异常模式轨迹 段进行异常检测, 使得检测的异常轨迹更符合轨迹状态的变化, 更加符合实际情况。 0018 进一步, 在异常检测阶段采用两级异常轨迹检测方法, 首先通过第一级粗粒度的 异常检测找到异常的轨迹分段, 其次通过第二级细粒度的异常检测检测异常的子轨迹。 通 过针对1999-2012年大西洋飓风数据进行仿真实验, 实验。

24、结果表明上述两级异常轨迹检测 方法检测的异常轨迹更加符合飓风状态的变化, 更加符合实际情况。 附图说明 0019 为了更清楚地说明本发明实施例或现有技术中的技术方案, 下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本 发明的一些实施例, 对于本领域普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以 根据这些附图获得其他的附图。 0020 图1为本发明的一个或多个实施例提供的轨迹异常检测方法流程图; 图2a为本发明的一个或多个实施例提供的一种飓风轨迹示意图; 图2b、 2c分别为通过本发明的一个或多个实施例提供的轨迹异常检测方法、 现有。

25、MDL方 法进行的轨迹分段得到的分段轨迹示意图; 图2d为通过本发明的一个或多个实施例提供的轨迹异常检测方法、 现有MDL方法得到 的分段轨迹对比图; 图2e为本发明的一个或多个实施例提供的一种飓风的原始轨迹图; 图2f为通过本发明的一个或多个实施例提供的轨迹异常检测方法得到的分段轨迹的 示意图; 说明书 4/17 页 8 CN 111242521 A 8 图3a为本发明的一个或多个实施例提供的一种识别出异常的轨迹段的方法流程图; 图3b为本发明的一个或多个实施例提供的一种轨迹段之间的空间距离示意图; 图4为本发明的一个或多个实施例提供的一种从异常的轨迹段中检测出异常的子轨迹 段的方法流程图;。

26、 图5a为本发明的一个或多个实施例提供的一种该子轨迹段的前、 后分段示意图; 图5b为本发明的一个或多个实施例提供的两级异常轨迹检测方法的异常轨迹检测结 果示意图; 图5c为TRAOD异常检测方法的异常轨迹检测结果示意图; 图6为本发明的一个或多个实施例提供的一种训练出正常、 异常模式轨迹的方法流程 图; 图7为本发明的一个或多个实施例提供的一种对轨迹段进行聚类的方法流程图; 图8为本发明的一个或多个实施例提供的一种根据计算出的轨迹段之间的时空状态距 离, 对轨迹段进行聚类的方法流程图; 图9为本发明的一个或多个实施例提供的一种轨迹异常检测系统的内部结构框图; 图10为本发明的一个或多个实施例。

27、提供的一种电子设备硬件结构示意图。 具体实施方式 0021 为使本发明的目的、 技术方案和优点更加清楚明白, 以下结合具体实施例, 并参照 附图, 对本发明的一个或多个实施例进一步详细说明。 0022 需要说明的是, 除非另外定义, 本发明的实施例使用的技术术语或者科学术语应 当为本公开所属领域内具有一般技能的人士所理解的通常意义。 本公开中使用的 “第一” 、 “第二” 以及类似的词语并不表示任何顺序、 数量或者重要性, 而只是用来区分不同的组成 部分。“包括” 或者 “包含” 等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词 后面列举的元件或者物件及其等同, 而不排除其他元件或者物。

28、件。“连接” 或者 “相连” 等类 似的词语并非限定于物理的或者机械的连接, 而是可以包括电性的连接, 不管是直接的还 是间接的。“上” 、“下” 、“左” 、“右” 等仅用于表示相对位置关系, 当被描述对象的绝对位置改 变后, 则该相对位置关系也可能相应地改变。 0023 通过对现有的TRAOD算法进行分析, 发现该方法注重空间上轨迹的变化, 在计算轨 迹距离时只考虑了轨迹垂直距离、 平行距离和角度距离, 而忽略了轨迹在时间上的变化; 但 在实际应用中, 轨迹在时间上的变化也是衡量轨迹是否异常的标准。 0024 因此, 本发明的一个或多个实施例的技术方案, 在分段和聚类阶段考虑了时间因 素的。

29、影响, 通过轨迹状态的约束来分段, 然后重新定义轨迹段间测距离计算对分段后的轨 迹聚类, 最后根据聚类的结果进行异常检测。 0025 进一步, 本发明的一个或多个实施例的技术方案, 在异常检测阶段采用两级异常 轨迹检测方法, 首先通过第一级粗粒度的异常检测找到异常的轨迹分段, 其次通过第二级 细粒度的异常检测检测异常的子轨迹。 通过针对1999-2012年大西洋飓风数据进行仿真实 验, 实验结果表明本发明实施例提出的基于状态约束的轨迹分段的技术方案检测的异常轨 迹更加符合飓风状态的变化, 本发明提出的异常检测方法检测出的异常轨迹同经典的 TRAOD相比更加符合实际情况。 说明书 5/17 页 。

30、9 CN 111242521 A 9 0026 下面结合附图详细说明本发明一个或多个实施例的技术方案。 0027 本发明一个或多个提供的轨迹异常检测方法, 具体流程如图1所示, 包括如下步 骤: 步骤S101: 采样得到待检测轨迹的轨迹点后, 根据每个轨迹点的空间和时间状态, 从采 样的轨迹点中提取特征点。 0028 具体地, 轨迹(trajectory)是多维度空间下有序的点的集合, 可记为 , 其中是采样得到的多维度的轨迹点, 是轨 迹所包含的轨迹点的数目, 对于不同轨迹,值可能不一样。 轨迹用线段可以表示为 , 其中为第 个子轨迹段, 对于采样 点数目为 的轨迹包含1个子轨迹段。 002。

31、9 现有技术通常采用MDL (Minimum Description Length, 最小描述长度) 准则来判 断轨迹点是否为特征点; MDL包括两个部分:和。 是给定的假设, 是训练 数据,是知道假设时数据的最优编码。 在轨迹划分问题中对一组特定的轨 迹, 找到最优分段, 即可以使用MDL准则: 对于一个待检测轨迹, 假设这条轨迹的一系列的特征点为 , 那么,的计算如公式一所示,的计算如公式二 所示,代表点和点的欧式距离。 0030 (公式一) (公式二) 其中, 表示垂直距离, 表示角度距离。 0031 然而, 通过研究发现, MDL准则只是考虑到轨迹的空间距离和方向上的变化而忽略 了轨迹。

32、时间上的变化, 轨迹时间上的变化可以通过采样的轨迹点的时间状态参数来体现。 由于轨迹在某些位置上的状态会发生变化, 如飓风登陆时最大持续风速, 中心最低气压等 状态, 这些状态发生重大变化的点也具有重要的研究价值。 因此本发明的一个或多个实施 例在提取特征点时除了考虑轨迹在空间位置上的变化, 同时也考虑了轨迹在时间状态上的 变化。 0032本发明的实施例提出轨迹点的时间状态参数指标来衡量轨迹 随着时间的变化状态发生的变化, 其中m代表时间状态参数的个数。 本发明实施例采取的实 验数据是大西洋飓风数据, 该采样得到的轨迹点数据包含最大持续风速和中心气压等信 息, 因此采取这两个时间状态参数来表示。

33、采样的轨迹点在时间上的变化, 即, 其 中表示最大持续风速, 表示中心最低气压。 0033在本发明的一个或多个实施例中, 定义: 子轨迹段的最大持续风速, 说明书 6/17 页 10 CN 111242521 A 10 为子轨迹段 起点的最大持续风速和子轨迹段 终点的最大持续风速的平均 值, 即; 子轨迹段的中心最低气压, 为子轨迹段 起点的中心最低气压和 子轨迹段 终点的中心最低气压的平均值, 即; 状态离散指标, 用于刻画多个子轨迹段 之间轨迹状态的稳定程度, 的值越大表示轨迹状态越不稳定, 计算公式如公式三所示: (公式三) 其中,表示子轨迹段 的m个时间状态参数中第 个时间状态参数的值。

34、, 表示 个子轨迹段第个时间状态参数的平均值。 例如, 对于时间状态参数只有最大持续风速和 中最低心气压两个参数值的情况, 则上述状态离散指标的计算如公式四所示: (公式四) 其中, 代表多个子轨迹线段最大持续风速的均值, 代表多个子轨迹线段中心最低 气压的均值。 例如, 对于轨迹, 和的值分别为, 。 0034本步骤中, 对于采样得到的轨迹点形成的待检测轨迹, 根据每个轨迹点的空间和时间状态提取特征点时, 可以根据如下方法判断采样得到的轨迹 点是否为特征点: 采样得到的第 个轨迹点和第个轨迹点, 其中 , 当且仅当满足以下2个条 件时, 判断为特征点; 条件1:和为特征点的MDL代价要小于等。

35、于和不是特征点的代价, 即 ; 其中,; 表示点和点的欧式距离。 0035条件2:和为特征点的状态离散指标小于等于设定的阈值 , 即。 0036其中,; 为中的 第k个子轨迹段; 各轨迹点的时间状态参数指标用来衡量轨迹随着时 说明书 7/17 页 11 CN 111242521 A 11 间的变化状态发生的变化;m代表时间状态参数的个数, 为轨迹 中的第k个子轨迹段,表示子轨迹段的m个时间状态参数中第 个时间状态参数的 值, 表示 个子轨迹段第 个时间状态参数的平均值, 。 0037若轨迹点的时间状态参数指标, 则, 其中, 代表由轨迹点形成的多个子轨迹段的最大持续风速的均值, 代表由 轨迹点。

36、形成的多个子轨迹段的中心最低气压的均值,为子轨迹段的最大 持续风速, 为子轨迹段的中心最低气压; 其中, 一个子轨迹段是通过连接相邻轨迹点形 成的。 0038 步骤S102: 根据提取的特征点对所述待检测轨迹进行分段, 得到所述待检测轨迹 的各轨迹段。 0039 具体地, 由于一般轨迹的数据非常庞大, 因此通过发现轨迹行为变化特别大的特征点, 并通过这些点将轨迹划分为若干轨迹段, 既能够减少运算数据又能有效地保持轨迹局部特征, 同时又不会丢失轨迹的全局特征。 由此, 本步骤中, 在待检测轨迹 的各轨迹点中确定了特征点后, 依次连接特征点形成各轨迹段; 也就是说, 连接两个相邻的 特征点可以形成。

37、一个轨迹段; 依次连接特征点从而得到待检测轨迹的各轨迹段。 0040 例如, 对如图2a所示的飓风轨迹, 采用本发明一个或多个实施例所述的方法提取 特征点并分段得到如图2b所示的轨迹段, 其中提取的特征点为: 0, 7, 12, 18, 22, 23, 24, 25, 26, 27, 30, 33, 34, 35, 39, 42, 43, 44, 45, 49, 51; 采用现有的MDL分方法提取特征点并分段得 到如图2c所示的轨迹段, 其中提取的特征点为: 0, 7, 12, 18, 22, 34, 39, 43, 46, 50, 51。 0041 图2d表示的是轨迹点22到轨迹点34, 本。

38、发明实施例提出的轨迹异常检测方法和 MDL方法选取的特征点的对比。 本发明实施例所提出的方法选取的特征点是22, 23, 24, 25, 26, 27, 30, 33, 34, 得到的分段轨迹如图2d中实线所示; MDL方法提取的特征点为22, 34, 得到 的分段轨迹如图2d中虚线所示。 根据萨菲尔-辛普森飓风量级(Saffir-Simpson Hurricane Wind Scale, SSHS), 如表1所示, 本发明的实施例把每一个子轨迹段对应的飓风等级进行 划分, 结果如下表2所示。 (注(26,27)和(32,33)的轨迹最大持续风速均超过136节, 飓风强 度属于5级, 但是其中。

39、心最低气压过高属于4级, 因此把这两段的飓风强度定义为4-5级)。 0042 表2 说明书 8/17 页 12 CN 111242521 A 12 本发明实施例提出的分段方法将轨迹点22到轨迹点34之间的轨迹分成了如下8段, 其 中; ;。 从分段结果和 表2对应的飓风等级进行分析, 属于1级飓风, 属于二级飓风, 属于三级飓风, 属于 4级飓风, 属于4-5级飓风, 属于5级飓风和4级飓风, 属于4级飓风, 属于5级飓风。 因此可以看出本发明实施例提出的分段方法大致把属于同一等级的飓风划分成一段, MDL 方法分段后的轨迹尽管在空间上保持一致, 但是在该轨迹段中飓风所处的状态不同。 不同 的。

40、飓风等级对环境所产生的影响是不同的, 因此本发明实施例提出的轨迹分段方法更符合 飓风状态的变化, 在分段结果上更具有实际意义。 0043 图2e所示为1990-2009年飓风的原始轨迹图, 图2f为采用本发明实施例提出的上 述提取特征点并分段的方法得到的飓风轨迹图。 从图2f中可以看出分段后的飓风轨迹和原 始轨迹几乎一致, 但是分段后的轨迹的在数量级上和原始轨迹是不一样的。 原始轨迹有 8469个子轨迹, 通过分段后得到2896条轨迹段, 轨迹段压缩到原始轨迹的34.2%, 这就提高 了轨迹聚类的速率, 同时分段也保存了轨迹在时间和空间上的局部特性。 0044 步骤S103: 将分段得到的所述。

41、待检测轨迹的各轨迹段与预先得到的正常、 异常模 式轨迹段进行比较, 根据比较结果识别出异常的轨迹段。 0045 具体地, 所述正常、 异常模式轨迹段是通过对训练集中的轨迹段进行聚类后得到 的; 所述训练集中的轨迹段是根据历史轨迹的轨迹点的空间和时间状态提取特征点并对所 述历史轨迹分段后得到的; 所述正常、 异常模式轨迹段的生成方法将在后续详细介绍。 0046 对于所述待检测轨迹的每个轨迹段, 可以根据如图3a所示的方法流程, 识别出异 常的轨迹段, 具体包括如下子步骤: 子步骤S301: 对于当前处理的一个待检测轨迹的轨迹段, 根据该轨迹段的空间和时间 状态, 计算该轨迹段与各正常、 异常模式。

42、轨迹段之间的时空状态距离。 0047 具体地, 轨迹段之间的匹配程度可以通过两者之间的距离来确定, 首先给出如下 说明书 9/17 页 13 CN 111242521 A 13 定义: 对于如图3b所示轨迹段和, 两者之间的垂直距离()如公式五 所示: (公式五) 其中代表的端点之一到线段的垂直距离;代表的另一端点到线段 的垂直距离; 的长度大于; 、 为的两个端点; 、 为的两个端点; 和的平行距离如公式六所示: (公式六) 其中是点到的距离,是点到线段的垂足;是点到的距离, 是点到线段的垂足。 0048和的角度距离如公式七所示: (公式七) 其中是的长度, 是和之间的夹角。 0049表示轨。

43、迹段和轨迹段之间的距离; 在现有技术中, 仅仅是轨迹段和轨迹段之间的空间距离, 而本发明实施例定义的除了具 有空间特性外还具有时间特征, 表示轨迹段和轨迹段之间的时空状态距离, 计算公式 如公式八所示: (公式八) 其中, 表示的是轨迹段和轨迹段之 间的空间距离;、分别表示轨迹段和轨迹段之间的空间垂直距离、 平行距离 和角度距离; 、可以根据和的空间状态, 分别依据上述公式五、 六、 七计算得 到; 其中 ,; 表示轨迹段和轨迹段的第k个时间状态参数之间的距离;表示轨迹段的第k 个时间状态参数的平均值,表示轨迹段的第k个时间状态参数的平均值。 说明书 10/17 页 14 CN 1112425。

44、21 A 14 具体为轨迹段起点的第k个时间状态参数和轨迹段终点的第k个时间状态参数的平均 值;具体为轨迹段起点的第k个时间状态参数和轨迹段终点的第k个时间状态 参数的平均值。 0050例如, 对于飓风轨迹, 轨迹点的, 其中表示最大持续风速, P表示中心 最低气压, 则; 其中,;、 分别表示轨迹段、 轨迹段的最大持续风速均值;、分别表示轨迹段 、 轨迹段的中心最低气压均值。 0051 本子步骤中, 对于每个正常模式轨迹段, 可以根据该正常模式轨迹段的空间和时 间状态, 与当前处理的轨迹段的空间和时间状态, 依据上述公式八计算该正常模式轨迹段 与当前处理的轨迹段之间的时空状态距离; 对于每个。

45、异常模式轨迹段, 可以根据该异常模式轨迹段的空间和时间状态, 与当前处 理的轨迹段的空间和时间状态, 依据上述公式八计算该异常模式轨迹段与当前处理的轨迹 段之间的时空状态距离。 0052 子步骤S302: 根据计算出的当前处理的轨迹段与各正常、 异常模式轨迹段之间的 时空状态距离, 确定该轨迹段的 -近邻。 0053 具体地, 首先给出如下定义: 定义轨迹段的 -近邻集( -neighbor): 对于轨迹段, 如果存在轨迹段, 满足 , 则为的 -近邻, 属于的 -近邻集( -neighbor), 记作; 其中, 为设定的近邻阈值; 定义轨迹段的密度值: 对于轨迹段, 该轨迹段的 -近邻的个数。

46、为该轨迹段的密度 值; 若该轨迹段的密度值大于或等于则该轨迹段为高密度的轨迹段, 否则该轨迹段 为低密度的轨迹段;为设定的密度阈值; 定义核心轨迹段: 对于轨迹段, 如果该轨迹段的 -近邻至少有个, 即 , 则称轨迹段为核心轨迹段。 0054由此, 本子步骤中, 对于每个正常模式轨迹段, 若当前处理的轨迹段与该正常模 式轨迹段之间的时空状态距离小于 , 则判断该正常模式轨迹段为当前处 理的轨迹段的 -近邻, 属于的 -近邻集; 对于每个异常模式轨迹段, 若当前处理的轨迹段与该异常模式轨迹段之间的时 空状态距离小于 , 则判断该异常模式轨迹段为当前处理的轨迹段的 -近 说明书 11/17 页 1。

47、5 CN 111242521 A 15 邻, 属于的 -近邻集。 0055 子步骤S303: 根据当前处理的轨迹段的 -近邻中的正常、 异常模式轨迹段数量, 判 断该轨迹段是否为异常的轨迹段。 0056具体地, 可以根据如下公式九计算当前处理的轨迹段为异常轨迹段的概率: (公式九) 其中代表的 -近邻中正常、 异常模式轨迹段总数,为 的 -近邻中异常模式轨迹段数量; 若或者, 则判断该轨迹段为异 常, 否则判断该轨迹段为正常; 其中,为设置的异常阈值。 0057 步骤S104: 在识别出的异常的轨迹段中进行细粒度异常检测。 0058 更优地, 在识别出的异常的轨迹段后, 还可进一步在异常的轨迹。

48、段中进行细粒度 异常检测; 也就是说, 作为一种更优的实施方式, 本发明的实施例采用两级异常检测, 其中, 上述步骤S103是第一级粗粒度异常检测, 实现对分段后的轨迹段进行异常检测, 而本步骤 是第二级细粒度异常检测, 是对识别出的异常的轨迹段对应的原始轨迹中的每一个子轨迹 段进行异常检测; 从而实现两级异常轨迹检测。 0059本步骤中, 从识别出的异常的轨迹段中检测出异常的子轨迹段, 具体流程如 图4所示, 可包括如下子步骤: 子步骤S401: 对于识别出的异常的轨迹段, 依次连接该轨迹段的起始点之间的轨迹点, 得到该轨迹段的各子轨迹段; 具体地, 当检测到轨迹段为异常时, 对待检测轨迹中。

49、, 依次连接该轨迹段的起始点之间的轨迹点, 得到该轨迹段的各子轨迹段。 0060 子步骤S402: 针对每个子轨迹段, 根据该子轨迹段的前、 后分段与预先得到的正 常、 异常模式轨迹段的比较结果, 判断该子轨迹段是否异常。 0061 具体地, 本子步骤中, 针对每个子轨迹段, 将该子轨迹段的起点与所述异常的轨迹 段的起点相连得到该子轨迹段的前分段, 将该子轨迹段的终点与所述异常的轨迹段的起点 相连得到该子轨迹段的后分段; 例如, 如图5a所示, 通过子轨迹段的起始点与轨迹段 的起始点的连接形成前分段, 通过子轨迹段 的终点与轨迹段的起始点连接形 成后分段; 将该子轨迹段的前分段与预先得到的正常。

50、、 异常模式轨迹段进行比较, 根据比较结果, 确认该子轨迹段的前分段是否异常; 其中, 将子轨迹段的前分段与预先得到的正常、 异常模 式轨迹段进行比较、 识别是否异常的方法与上述步骤S103中详述的方法一样, 此处不再赘 述。 0062 将该子轨迹段的后分段与预先得到的正常、 异常模式轨迹段进行比较, 根据比较 说明书 12/17 页 16 CN 111242521 A 16 结果, 确认该子轨迹段的后分段是否异常; 其中, 将子轨迹段的后分段与预先得到的正常、 异常模式轨迹段进行比较、 识别是否异常的方法与上述步骤S103中详述的方法一样, 此处 不再赘述。 0063 若确认该子轨迹段的前、。

展开阅读全文
内容关键字: 轨迹 异常 检测 方法 系统
关于本文
本文标题:轨迹异常检测方法和系统.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10579963.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1