基于网格化和时空聚类的交通拥堵演化规律的识别方法.pdf

上传人：奻奴文档编号：10938825 上传时间：2021-08-27 格式：PDF 页数：11 大小：715.74KB

收藏版权申诉举报下载

第1页 / 共11页

第2页 / 共11页

第3页 / 共11页

下载文档到电脑，查找使用更方便

30 金币

下载文档

文档描述：

《基于网格化和时空聚类的交通拥堵演化规律的识别方法.pdf》由会员分享，可在线阅读，更多相关《基于网格化和时空聚类的交通拥堵演化规律的识别方法.pdf（11页完成版）》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910804084.7 (22)申请日 2019.08.28 (71)申请人广东工业大学地址 510062 广东省广州市大学城外环西路100号 (72)发明人曾伟良游洪桂 (74)专利代理机构广东广信君达律师事务所 44329 代理人杨晓松 (51)Int.Cl. G06F 16/2458(2019.01) G06F 16/29(2019.01) G06K 9/62(2006.01) G06Q 50/30(2012.01) (54)发明名称一种基于网格化和时空。

2、聚类的交通拥堵演化规律的识别方法 (57)摘要本发明公开了一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，包括步骤： S1. 从百度GPS上获取某城市某个时间段的机动车的出行GPS数据； S2.对获取到的数据进行预处理； S3.对预处理过的数据进行网格化； S4.基于距离矩阵选取ST-DBSCAN算法的参数； S5.建立基于 ST-DBSCAN算法的时空聚类模型，通过该模型挖掘交通拥堵点。本发明能弥补传统方法在单一维数据进行处理的不足以及传统处理方法对于大规模数据的处理能力有限的缺陷，具有针对不同数据量进行动态区域划分的能力，在尽最大可能发挥当前设备计算能力。

3、的基础上保存更多的原始信息，处理效率高且合理。权利要求书2页说明书5页附图3页 CN 110750573 A 2020.02.04 CN 110750573 A 1.一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，其特征在于，包括以下步骤： S1.从百度GPS上获取某城市某个时间段的机动车的出行GPS数据，其中包含日期、时间、当前车速、经纬度以及行驶方向； S2.对步骤S1获取到的数据进行预处理； S3.对预处理过的数据进行网格化； S4.基于距离矩阵选取ST-DBSCAN算法的参数，参数包括有效的空间邻域半径Eps1、时间邻域半径Eps2以及最小密度阈值。

4、MinPts； S5.建立基于ST-DBSCAN算法的时空聚类模型，通过该模型挖掘交通拥堵点。 2.根据权利要求1所述的一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，其特征在于，所述步骤S2具体包括： S2-1.数据清洗；对空值数据以及车辆行驶方向与正北方向的夹角的角度大于360 的数据进行剔除； S2-2.坐标转换；将经纬度坐标转换成其对应的映射平面坐标；采用的大地坐标系是北京54坐标系，投影策略采用的是横轴墨卡托投影； S2-3.数据变换；对数据进行了标准化处理。 3.根据权利要求1所述的一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，其特征在于，。

5、所述步骤S3具体包括： S3-1.设置一个接近当前计算机单次处理阈值的数据量process_window； S3-2.将当前数据量按相同面积的方法平均分成(n/process_window+1)2份，其中每份的面积为总面积除以份数，而数据则是每个区域所包含的数据。 4.根据权利要求1所述的一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，其特征在于，所述步骤S4基于距离矩阵选取ST-DBSCAN算法参数具体步骤如下： S4-1.将MinPts设置为ln(n)， n为数据集大小； S4-2.分别计算D中任一点与其他点之间在空间域和时间域上的距离，形成空间域和时间域上的两个n*。

6、n的距离矩阵； S4-3.将空间域及时间域上的矩阵按列向升序排序，即每k列表示当前点和与其最近第 k点的距离值，将之视为k-dist距离矩阵； S4-4.将步骤S4-3的两个k-dist距离矩阵分别降序排序并画出图形，其中k是大于 MinPts的最小整数； S4-5.分别取两个图形的第一个 “谷” 处左侧的斜率突变点的值作为Eps1和Eps2。 5.根据权利要求1所述的一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，其特征在于，所述步骤S5的具体过程如下： S5-1.将获取到的参数Eps1、 Eps2、 MinPts以及网格化后的单份数据集D输入到ST- DBSCAN算法中，。

7、获取到每个数据所归属的簇的编号； S5-2.求每个簇内的速度均值，将此值与速度划分等级进行映射以获取对应的拥堵等级； S5-3.在数据集D中新建一列拥堵等级level_sign，将步骤S5-2中获取的等级值添加到对应的数据中；权利要求书 1/2 页 2 CN 110750573 A 2 S5-4.将拥堵等级与事先设置的颜色进行映射，以获取不同拥堵等级下的直观聚类结果，同时进行可视化。 6.根据权利要求5所述的一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，其特征在于，所述步骤S5-1具体过程如下： S5-1-1.输入参数Eps1、 Eps2、 MinPts以及网格。

8、化后的单份数据集D； S5-1-2.任取数据集D中一对象p，并将其标记为已访问，判断p是否为核心对象； S5-1-3.如果p为核心对象，新建一个簇C，并将对象p放进簇C，将其所有时空直接密度可达对象放进候选集N中；如果p不是核心对象，则返回步骤S5-1-2； S5-1-4.任取候选集N中一对象p ，将其标记为已访问，判断p 是否为核心对象；如果N 中为空，则返回步骤S5-1-2； S5-1-5.如果p 是核心对象，将之添加到簇C，并将其所有时空直接密度可达对象放进N 中；否则，返回步骤S5-1-4； S5-1-6.执行上述步骤直至遍历了时空数据集D中所有的对象。。

9、权利要求书 2/2 页 3 CN 110750573 A 3 一种基于网格化和时空聚类的交通拥堵演化规律的识别方法技术领域 0001 本发明涉及计算机、交通大数据的技术领域，尤其涉及到一种基于网格化和时空聚类的交通拥堵演化规律的识别方法。背景技术 0002 随着社会现代化进程地推进，人们的出行需求日益增长。车辆保有量的不断攀升，人们出行模式的多样化和出行规律的动态随机变化，给城市基础设施与城市所能提供的服务带来了巨大的挑战。人们日益增长的交通需求和落后的交通服务水平的矛盾导致了城市交通拥堵现象的频繁发生。交通拥堵问题的存在带来了许多负面的影响：其一，其导致了严。

10、重的经济损失；其二，交通拥堵使得交通事故的发生变得更加频繁；其三，交通拥堵问题也是环境污染的一大推手；其四，交通拥堵降低了人们的幸福度；此外，交通拥堵也与城市的魅力、管理水平、城市形象等息息相关。因此，对于交通拥堵问题进行研究是必要且迫切的。 0003 目前在交通拥堵方面的研究主要集中在交通拥堵检测、传播和产生机制几个方面。其中，检测方面主要有直接检测和间接检测两类方法，主要是指对短时间内的交通拥堵进行检测；传播和产生机制方面，主要是基于复杂网络和交通流模型两方面进行研究； 0004 在时空聚类方面的研究主要有基于交通流数据进行聚类研究而总结出来的回。

11、归处理方法；基于轨迹数据的时间层面来聚集交通情况的方法；基于速度为主的聚类算法CB- SMoT等。 0005 但上述交通拥堵的处理方法存在以下的缺陷： 0006 (1)采用的是传统的数据处理方法，不仅在处理效率，还是处理的数据量以及处理范围都非常有限； 0007 (2)进行交通流数据处理时仅仅关注某一维度或者某一特征，使得处理结果相对单薄，不够具有说服力； 0008 (3)原有的网格化方法对于数据的划分不够灵活，同时会导致过多的原始信息丢失。发明内容 0009 本发明的目的在于克服现有技术的不足，提供一种能弥补传统方法在单一维数据进行处理的不足以及传统处理方法对于大。

12、规模数据的处理能力有限的缺陷、具有针对不同数据量进行动态区域划分的能力、在尽最大可能发挥当前设备计算能力的基础上保存更多的原始信息、处理效率高且合理的基于网格化和时空聚类的交通拥堵演化规律的识别方法。 0010 为实现上述目的，本发明所提供的技术方案为： 0011 一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，包括以下步骤： 0012 S1.从百度GPS上获取某城市某个时间段的机动车的出行GPS数据，其中包含日期、时间、当前车速、经纬度以及行驶方向；说明书 1/5 页 4 CN 110750573 A 4 0013 S2.对步骤S1获取到的数据进行预处理； 0。

13、014 S3.对预处理过的数据进行网格化； 0015 S4.基于距离矩阵选取ST-DBSCAN算法的参数，参数包括有效的空间邻域半径 Eps1、时间邻域半径Eps2以及最小密度阈值MinPts； 0016 S5.建立基于ST-DBSCAN算法的时空聚类模型，通过该模型挖掘交通拥堵点。 0017 进一步地，所述步骤S2具体包括： 0018 S2-1.数据清洗；对空值数据以及车辆行驶方向与正北方向的夹角的角度大于 360 的数据进行剔除； 0019 S2-2.坐标转换；将经纬度坐标转换成其对应的映射平面坐标；采用的大地坐标系是北京54坐标系，投影策略采用的是横轴墨卡托投影； 00。

14、20 S2-3.数据变换；对数据进行了标准化处理。 0021 进一步地，所述步骤S3具体包括： 0022 S3-1.设置一个接近当前计算机单次处理阈值的数据量process_window； 0023 S3-2.将当前数据量按相同面积的方法平均分成(n/process_window+1)2份，其中每份的面积为总面积除以份数，而数据则是每个区域所包含的数据。 0024 进一步地，所述步骤S4基于距离矩阵选取ST-DBSCAN算法参数具体步骤如下： 0025 S4-1.将MinPts设置为ln(n)， n为数据集大小； 0026 S4-2.分别计算D中任一点与其他点之间在空间域和时间域上。

15、的距离，形成空间域和时间域上的两个n*n的距离矩阵； 0027 S4-3.将空间域及时间域上的矩阵按列向升序排序，即每k列表示当前点和与其最近第k点的距离值，将之视为k-dist距离矩阵； 0028 S4-4.将步骤S4-3的两个k-dist距离矩阵分别降序排序并画出图形，其中k是大于 MinPts的最小整数； 0029 S4-5.分别取两个图形的第一个 “谷” 处左侧的斜率突变点的值作为Eps1和Eps2。 0030 进一步地，所述步骤S5的具体过程如下： 0031 S5-1.将获取到的参数Eps1、 Eps2、 MinPts以及网格化后的单份数据集D输入到ST- DBSCAN。

16、算法中，获取到每个数据所归属的簇的编号； 0032 S5-2.求每个簇内的速度均值，将此值与速度划分等级进行映射以获取对应的拥堵等级； 0033 S5-3.在数据集D中新建一列拥堵等级level_sign，将步骤S5-2中获取的等级值添加到对应的数据中； 0034 S5-4.将拥堵等级与事先设置的颜色进行映射，以获取不同拥堵等级下的直观聚类结果，同时进行可视化。 0035 进一步地，所述步骤S5-1具体过程如下： 0036 S5-1-1.输入参数Eps1、 Eps2、 MinPts以及网格化后的单份数据集D； 0037 S5-1-2.任取数据集D中一对象p，并将其标记为已访。

17、问，判断p是否为核心对象； 0038 S5-1-3.如果p为核心对象，新建一个簇C，并将对象p放进簇C，将其所有时空直接密度可达对象放进候选集N中；如果p不是核心对象，则返回步骤S5-1-2； 0039 S5-1-4.任取候选集N中一对象p ，将其标记为已访问，判断p 是否为核心对象；如说明书 2/5 页 5 CN 110750573 A 5 果N中为空，则返回步骤S5-1-2； 0040 S5-1-5.如果p 是核心对象，将之添加到簇C，并将其所有时空直接密度可达对象放进N中；否则，返回步骤S5-1-4； 0041 S5-1-6.执行上述步骤直至遍历了时空数。

18、据集D中所有的对象。 0042 与现有技术相比，本方案的原理及优点如下： 0043 1.综合考虑交通数据所具有的关于时空两方面的多个特征，然后采用一种基于网格化和改进的时空聚类算法来对交通拥堵情况进行研究，弥补了传统方法在单一维数据进行处理的不足，以及传统处理方法对于大规模数据的处理能力有限的缺陷，能识别出不同时间、不同区域的交通的拥堵情况，同时再通过可视化的技术手段，将处理结果直观地呈现出来。 0044 2.提出一种新的网格化方法，使具有针对不同数据量进行动态区域划分的能力，同时还能在尽最大可能发挥当前设备计算能力的基础上保存更多的原始信息。 0045 3.对于S。

19、T-DBSCAN算法的相关参数的选取也进行了一定的改进，从单凭经验选取转变到一种基于距离矩阵的启发式方法，处理效率高且合理。附图说明 0046 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的服务作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。 0047 图1为本发明一种基于网格化和时空聚类的交通拥堵演化规律的识别方法的工作流程图； 0048 图2为本发明一种基于网格化和时空聚类的交通拥堵演化规律的识别方法中ST。

20、- DBSCAN算法实现的流程图； 0049 图3为研究区域内2016年9月20日0时至9时的交通拥堵情况。具体实施方式 0050 下面结合具体实施例对本发明作进一步说明： 0051 如图1所示，本实施例所述的一种基于网格化和时空聚类的交通拥堵演化规律的识别方法，包括以下步骤： 0052 S1.从百度GPS上获取福田和罗湖区2016年9月20日0时至9时的机动车的出行GPS 数据，其中包含日期、时间、当前车速、经纬度以及行驶方向。 0053 S2.对步骤S1获取到的数据进行预处理： 0054 S2-1.数据清洗；对空值数据以及车辆行驶方向与正北方向的夹角的角度大于 360 的。

21、数据进行剔除； 0055 S2-2.坐标转换；获取到的交通数据中关于位置部分的描述是通过经纬度来实现，然而经纬度描述的是椭球体表面上的信息，这意味着经纬度之间的距离对应的平面距离是不均匀的。所以，为了谋求更加合理的聚类效果，本实施例将经纬度坐标转换成其对应的映射平面坐标；采用的大地坐标系是北京54坐标系，投影策略采用的是横轴墨卡托投影；说明书 3/5 页 6 CN 110750573 A 6 0056 S2-3.数据变换；对数据进行了标准化处理： 0057 0058其中，为均值，为标准差。 0059 S3.对预处理过的数据进行网格化： 0060 S3-1.设置一个接。

22、近当前计算机单次处理阈值的数据量process_window； 0061 S3-2.将当前数据量按相同面积的方法平均分成(n/process_window+1)2份，其中每份的面积为总面积除以份数，而数据则是每个区域所包含的数据。 0062 S4.传统的参数选取方法是单纯凭借经验来实现，这其中带有很大的主观因素，对聚类的结果影响较大；因此，本实施例基于距离矩阵选取ST-DBSCAN算法的参数，参数包括有效的空间邻域半径Eps1、时间邻域半径Eps2以及最小密度阈值MinPts；具体过程如下： 0063 S4-1.将MinPts设置为ln(n)， n为数据集大小； 006。

23、4 S4-2.分别计算D中任一点与其他点之间在空间域和时间域上的距离，形成空间域和时间域上的两个n*n的距离矩阵； 0065 S4-3.将空间域及时间域上的矩阵按列向升序排序，即每k列表示当前点和与其最近第k点的距离值，将之视为k-dist距离矩阵； 0066 S4-4.将步骤S4-3的两个k-dist距离矩阵分别降序排序并画出图形，其中k是大于 MinPts的最小整数； 0067 S4-5.分别取两个图形的第一个 “谷” 处左侧的斜率突变点的值作为Eps1和Eps2。 0068 S5.建立基于ST-DBSCAN算法的时空聚类模型并通过该模型挖掘交通拥堵点： 0069 S5-1.将。

24、获取到的参数Eps1、 Eps2、 MinPts以及网格化后的单份数据集D输入到ST- DBSCAN算法中，获取到每个数据所归属的簇的编号；如图2所示，本步骤的具体过程为： 0070 S5-1-1.输入参数Eps1、 Eps2、 MinPts以及网格化后的单份数据集D； 0071 S5-1-2.任取数据集D中一对象p，并将其标记为已访问，判断p是否为核心对象； 0072 S5-1-3.如果p为核心对象，新建一个簇C，并将对象p放进簇C，将其所有时空直接密度可达对象放进候选集N中；如果p不是核心对象，则返回步骤S5-1-2； 0073 S5-1-4.任取候选集N中一对象p 。

25、，将其标记为已访问，判断p 是否为核心对象；如果N中为空，则返回步骤S5-1-2； 0074 S5-1-5.如果p 是核心对象，将之添加到簇C，并将其所有时空直接密度可达对象放进N中；否则，返回步骤S5-1-4； 0075 S5-1-6.执行上述步骤直至遍历了时空数据集D中所有的对象。 0076 S5-2.求每个簇内的速度均值，将此值与速度划分等级进行映射以获取对应的拥堵等级； 0077 S5-3.在数据集D中新建一列拥堵等级level_sign，将步骤S5-2中获取的等级值添加到对应的数据中； 0078 S5-4.将拥堵等级与事先设置的颜色进行映射，以获取不同拥。

26、堵等级下的直观聚类结果，同时进行可视化。 0079 本实施例中等级划分说明如下表1所示：说明书 4/5 页 7 CN 110750573 A 7 0080 0081 表1 0082 本实施例综合考虑交通数据所具有的关于时空两方面的多个特征，然后采用一种基于网格化和改进的时空聚类算法来对交通拥堵情况进行研究，弥补了传统方法在单一维数据进行处理的不足，以及传统处理方法对于大规模数据的处理能力有限的缺陷，能识别出不同时间、不同区域的交通的拥堵情况，同时再通过可视化的技术手段，将处理结果直观地呈现出来。另外，提出一种新的网格化方法，使具有针对不同数据量进行动态区域划分。

27、的能力，同时还能在尽最大可能发挥当前设备计算能力的基础上保存更多的原始信息。最后，对于ST-DBSCAN算法的相关参数的选取也进行了一定的改进，从单凭经验选取转变到一种基于距离矩阵的启发式方法，处理效率高且合理。 0083 以上所述之实施例子只为本发明之较佳实施例，并非以此限制本发明的实施范围，故凡依本发明之形状、原理所作的变化，均应涵盖在本发明的保护范围内。说明书 5/5 页 8 CN 110750573 A 8 图1 说明书附图 1/3 页 9 CN 110750573 A 9 图2 说明书附图 2/3 页 10 CN 110750573 A 10 图3 说明书附图 3/3 页 11 CN 110750573 A 11 。

展开阅读全文

内容关键字: 基于网格时空交通拥堵演化规律识别方法