公交车辆从起点到终点总行驶时间预测方法及装置.pdf

上传人:柴****2 文档编号:11090220 上传时间:2021-09-03 格式:PDF 页数:26 大小:1.60MB
收藏 版权申诉 举报 下载
公交车辆从起点到终点总行驶时间预测方法及装置.pdf_第1页
第1页 / 共26页
公交车辆从起点到终点总行驶时间预测方法及装置.pdf_第2页
第2页 / 共26页
公交车辆从起点到终点总行驶时间预测方法及装置.pdf_第3页
第3页 / 共26页
文档描述:

《公交车辆从起点到终点总行驶时间预测方法及装置.pdf》由会员分享,可在线阅读,更多相关《公交车辆从起点到终点总行驶时间预测方法及装置.pdf(26页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201910860805.6 (22)申请日 2019.10.23 (71)申请人 厦门大学 地址 361000 福建省厦门市思明南路422号 (72)发明人 赖永炫张璐徐易凡杨诗鹏 (74)专利代理机构 厦门福贝知识产权代理事务 所(普通合伙) 35235 代理人 陈远洋 (51)Int.Cl. G08G 1/123(2006.01) G06Q 10/04(2012.01) G06Q 50/26(2012.01) G06N 3/04(2006.01) (54)发明名称 一种公交。

2、车辆从起点到终点总行驶时间预 测方法及装置 (57)摘要 本发明公开了一种公交车辆从起点到终点 总行驶时间预测方法及装置。 该方法在时空特征 和属性特征等对影响公交车辆总行驶阶段的各 种因素进行处理, 充分考虑到了影响结果变化的 各种因素。 采用特征组合的方式对时空特征和属 性特征进行组合, 并对其中的缺失数据进行处 理, 以应对实际应用中发生的数据丢失等异常情 况, 通过ConvLSTM神经网络预测出各站停留时 长、 各站行驶时长, 通过嵌入处理和标准化处理 得到外部属性特征。 利用各站停留时长、 各站行 驶时长和所述外部属性在层叠LSTM神经网络对 总时长进行准确的预测。 本发明提出的方法。

3、能够 辅助现有公交公司进行调度决策, 帮助调度员及 时发现晚点车辆, 并根据预测结果作出合理的调 度决策。 权利要求书4页 说明书15页 附图6页 CN 110570678 A 2019.12.13 CN 110570678 A 1.一种公交车辆从起点到终点总行驶时间预测方法, 其特征在于, 包括以下步骤: S1: 将包含时间属性和空间属性的时空特征分别输入ConvLSTM神经网络预测出各站停 留时长和各站行驶时长; S2: 将包含车辆属性、 驾驶员属性、 天气属性和时间属性的外部属性进行嵌入处理转换 为E维向量, 将所述时空特征通过均值和标准差进行标准化处理, 将经嵌入处理后的所述外 部属性。

4、和经标准化处理的所述时空属性进行连接处理得到外部属性特征; 以及 S3: 将所述各站停留时长、 所述各站行驶时长和所述外部属性特征连接得到层叠LSTM 神经网络的输入向量, 通过层叠LSTM神经网络预测出车辆行驶的总时长。 2.根据权利要求1所述的公交车辆从起点到终点总行驶时间预测方法, 其特征在于, 在 所述步骤S1中用于预测所述各站停留时长的所述时空特征包括近一周同时段各站平均停 留时长、 近三天同时段各站平均停留时长和最新各站平均停留时长, 用于预测所述各站行 驶时长的所述时空特征包括近一周同时段各站平均行驶时长、 近三天同时段各站平均行驶 时长和最新各站平均行驶时长, 在所述ConvL。

5、STM神经网络中设置损失函数表示为各站点的 真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值 之和, 根据各站点的重要性为所述损失函数赋予不同的权重, 预测第i站停留时长时损失函 数设置的权重为: 预测第i站行驶时长时损失函数设置的权重为: 其中, wsi和wri分别表示预测第i站停留时长和第i站行驶时长的权重, maxsi表示第i站 停留时长的最大值, minsi表示第i站停留时长的最小值, varsi和varri分别为第i站停留时长 和第i站行驶时长的方差, meansi和meanri分别表示第i站停留时长和第i站行驶时长的均 值, 最后预测出的第i站停留时长为。

6、si, 预测出的第i站行驶时长为ri。 3.根据权利要求2所述的公交车辆从起点到终点总行驶时间预测方法, 其特征在于, 所 述步骤S2具体包括以下步骤: S21: 通过嵌入的方式将所述外部属性转换为低维实向量, 所述外部属性的每个值vi V用E维向量表示, 所述外部属性被映射到空间WRV*E, 其中V为所述外部属性的大小, E为 嵌入空间的维度, 得到第i站的车辆属性特征为Cic, 驾驶员属性特征为Did, 天气属性为Wiw, 星期几属性为DTidt, 时间段属性为Hih, 段内分组属性为Mim; S22: 对所述时空特征在利用以下公式进行标准化: 其中, x为所述时空特征, 为标准化后的所述。

7、时空特征, xmean为x的均值, xstd为x的标准 差, 标准化后得到第i站近一周的运行时长特征为SWi, 近三天的运行时长特征为STi, 最新的 运行时长特征为SCi; S23: 将所述步骤S21和所述步骤S22处理后的结果进行连接得到外部属性向量attri为: 权利要求书 1/4 页 2 CN 110570678 A 2 4.根据权利要求3所述的公交车辆从起点到终点总行驶时间预测方法, 其特征在于, 所 述步骤S3具体包括: S31: 将所述预测出的第i站行驶时长为ri、 第i站停留时长为si和所述外部属性向量 attri进行连接处理得到层叠LSTM神经网络的输入向量: S32: 将所。

8、述输入向量merge输入神经元数量分别为96、 48、 24、 1四层的层叠LSTM, 预测 出车辆行驶的总时长。 5.根据权利要求2所述的公交车辆从起点到终点总行驶时间预测方法, 其特征在于, 所 述时空特征和所述外部属性通过以下步骤得到: S11: 获取车辆原始到离站数据, 并对其进行数据清洗以及转换得到车辆属性、 驾驶员 属性、 天气属性和时间属性; S12: 获取线路运行数据, 通过在所述线路运行数据中查询相同时间段下各车辆实际运 行的站点停留时长和站间行驶时长, 对近一周、 近三天的所述站点停留时长和站间行驶时 长求均值得到所述近一周同时段各站点平均停留时长、 所述近三天同时段各站平。

9、均停留时 长、 所述近一周同时段各站平均行驶时长和所述近三天同时段各站平均行驶时长, 从起始 站依次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长得到所述最新各 站平均停留时长和所述最新各站平均行驶时长; S13: 对相同时间段和车辆班次下的所述车辆属性、 所述驾驶员属性、 所述天气属性、 所 述时间属性、 所述近一周同时段各站平均停留时长、 所述近三天同时段各站平均停留时长、 所述近一周同时段各站平均行驶时长、 所述近三天同时段各站平均行驶时长、 所述最新各 站平均停留时长和所述最新各站平均行驶时长进行连接, 对于存在数据缺失的所述外部属 性和所述时空特征根据历史数据或临近班次数据。

10、中相同条件下的相应数据进行填充处理 得到所述外部属性和所述时空特征。 6.一种公交车辆从起点到终点总行驶时间预测装置, 其特征在于, 包括: 停留和行驶时长预测模块, 被配置为将包含时间属性和空间属性的时空特征输入 ConvLSTM神经网络分别预测出各站停留时长和各站行驶时长; 外部属性特征处理模块, 被配置为将包含车辆属性、 驾驶员属性、 天气属性、 时间属性 的外部属性进行嵌入处理转换为E维向量, 将所述时空特征通过均值和标准差进行标准化 处理, 将经嵌入处理后的所述外部属性和经标准化处理的所述时空属性进行连接处理得到 外部属性特征; 以及 总时长预测模块, 被配置为将所述各站停留时长、 。

11、所述各站行驶时长和所述外部属性 特征进行连接得到层叠LSTM神经网络的输入向量, 通过层叠LSTM神经网络预测出车辆行驶 的总时长。 7.根据权利要求6所述的公交车辆从起点到终点总行驶时间预测装置, 其特征在于, 用 于预测所述各站停留时长的所述时空特征包括近一周同时段各站平均停留时长、 近三天同 时段各站平均停留时长和最新各站平均停留时长, 用于预测所述各站行驶时长的所述时空 特征包括近一周同时段各站平均行驶时长、 近三天同时段各站平均行驶时长和最新各站平 权利要求书 2/4 页 3 CN 110570678 A 3 均行驶时长, 在所述ConvLSTM神经网络中设置损失函数表示为各站点的真。

12、实停留时长与预 测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和, 根据各站点的 重要性为所述损失函数赋予不同的权重, 预测第i站停留时长时在损失函数设置的权重为: 预测第i站行驶时长时在损失函数设置的权重为: 其中, wsi和wri分别表示预测第i站停留时长和第i站行驶时长的权重, maxsi表示第i站 停留时长的最大值, minsi表示第i站停留时长的最小值, varsi和varri分别为第i站停留时长 和第i站行驶时长的方差, meansi和meanri分别表示第i站停留时长和第i站行驶时长的均 值, 最后预测出的第i站停留时长为si, 预测出的第i站行驶时长为ri。 8。

13、.根据权利要求7所述的公交车辆从起点到终点总行驶时间预测装置, 其特征在于, 所 述外部属性特征处理模块包括: 属性转换模块, 被配置为通过嵌入方式将所述外部属性转换为低维实向量, 所述外部 属性的每个值viV用E维向量表示, 所述外部属性被映射到空间WRV*E, 其中V为所述外 部属性的大小, E为嵌入空间的维度, 得到第i站车辆属性特征为Cic, 驾驶员属性特征为Did, 天气属性为Wiw, 星期几属性为DTidt, 时间段属性为Hih, 时间段内分钟属性为Mim; 标准化模块, 被配置为对所述时空特征在利用以下公式进行标准化: 其中, x为所述时空特征, 为标准化后的所述时空特征, xm。

14、ean为x的均值, xstd为x的标准 差, 标准化后得到第i站近一周的停留时长和行驶时长之和的特征值为SWi, 近三天的停留 时长和行驶时长之和的特征为STi, 最新的停留时长和行驶时长之和的特征为SCi; 第一连接处理模块, 被配置为将所述步骤S21和所述步骤S22处理后的结果进行连接得 到外部属性向量attri为: 9.根据权利要求8所述的公交车辆从起点到终点总行驶时间预测装置, 其特征在于, 所 述总时长预测模块包括: 第二连接处理模块, 被配置为将所述预测出的第i站行驶时长为ri、 第i站停留时长为si 和所述外部属性向量attri进行连接处理得到层叠LSTM神经网络的输入向量: 预。

15、测模块, 被配置为将所述输入向量merge输入神经元数量分别为96、 48、 24、 1四层的 层叠LSTM, 预测出车辆行驶的总时长。 10.根据权利要求7所述的公交车辆从起点到终点总行驶时间预测装置, 其特征在于, 所述时空特征和所述外部属性通过以下步骤得到: 数据清洗模块, 被配置为获取车辆原始到离站数据, 并对其进行数据清洗以及转换得 到车辆属性、 驾驶员属性、 天气属性和时间属性; 权利要求书 3/4 页 4 CN 110570678 A 4 时长获取模块, 被配置为获取线路运行数据, 通过在所述线路运行数据中查询相同时 间段下各车辆实际运行的站点停留时长和站间行驶时长, 对近一周、。

16、 近三天的所述站点停 留时长和站间行驶时长求均值得到所述近一周同时段各站平均停留时长、 所述近三天同时 段各站平均停留时长、 所述近一周同时段各站平均行驶时长和所述近三天同时段各站平均 行驶时长, 从起始站依次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长 得到最新各站平均停留时长和最新各站平均行驶时长; 第三连接处理模块, 被配置为对相同时间段和车辆班次下的所述车辆属性、 所述驾驶 员属性、 所述天气属性、 所述时间属性、 所述近一周同时段各站平均停留时长、 所述近三天 同时段各站平均停留时长、 所述近一周同时段各站平均行驶时长、 所述近三天同时段各站 平均行驶时长、 所述最新各站。

17、平均停留时长和所述最新各站平均行驶时长进行连接, 对于 存在数据缺失的所述外部属性和所述时空特征根据历史数据或临近班次数据中相同条件 下的相应数据进行填充处理得到所述外部属性和所述时空特征。 权利要求书 4/4 页 5 CN 110570678 A 5 一种公交车辆从起点到终点总行驶时间预测方法及装置 技术领域 0001 本发明涉及公交车信息处理领域, 具体涉及一种公交车辆从起点到终点总行驶时 间预测方法、 装置及存储介质。 背景技术 0002 目前, 我国公交采取排班制发车, 以达到公交公司和乘客之间的效益平衡。 但由于 道路交通、 天气等因素复杂多变, 导致车辆常常不能按照计划发车时间发班。

18、, 进而会出现 “串车” 和 “大间隔” 现象。 为应对各种原因导致车辆不能按原计划发班的情况, 需要进行车 辆的实时调度。 现有的公交调度方式主要由人工完成, 即公交调度员通过监视面板观察所 负责线路的当前车辆分布状况。 调度员根据自身经验估计车辆回场时间, 进而进行下一班 次发车时间的调整。 现有调度方式仅依靠调度员的经验估计车辆到站时间, 不仅工作量巨 大, 且常由于错误预估导致调度策略无法被准确执行, 仍无法缓解 “串车” 和 “大间隔” 现象 的发生。 因此, 良好的调度系统迫切需要一个能准确预测到站时间的算法, 进而辅助调度员 合理预估车辆回场时间。 这也是近年来智能交通(ITS,。

19、 Intelligent Transportation System)应用的典型场景。 0003 现有关于行驶时长的预测研究常基于历史数据、 时间序列数据借助回归模型、 卡 尔曼滤波模型、 神经网络、 组合预测模型等方式进行。 如: Chun-Hsin Wu等人利用支持向量 回归(SVR, Support Vector Regression)进行交通时长的预测(Wu C H,Ho J M,Lee D T.Travel-time prediction with support vector regressionJ.IEEE Transactions on Intelligent Transpor。

20、tation Systems,2004,5(4):276-281.)。 在该论文的研究中, 通 过使用过去t个时刻的真实交通时长数据, 预测未来一段时间内的交通行驶时长。 通过实验 证明, 该方法在预测旅行时间问题上具有一定可行性。 但其在特征使用上, 仅使用了过去时 刻的数据, 无法体现外在因素如驾驶员风格、 车辆性能、 道路交通状况的差异对预测结果的 影响。 Vanajakshi L等人利用卡尔曼滤波技术预测不同交通条件下的出行时间 (Vanajakshi L,Subramanian S C,Sivanandan R.Travel time prediction under heterog。

21、eneous traffic conditions using global positioning system data from busesJ.IET INTELLIGENT TRANSPORT SYSTEMS,2009,3(1):1-0.)。 在该论文的研究中, 对路段进行等距离划分, 利用2辆前序车辆收集到的信息进行当前车辆的预测。 在该方法中 假设任何时刻均有两辆前序车辆跑完全程为其收集信息, 在实际应用中, 较难实现。 Mathieu Sinn等人提出了一种用于预测到站时间的基于实时GPS数据的非参数算法, 关键 思想是使用内核回归模型来表示位置更新与公交车站到达时间之间的依赖关。

22、系(Sinn, Yoon,Calabrese,et al.Predicting arrival times of buses using real-time GPS measurementsCInternational IEEE Conference on Intelligent Transportation Systems.IEEE,2012.)。 实验表明, 对于50分钟的时间范围, 算法的预测误差平均小于10。 在该论文的研究方法中, 通过依据历史数据与当前状况的相似性为其赋予不同的权重, 计 算当前状况的预测值。 这种方式对于模型训练的时间跨度要求较为严格, 需要更长时间的 说明书 1。

23、/15 页 6 CN 110570678 A 6 数据样本。 0004 相比于国外, 我国学者对于公交到站预测的研究起步较晚。 王麟珠等人提出一种 基于Elman神经网络的公交车辆从起点到终点总行驶时间预测方法(王麟珠,苏庆列,郑日 博.基于Elman动态神经网络的公交到站时间预测J.机电技术,2012,35(01):135-137.), 并通过福州的公交数据进行验证。 在该论文的研究方法中, 以时间、 天气、 路段、 当前路段的 运行时间为特征进行预测, 结果具有一定的精确度。 但其对于天气的划分仅限于是否下雨, 未涉及到沙城暴等影响能见度的天气因素, 且其同样未考虑驾驶员风格等主观因素对于。

24、结 果的影响。 因此该方法还有待提升。 张强等人提出一种基于时间分段的动态实时预测算法, 将一天分为24个等长的时间段, 分时段对公交到站时间进行预测(张强,张艳艳.基于时间 分段的公交车到站时间预测模型研究J.数字技术与应用,2014(11):60-62.)。 其将总时 长分为站间行驶时长、 站点滞留时长、 交叉路口通行时长与等待时长, 但其对这些组成因素 的预测均采用基于历史时间序列进行预测, 缺少对外在因素影响的研究。 杨奕等人将遗传 算法与BPNN(Back Propagation Neural Network, BP神经网络)结合, 从而改进BP神经网络 容易陷入局部最优的缺陷(杨奕。

25、,张雯蕊,张灿.基于遗传算法的BP神经网络在公交车到站 时间预测中的应用J.现代商业,2017(16):38-40.)。 通过对合肥某一公交线路数据的研 究, 实验表明, 该算法确实有比较好的预测效果。 但该算法在特征选择上, 仅利用最近一班 班次的实际发生数据, 缺少对于数据历史或周期规律的研究。 此外, 其同样忽略了外在因素 的影响。 对于公交到站时间预测, 有必要使用一个能够同时捕捉时空特征的网络结构。 在 ConvLSTM中(Xingjian,S.H.I.,Zhourong Chen,Hao Wang,Dit-Yan Yeung,Wai-Kin Wong, and Wang-chun 。

26、Woo.Convolutional LSTM network:A machine learning approach for precipitation nowcasting.In Advances in neural information processing systems,pp.802-810.2015), 通过将卷积层融入到传统的LSTM中, 使得某一单元的输入不 再是仅由过去时刻的状态所决定, 还与其邻近的邻居状态有关。 可以理解为: 某一站点的停 留时长或站间的行驶时长, 不仅与这一站点过去的停留时长或站间行驶时长有关, 还与其 邻近站点的停留时长或站间行驶时长有关。 0005 。

27、现有的关于行程预测或公交预测的研究无法被直接用于辅助调度决策的原因包 括: 第一, 由于公交车与出租车或私家车的行驶特点不同, 其需要在固定站点进行停留, 因 此站点停留时长是其总时长的重要可变组成成分, 直接利用出租车或私家车关于行程时长 预测的方法往往不够准确。 第二, 现有关于公交到离站的预测多基于对邻近站点的站数、 距 离或站间行驶时长的预测, 缺少关于起点站到终点站总时长预测的研究。 利用站间预测的 方式预测总时长会出现误差累加以及无法预测各站点停留时长的情况。 第三, 目前对于行 程时长的预测往往只考虑了某几个影响因素, 缺乏对其时空特性和外在因素影响的融合研 究。 但公交车辆总时。

28、长的问题是一个无法避免时间依赖性、 空间相关性和外部因素综合影 响的复杂问题。 因此, 需要一种能够直接对公交车辆从起点站至终点站总时长进行预测的 算法。 发明内容 0006 本申请的实施例的目的在于提出了公交车辆从起点到终点总行驶时间预测方法、 装置及存储介质, 来解决以上背景技术部分提到的技术问题。 说明书 2/15 页 7 CN 110570678 A 7 0007 第一方面, 本申请实施例提供了一种公交车辆从起点到终点总行驶时间预测方 法, 包括以下步骤: 0008 S1: 将包含时间属性和空间属性的时空特征分别输入ConvLSTM神经网络预测出各 站停留时长和各站行驶时长; 0009。

29、 S2: 将包含车辆属性、 驾驶员属性、 天气属性和时间属性的外部属性进行嵌入处理 转换为E维向量, 将时空特征通过均值和标准差进行标准化处理, 将经嵌入处理后的外部属 性和经标准化处理的时空属性进行连接处理得到外部属性特征; 以及 0010 S3: 将各站停留时长、 各站行驶时长和外部属性特征连接得到层叠LSTM神经网络 的输入向量, 通过层叠LSTM神经网络预测出车辆行驶的总时长。 0011 在一些实施例中, 在步骤S1中用于预测各站停留时长的时空特征包括近一周同时 段各站平均停留时长、 近三天同时段各站平均停留时长和最新各站平均停留时长, 用于预 测各站行驶时长的时空特征包括近一周同时段。

30、各站平均行驶时长、 近三天同时段各站平均 行驶时长和最新各站平均行驶时长, 在ConvLSTM神经网络中设置损失函数表示为各站点的 真实停留时长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值 之和, 根据各站点的重要性为损失函数赋予不同的权重, 预测第i站停留时长时损失函数设 置的权重为: 0012 0013 预测第i站行驶时长时损失函数设置的权重为: 0014 0015 其中, wsi和wri分别表示预测第i站停留时长和第i站行驶时长的权重, maxsi表示第 i站停留时长的最大值, minsi表示第i站停留时长的最小值, varsi和varri分别为第i站停留 时长和第i。

31、站行驶时长的方差, meansi和meanri分别表示第i站停留时长和第i站行驶时长的 均值, 最后预测出的第i站停留时长为si, 预测出的第i站行驶时长为ri。 0016 在一些实施例中, 步骤S2具体包括以下步骤: 0017 S21: 通过嵌入的方式将外部属性转换为低维实向量, 外部属性的每个值viV用 E维向量表示, 外部属性被映射到空间WRV*E, 其中V为外部属性的大小, E为嵌入空间的维 度, 得到第i站的车辆属性特征为Cic, 驾驶员属性特征为Did, 天气属性为Wiw, 星期几属性为 DTidt, 时间段属性为Hih, 段内分组属性为Mim; 0018 S22: 对时空特征在利。

32、用以下公式进行标准化: 0019 0020其中, x为时空特征, 为标准化后的时空特征, xmean为x的均值, xstd为x的标准差, 标准化后得到第i站近一周的运行时长特征为SWi, 近三天的运行时长特征为STi, 最新的运 行时长特征为SCi; 0021 S23: 将步骤S21和步骤S22处理后的结果进行连接得到外部属性向量attri为: 0022 说明书 3/15 页 8 CN 110570678 A 8 0023 在一些实施例中, 步骤S3具体包括: 0024 S31: 将预测出的第i站行驶时长为ri、 第i站停留时长为si和外部属性向量attri进 行连接处理得到层叠LSTM神经网。

33、络的输入向量: 0025 0026 S32: 将输入向量merge输入神经元数量分别为96、 48、 24、 1四层的层叠LSTM, 预测 出车辆行驶的总时长。 0027 在一些实施例中, 时空特征和外部属性通过以下步骤得到: 0028 S11: 获取车辆原始到离站数据, 并对其进行数据清洗以及转换得到车辆属性、 驾 驶员属性、 天气属性和时间属性; 0029 S12: 获取线路运行数据, 通过在线路运行数据中查询相同时间段下各车辆实际运 行的站点停留时长和站间行驶时长, 对近一周、 近三天的站点停留时长和站间行驶时长求 均值得到近一周同时段各站点平均停留时长、 近三天同时段各站平均停留时长、。

34、 近一周同 时段各站平均行驶时长和近三天同时段各站平均行驶时长, 从起始站依次查询经过各站点 的最近一班的车辆在各站的停留时长和行驶时长得到最新各站平均停留时长和最新各站 平均行驶时长; 0030 S13: 对相同时间段和车辆班次下的车辆属性、 驾驶员属性、 天气属性、 时间属性、 近一周同时段各站平均停留时长、 近三天同时段各站平均停留时长、 近一周同时段各站平 均行驶时长、 近三天同时段各站平均行驶时长、 最新各站平均停留时长和最新各站平均行 驶时长进行连接, 对于存在数据缺失的外部属性和时空特征根据历史数据或临近班次数据 中相同条件下的相应数据进行填充处理得到外部属性和时空特征。 003。

35、1 第二方面, 本申请的实施例提出了一种公交车辆从起点到终点总行驶时间预测装 置, 包括: 0032 停留和行驶时长预测模块, 被配置为将包含时间属性和空间属性的时空特征输入 ConvLSTM神经网络分别预测出各站停留时长和各站行驶时长; 0033 外部属性特征处理模块, 被配置为将包含车辆属性、 驾驶员属性、 天气属性、 时间 属性的外部属性进行嵌入处理转换为E维向量, 将时空特征通过均值和标准差进行标准化 处理, 将经嵌入处理后的外部属性和经标准化处理的时空属性进行连接处理得到外部属性 特征; 以及 0034 总时长预测模块, 被配置为将各站停留时长、 各站行驶时长和外部属性特征进行 连接。

36、得到层叠LSTM神经网络的输入向量, 通过层叠LSTM神经网络预测出车辆行驶的总时 长。 0035 在一些实施例中, 用于预测各站停留时长的时空特征包括近一周同时段各站平均 停留时长、 近三天同时段各站平均停留时长和最新各站平均停留时长, 用于预测各站行驶 时长的时空特征包括近一周同时段各站平均行驶时长、 近三天同时段各站平均行驶时长和 最新各站平均行驶时长, 在ConvLSTM神经网络中设置损失函数表示为各站点的真实停留时 长与预测停留时长差值之和以及各站点的真实行驶时长与预测行驶时长差值之和, 根据各 站点的重要性为损失函数赋予不同的权重, 预测第i站停留时长时在损失函数设置的权重 为: 。

37、说明书 4/15 页 9 CN 110570678 A 9 0036 0037 预测第i站行驶时长时在损失函数设置的权重为: 0038 0039 其中, wsi和wri分别表示预测第i站停留时长和第i站行驶时长的权重, maxsi表示第 i站停留时长的最大值, minsi表示第i站停留时长的最小值, varsi和varri分别为第i站停留 时长和第i站行驶时长的方差, meansi和meanri分别表示第i站停留时长和第i站行驶时长的 均值, 最后预测出的第i站停留时长为si, 预测出的第i站行驶时长为ri。 0040 在一些实施例中, 外部属性特征处理模块包括: 0041 属性转换模块, 被。

38、配置为通过嵌入方式将外部属性转换为低维实向量, 外部属性 的每个值viV用E维向量表示, 外部属性被映射到空间WRV*E, 其中V为外部属性的大 小, E为嵌入空间的维度, 得到第i站车辆属性特征为Cic, 驾驶员属性特征为Did, 天气属性为 Wiw, 星期几属性为DTidt, 时间段属性为Hih, 时间段内分钟属性为Mim; 0042 标准化模块, 被配置为对时空特征在利用以下公式进行标准化: 0043 0044其中, x为时空特征, 为标准化后的时空特征, xmean为x的均值, xstd为x的标准差, 标准化后得到第i站近一周的停留时长和行驶时长之和的特征值为SWi, 近三天的停留时长。

39、 和行驶时长之和的特征为STi, 最新的停留时长和行驶时长之和的特征为SCi; 0045 第一连接处理模块, 被配置为将步骤S21和步骤S22处理后的结果进行连接得到外 部属性向量attri为: 0046 0047 在一些实施例中, 总时长预测模块包括: 0048 第二连接处理模块, 被配置为将预测出的第i站行驶时长为ri、 第i站停留时长为si 和外部属性向量attri进行连接处理得到Stack-LSTM神经网络的输入向量: 0049 0050 预测模块, 被配置为将输入向量merge输入神经元数量分别为96、 48、 24、 1四层的 层叠LSTM, 预测出车辆行驶的总时长。 0051 在。

40、一些实施例中, 时空特征和外部属性通过以下步骤得到: 0052 数据清洗模块, 被配置为获取车辆原始到离站数据, 并对其进行数据清洗以及转 换得到车辆属性、 驾驶员属性、 天气属性和时间属性; 0053 时长获取模块, 被配置为获取线路运行数据, 通过在线路运行数据中查询相同时 间段下各车辆实际运行的站点停留时长和站间行驶时长, 对近一周、 近三天的站点停留时 长和站间行驶时长求均值得到近一周同时段各站平均停留时长、 近三天同时段各站平均停 留时长、 近一周同时段各站平均行驶时长和近三天同时段各站平均行驶时长, 从起始站依 次查询经过各站点的最近一班的车辆在各站的停留时长和行驶时长得到最新各站。

41、平均停 留时长和最新各站平均行驶时长; 说明书 5/15 页 10 CN 110570678 A 10 0054 第三连接处理模块, 被配置为对相同时间段和车辆班次下的车辆属性、 驾驶员属 性、 天气属性、 时间属性、 近一周同时段各站平均停留时长、 近三天同时段各站平均停留时 长、 近一周同时段各站平均行驶时长、 近三天同时段各站平均行驶时长、 最新各站平均停留 时长和最新各站平均行驶时长进行连接, 对于存在数据缺失的外部属性和时空特征根据历 史数据或临近班次数据中相同条件下的相应数据进行填充处理得到外部属性和时空特征。 0055 本发明提出一种公交车辆从起点到终点总行驶时间预测方法及装置。。

42、 该方法在时 空特征和属性特征等对影响公交车辆总行驶阶段的各种因素进行处理, 充分考虑到了影响 结果变化的各种因素。 采用特征组合的方式对时空特征和属性特征进行组合, 并对其中的 缺失数据进行处理, 以应对实际应用中发生的数据丢失等异常情况, 通过ConvLSTM神经网 络预测出各站停留时长、 各站行驶时长, 通过嵌入处理和标准化处理得到外部属性特征。 利 用各站停留时长、 各站行驶时长和所述外部属性在层叠LSTM神经网络对总时长进行准确的 预测。 本发明提出的方法能够辅助现有公交公司进行调度决策, 帮助调度员及时发现晚点 车辆, 并根据预测结果作出合理的调度决策。 附图说明 0056 为了更。

43、清楚地说明本发明实施例中的技术方案, 下面将对实施例描述中所需要使 用的附图作简要介绍, 显而易见地, 下面描述中的附图仅仅是本发明的一些实施例, 对于本 领域的普通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他 的附图。 0057 图1是本申请的一个实施例可以应用于其中的示例性系统架构图; 0058 图2为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的时空特征 和外部属性获取的流程示意图; 0059 图3为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的流程示意 图; 0060 图4为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的步骤S2。

44、的 流程示意图; 0061 图5为本发明的实施例的公交车辆从起点到终点总行驶时间预测方法的步骤S3的 流程示意图; 0062 图6为本发明的实施例的公交车辆从起点到终点总行驶时间预测装置的流程示意 图; 0063 图7为本发明的实施例一中采用的ConvLSTM网络的结构图: 0064 图8为本发明的实施例一中采用本申请的公交车辆从起点到终点总行驶时间预测 方法得到的结果示意图; 0065 图9为本发明的实施例一中使用LSTM、 CNN等深度学习方法进行预测得到的结果示 意图; 0066 图10为本发明的实施例一中使用Adaboost、 DecisionTree、 SVM及HP方法与深度学 习方。

45、法进行预测得到的结果示意图; 0067 图11是适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。 说明书 6/15 页 11 CN 110570678 A 11 具体实施方式 0068 为了使本发明的目的、 技术方案和优点更加清楚, 下面将结合附图对本发明作进 一步地详细描述, 显然, 所描述的实施例仅仅是本发明一部分实施例, 而不是全部的实施 例。 基于本发明中的实施例, 本领域普通技术人员在没有做出创造性劳动前提下所获得的 所有其它实施例, 都属于本发明保护的范围。 0069 图1示出了可以应用本申请实施例的公交车辆从起点到终点总行驶时间预测方法 或公交车辆从起点到终点总行驶时。

46、间预测装置的示例性系统架构100。 0070 如图1所示, 系统架构100可以包括终端设备101、 102、 103, 网络104和服务器105。 网络104用以在终端设备101、 102、 103和服务器105之间提供通信链路的介质。 网络104可以 包括各种连接类型, 例如有线、 无线通信链路或者光纤电缆等等。 0071 用户可以使用终端设备101、 102、 103通过网络104与服务器105交互, 以接收或发 送消息等。 终端设备101、 102、 103上可以安装有各种应用, 例如数据处理类应用、 文件处理 类应用等。 0072 终端设备101、 102、 103可以是硬件, 也可以。

47、是软件。 当终端设备101、 102、 103为硬 件时, 可以是各种电子设备, 包括但不限于智能手机、 平板电脑、 膝上型便携计算机和台式 计算机等等。 当终端设备101、 102、 103为软件时, 可以安装在上述所列举的电子设备中。 其 可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块), 也可以实 现成单个软件或软件模块。 在此不做具体限定。 0073 服务器105可以是提供各种服务的服务器, 例如对终端设备101、 102、 103上传的文 件或数据进行处理的后台数据处理服务器。 后台数据处理服务器可以对获取的文件或数据 进行处理, 生成处理结果。 0074 需要。

48、说明的是, 本申请实施例所提供的公交车辆从起点到终点总行驶时间预测方 法可以由服务器105执行, 也可以由终端设备101、 102、 103执行, 相应地, 公交车辆从起点到 终点总行驶时间预测装置可以设置于服务器105中, 也可以设置于终端设备101、 102、 103 中。 0075 应该理解, 图1中的终端设备、 网络和服务器的数目仅仅是示意性的。 根据实现需 要, 可以具有任意数目的终端设备、 网络和服务器。 在所处理的数据不需要从远程获取的情 况下, 上述系统架构可以不包括网络, 而只需服务器或终端设备。 0076 首选需要获得时空特征和外部属性, 如图2所示, 时空特征和外部属性通。

49、过以下步 骤得到: 0077 S11: 获取车辆原始到离站数据, 并对其进行数据清洗以及转换得到车辆属性、 驾 驶员属性、 天气属性和时间属性。 0078 其中, 车辆原始到离站数据为公交线路上下行收集到的所有车辆进站及出站信 息。 进行特征提取前, 需要先将车辆原始到离站数据按日期进行分割, 将分割后的每一天的 车辆原始到离站数据根据上下行、 车辆id、 获取到离站数据的时间进行排列, 将同一趟数据 划分到同一组中, 剔除组内的脏数据。 这些脏数据包括: 重复的到离站记录、 同一站的进站 时间在该站出站时间之后的、 到达后一站的时间在到达前一站之前的数据以及同一趟的到 离站数据大量丢失的数据。

50、等。 0079 数据清洗后进行包括线路、 方向、 车辆及驾驶员信息的处理。 其中, 线路和方向数 说明书 7/15 页 12 CN 110570678 A 12 据可从车辆原始到离站数据中直接获取。 车辆原始到离站数据中车辆数据需要先经过一定 规则的转换, 转换成计划班次信息中可识别的车辆id, 根据此车辆id查询驾驶员id, 以车辆 id和驾驶员id分别作为车辆特征和驾驶员特征的区分, 因此可以得到车辆属性和驾驶员属 性。 0080 在获得的原始天气数据中, 利用到的主要字段为时间与天气描述。 其中, 时间需要 处理成为日期与时间段; 天气描述需要将晴、 多云、 大雾等转换为可利用的数字描述。

展开阅读全文
内容关键字: 公交 车辆 起点 终点 行驶 时间 预测 方法 装置
关于本文
本文标题:公交车辆从起点到终点总行驶时间预测方法及装置.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/11090220.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1