基于深度学习的船舶流量预测方法.pdf

上传人:伱** 文档编号:9318818 上传时间:2021-05-13 格式:PDF 页数:16 大小:885.13KB
收藏 版权申诉 举报 下载
基于深度学习的船舶流量预测方法.pdf_第1页
第1页 / 共16页
基于深度学习的船舶流量预测方法.pdf_第2页
第2页 / 共16页
基于深度学习的船舶流量预测方法.pdf_第3页
第3页 / 共16页
文档描述:

《基于深度学习的船舶流量预测方法.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的船舶流量预测方法.pdf(16页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010041100.4 (22)申请日 2020.01.15 (71)申请人 上海海事大学 地址 201306 上海市浦东新区临港新城海 港大道1550号 (72)发明人 武绘芹黄洪琼 (74)专利代理机构 上海元好知识产权代理有限 公司 31323 代理人 徐雯琼章丽娟 (51)Int.Cl. G06F 17/14(2006.01) G06Q 10/04(2012.01) G06Q 10/08(2012.01) G06Q 50/30(2012.01) G06N 3/04(。

2、2006.01) G06N 3/08(2006.01) (54)发明名称 一种基于深度学习的船舶流量预测方法 (57)摘要 本发明公开了一种基于深度学习的船舶流 量预测方法, 基于改进的孤立森林-互补集合经 验模态分解-长短期记忆神经网络的船舶流量预 测方法; 首先考虑到原始数据中的噪声和异常点 的问题, 使用孤立森林算法消除数据中的异常 点; 其次为了进一步提高预测精度, 使用改进的 互补集合经验模态分解算法将输入数据分解为 不同频率的固有模式函数分量和残余分量, 再分 别单独使用长短期记忆神经网络预测每个本征 模式函数和残差, 最后对预测的结果进行叠加重 构。 本发明不仅提高了预测精度, 。

3、且对长期或短 期的时间序列数据都有较好的适应性。 权利要求书4页 说明书9页 附图2页 CN 111241466 A 2020.06.05 CN 111241466 A 1.一种基于深度学习的船舶流量预测方法, 其特征在于, 该方法包含: 步骤S1、 采用森林孤立算法去除原始船舶流量数据X(t)的异常点; 步骤S2、 对去除异常点的船舶流量数据进行平稳性验证; 步骤S3、 对经过步骤S2验证得到的非平稳性的船舶流量数据S(t)进行互补集合经验模 态分解, 获得有限个平稳的本征模函数分量和一个残余分量; 步骤S4、 将步骤S3中得到的所述有限个平稳的本征模函数分量和一个残余分量作为长 短期记忆神。

4、经网络的输入, 对该有限个平稳的本征模函数分量和残余分量分别进行网络预 测, 并将得到各独立的长短期记忆神经网络的预测分量值进行叠加, 得到船舶流量预测结 果。 2.如权利要求1所述的船舶流量预测方法, 其特征在于, 所述步骤S3中的互补集合经验模态分解包含以下步骤: 步骤S31、 通过多次在所述非平稳性的船舶流量数据S(t)中加入一对互补白噪声, 依次 得到已加白噪声的待分解的一对船舶流量数据; 步骤S32、 对所述待分解的一对船舶流量数据分别进行经验模态分解, 得到对应的本征 模函数分量序列和残余分量; 步骤S33、 根据本征模函数分量序列, 集成平均本征模函数分量; 步骤S34、 将分解。

5、后得到的所述平均本征模函数分量进行排列熵算法检查, 得到伪分量 并去除所述伪分量, 再将去除伪分量后的剩余分量进行经验模态分解, 得到最终的有限个 平稳的本征模函数分量和一个残余分量。 3.如权利要求1所述的船舶流量预测方法, 其特征在于, 所述步骤S1中, 通过不断地分割原始船舶流量数据集X, 用以孤立出异常点, 并对去除 异常点的船舶流量数据进行归一化处理; 分割原始船舶流量数据集是指通过反复随机选取样本特征, 不断地分割原始船舶流量 数据集, 直到每个样本点均为孤立。 4.如权利要求1所述的船舶流量预测方法, 其特征在于, 所述步骤S2中进一步包含: 采用ADF检验方法对去除异常点的船舶。

6、流量数据的时间序 列进行平稳性校验, 当所述去除异常点的船舶流量数据的时间序列平稳, 则不存在单位根, 反之, 则存在单位根。 5.如权利要求2所述的船舶流量预测方法, 其特征在于, 所述步骤S31中, 进一步包含以下过程: 在非平稳性的船舶流量数据S(t)中分别多次加入一对相反且大小相等的白噪声, 分别依次得 到已添加白噪声后的一对船舶流量数据和 式中, ni(t)为添加的白噪声信号, i1,2,.,Ne, Ne表示添加白噪声的对数。 6.如权利要求5所述的船舶流量预测方法, 其特征在于, 所述步骤S32中, 将已添加白噪声后的船舶流量数据和均作为以下经验模态 分解过程中的待分解的船舶流量数。

7、据S (t), 分别进行经验模态分解, 具体包含: 步骤S32-1、 找出待分解的船舶流量数据S (t)的所有极大值和极小值, 用四次Hermite 插值去拟合上下包络线, 上下包络线分别为m1、 m2, 取这上下两条包络线的平均值m(t) 权利要求书 1/4 页 2 CN 111241466 A 2 (m1+m2)/2, 得到新序列h1(t)S (t)-m(t); 当得到的新序列h1(t)存在正的极小值或者负 的极大值, 则一直重复此步骤S321, 直至找到第一个本征模态数IMF1, 得到新数据S (t)- IMF1; 步骤S32-2、 将得到新数据S (t)-IMF1作为下一循环中步骤S3。

8、2-1的S (t), 循环执行步 骤S32-1, 直至将待分解的船舶流量数据S (t)分解为多个本征模函数分量和一个残余的单 调分量R(t), 得到公式(1): S(t)IMF1+IMF2+IMF3+IMFm+R(t) (1) 将船舶流量数据和对应地代入到公式(1)中, 进一步得到公式(2)和公式 (3): 船舶流量数据和通过经验模态分解得到各自的各自得到第一个本征模函数 分量分别为IMFi1、 IMFi1(i1,2,.,Ne), 它们的分量序列, 分别表示为和 则; 7.如权利要求6所述的船舶流量预测方法, 其特征在于, 所述步骤S33中, 进一步包含: 根据步骤S32-2中的由和通过EMD。

9、分解得出第一个本征模函数分量分别为 IMFi1和IMFi1(i1,2,.,Ne), 集成第一个本征模函数分量, 如下: 其中, N表示原始船舶流量序列的长度。 8.如权利要求7所述的船舶流量预测方法, 其特征在于, 所述步骤S34中, 进一步包含: 步骤S34-1、 对于船舶流量数据S(t)时间序列相空间重构后得到的矩阵, 该矩阵的每一 行都得到一种符号序列, 记为S(l)(j1,j2,.,jm), 式中, l1,2,.,k且km! , m维空间 映射m! 种符号序列(j1,j2,.,jm); 若每种符号序列S(l)出现的概率分别为P1,P2,.,Pk, 则船舶流量数据S(t)时间序列 的排列。

10、熵为:进一步地, 对排列熵归一化后得到: 0HpHp(m)/ln (m! )1; 步骤S34-2、 执行步骤S34-1, 计算第一个平均本征模函数分量I1(t)的排列熵, 将第一个 平均本征模函数分量I1(t)与排列熵设定值进行比较, 判断第一个平均本征模函数分量I1 (t)是否为异常信号: 当第一个平均本征模函数分量I1(t)大于排列熵设定值, 则第一个平 权利要求书 2/4 页 3 CN 111241466 A 3 均本征模函数I1(t)是异常信号; 若第一个平均本征模函数分量I1(t)小于排列熵设定值, 则 第一个平均本征模函数分量I1(t)不是异常信号; 当判断结果是第一个平均本征模函。

11、数分量I1(t)为异常信号, 则循环执行步骤S32和 S33, 直至判断出第p个平均本征模函数分量Ip(t)不是异常信号, p1,2,.,Ne; Ip(t)为: S34-3、 将已分解的前p-1个平均本征模函数分量从待分解的船舶流量数据S(t)中分离 出来, 得到r(t)是指分离后的剩余信号; S34-4、 对剩余信号r(t)进行经验模态分解, 得到船舶流量数据的最终分解: dl(t)表示最终得到平稳的本征模函数分量; R” (t)表示残余分 量。 9.如权利要求8所述的船舶流量预测方法, 其特征在于, 所述步骤S4中, 进一步包含: 步骤S41、 将分解后的本征模函数和残余分量R” (t)反。

12、归一化后作为长短期记忆 神经网络的输入; 步骤S42、 长短期记忆神经网络的输入门It、 忘记门Ft、 输出门Ot及记忆单元的输入状态 表达式分别如下所示: 式中, Xt是t时刻长短期记忆神经网络的输入, 包含步骤S34-4中的本征模函数 和残余分量R” (t); W1i, W1f, W1o, W1c分别为Xt的权重;分别为Ht-1的权重; bi, bf, bo, bc分别为输入门、 忘记门、 输出门、 记忆单元的偏置; 为sigmoid函数; 长短期记忆神经网络的记忆线的t时刻输出Ct的表达式为: 式中, Ct-1表示长短期记忆神经网络的记忆线的t-1时刻输出; 长短期记忆神经网络的隐藏层的。

13、输出Ht如下: HtOttanh(Ct-1) 式中, tanh为双曲线正切函数。 步骤S43、 长短期记忆神经网络的输出为: Y(t)W2Ht+b; 式中, W2为长短期记忆神经网络的输出层和隐藏层之间的权值矩阵; b为长短期记忆神 权利要求书 3/4 页 4 CN 111241466 A 4 经网络的输出层的偏向; 步骤S44、 通过长短期记忆神经网络输出的各预测分量值进行叠加, 得到最终预测的结 果: Y(t)Y1+Y2+Y3+Ym+Yr; 式中, Y1、 Y2、 Y3Ym分别是长短期记忆神经网络预测本征模函数的各预测值, Yr是残 留分量预测值。 权利要求书 4/4 页 5 CN 111。

14、241466 A 5 一种基于深度学习的船舶流量预测方法 技术领域 0001 本发明涉及时间序列预测技术领域, 具体涉及一种基于深度学习的船舶流量预测 方法, 特别涉及一种基于改进的IF-CEEMD-LSTM(孤立森林-互补集合经验模态分解-长短期 记忆神经网络)的船舶流量预测方法。 背景技术 0002 现代海上贸易的增加, 海上船舶流量的预测精确度对保障船舶通行效率和安全、 拓宽水运交通领域理论、 港口和海事部门对港口建设和发展以及对航道进行有效利用很有 必要。 但交通流量预测过程比较复杂, 受多种因素的影响, 有季节、 GDP、 港口集装箱吞吐量、 港口货物吞吐量等。 0003 过去大部分。

15、采用传统机器学习的方法建模预测船舶流量, 根据船舶流量众多的影 响因素中, 选取对预测结果影响较大的因素, 作为模型数据输入的一部分。 现在, 根据船舶 流量的数据特点, 处理其原始数据, 减少因数据的复杂度对预测精度影响; 其次通过船舶流 量的数据本身来揭示影响船舶流量的因素, 这样就规避了传统方法的选取因素的不确定 性, 并且还可以提高预测的精确度。 0004 目前, 国内外对船舶流量预测的研究很丰富, 主要有神经网络, 时间序列模型, 支 持向量机, 和组合预测等。 其中神经网络对非线性的数据具有很好的拟合, 循环神经网络 (RNN)是常用来对时间序列数据的预测, 但其存在梯度爆炸或梯度。

16、消失的问题, 因此由长短 期记忆神经网络来处理这一问题。 由于单一的模型不能满足预测的精度, 现在时间序列的 预测方法都是两种模型以上的有效的结合。 0005 针对现有时间序列预测技术精度不高, 船舶流量数据非线性和非平稳性的特点以 及循环神经网络存在梯度消失等问题, 需要研发一种改进IF-CEEMD-LSTM(IF是指 Isolation Forest, 即孤立森林算法; CEEMD是指改进互补集合经验模态分解; LSTM是指 Long Short Term网络, 即长短期记忆神经网络)预测的方法, 对长期或短期时间序列数据 预测都有较好的适应性, 在预测中具有优越的性能。 发明内容 000。

17、6 本发明的目的在于提供一种基于改进IF-CEEMD-LSTM的船舶流量预测方法, 在深 度学习的环境下, 建立森林孤立算法和互补集合经验模态分解和长短期记忆神经网络的模 型, 通过森林孤立算法去除原始数据中的异常分量, 然后采用互补集合经验模态分解对原 始船舶流量数据分解为有限个平稳的本征模函数分量和一个余数分量, 结合排列熵算法去 除分解后的伪分量, 再用优化好参数的长短期记忆神经网络模型对分解后的数据单独进行 预测, 最后对各个预测分量进行叠加, 就是最终的预测的结果; 本发明对长或短期时间序列 具有较好的适应性, 同时也提高了预测精度。 0007 为了达到上述目的, 本发明通过以下技术。

18、方案实现: 0008 一种基于深度学习的船舶流量预测方法, 该方法包含: 说明书 1/9 页 6 CN 111241466 A 6 0009 步骤S1、 采用森林孤立算法去除原始船舶流量数据X(t)的异常点; 0010 步骤S2、 对去除异常点的船舶流量数据进行平稳性验证; 0011 步骤S3、 对经过步骤S2验证得到的非平稳性的船舶流量数据S(t)进行互补集合经 验模态分解, 获得有限个平稳的本征模函数分量和一个残余分量; 0012 步骤S4、 将步骤S3中得到的所述有限个平稳的本征模函数分量和一个残余分量作 为长短期记忆神经网络的输入, 对该有限个平稳的本征模函数分量和残余分量分别进行网 。

19、络预测, 并将得到各独立的长短期记忆神经网络的预测分量值进行叠加, 得到船舶流量预 测结果。 0013 可选地, 所述步骤S3中的互补集合经验模态分解包含以下步骤: 0014 步骤S31、 通过多次在所述非平稳性的船舶流量数据S(t)中加入一对互补白噪声, 依次得到已加白噪声的待分解的一对船舶流量数据; 0015 步骤S32、 对所述待分解的一对船舶流量数据分别进行经验模态分解, 得到对应的 本征模函数分量序列和残余分量; 0016 步骤S33、 根据本征模函数分量序列, 集成平均本征模函数分量; 0017 步骤S34、 将分解后得到的所述平均本征模函数分量进行排列熵算法检查, 得到伪 分量并。

20、去除所述伪分量, 再将去除伪分量后的剩余分量进行经验模态分解, 得到最终的有 限个平稳的本征模函数分量和一个残余分量。 0018 可选地, 所述步骤S1中, 通过不断地分割原始船舶流量数据集X, 用以孤立出异常 点, 并对去除异常点的船舶流量数据进行归一化处理; 0019 分割原始船舶流量数据集是指通过反复随机选取样本特征, 不断地分割原始船舶 流量数据集, 直到每个样本点均为孤立。 0020 可选地, 所述步骤S2中进一步包含: 采用ADF检验方法对去除异常点的船舶流量数 据的时间序列进行平稳性校验, 当所述去除异常点的船舶流量数据的时间序列平稳, 则不 存在单位根, 反之, 则存在单位根。。

21、 0021 可选地, 所述步骤S31中, 进一步包含以下过程: 0022 在非平稳性的船舶流量数据S(t)中分别多次加入一对相反且大小相等的白噪声, 分别依次得到已添加白噪声后的一对船舶流量数据和 0023 式中, ni(t)为添加的白噪声信号, i1,2,.,Ne, Ne表示添加白噪声的对数。 0024可选地, 所述步骤S32中, 将已添加白噪声后的船舶流量数据和均作为 以下经验模态分解过程中的待分解的船舶流量数据S (t), 分别进行经验模态分解, 具体包 含: 0025 步骤S32-1、 找出待分解的船舶流量数据S (t)的所有极大值和极小值, 用四次 Hermite插值去拟合上下包络线。

22、, 上下包络线分别为m1、 m2, 取这上下两条包络线的平均值m (t)(m1+m2)/2, 得到新序列h1(t)S (t)-m(t); 当得到的新序列h1(t)存在正的极小值 或者负的极大值, 则一直重复此步骤S321, 直至找到第一个本征模态数IMF1, 得到新数据S (t)-IMF1; 0026 步骤S32-2、 将得到新数据S (t)-IMF1作为下一循环中步骤S32-1的S (t), 循环执 说明书 2/9 页 7 CN 111241466 A 7 行步骤S32-1, 直至将待分解的船舶流量数据S (t)分解为多个本征模函数分量和一个残余 的单调分量R(t), 得到公式(1): 00。

23、27 S(t)IMF1+IMF2+IMF3+IMFm+R(t) (1) 0028将船舶流量数据和对应地代入到公式(1)中, 进一步得到公式(2)和公 式(3): 0029 0030 0031船舶流量数据和通过经验模态分解得到各自的各自得到第一个本征模 函数分量分别为IMFi1、 IMFi1(i1,2,.,Ne), 它们的分量序列, 分别表示为和 则; 0032 0033 0034 可选地, 所述步骤S33中, 进一步包含: 0035根据步骤S32-2中的由和通过EMD分解得出第一个本征模函数分量分别 为IMFi1和IMFi1(i1,2,.,Ne), 集成第一个本征模函数分量, 如下: 0036。

24、 0037 其中, N表示原始船舶流量序列的长度。 0038 可选地, 所述步骤S34中, 进一步包含: 0039 步骤S34-1、 对于船舶流量数据S(t)时间序列相空间重构后得到的矩阵, 该矩阵的 每一行都得到一种符号序列, 记为S(l)(j1,j2,.,jm), 式中, l1,2,.,k且km! , m维 空间映射m! 种符号序列(j1,j2,.,jm); 0040 若每种符号序列S(l)出现的概率分别为P1,P2,.,Pk, 则船舶流量数据S(t)时间 序列的排列熵为:进一步地, 对排列熵归一化后得到: 0HpHp(m)/ ln(m! )1; 0041 步骤S34-2、 执行步骤S34。

25、-1, 计算第一个平均本征模函数分量I1(t)的排列熵, 将 第一个平均本征模函数分量I1(t)与排列熵设定值进行比较, 判断第一个平均本征模函数 分量I1(t)是否为异常信号: 当第一个平均本征模函数分量I1(t)大于排列熵设定值, 则第一 个平均本征模函数I1(t)是异常信号; 若第一个平均本征模函数分量I1(t)小于排列熵设定 值, 则第一个平均本征模函数分量I1(t)不是异常信号; 0042 当判断结果是第一个平均本征模函数分量I1(t)为异常信号, 则循环执行步骤S32 和S33, 直至判断出第p个平均本征模函数分量Ip(t)不是异常信号, p1,2,.,Ne; Ip(t) 为: 说。

26、明书 3/9 页 8 CN 111241466 A 8 0043 S34-3、 将已分解的前p-1个平均本征模函数分量从待分解的船舶流量数据S(t)中 分离出来, 得到r(t)是指分离后的剩余信号; 0044 S34-4、 对剩余信号r(t)进行经验模态分解, 得到船舶流量数据的最终分解: dl(t)表示最终得到平稳的本征模函数分量; R” (t)表示残余分 量。 0045 可选地, 所述步骤S4中, 进一步包含: 0046步骤S41、 将分解后的本征模函数和残余分量R” (t)反归一化后作为长短期 记忆神经网络的输入; 0047 步骤S42、 长短期记忆神经网络的输入门It、 忘记门Ft、 。

27、输出门Ot及记忆单元的输入 状态表达式分别如下所示: 0048 0049 0050 0051 0052 式中, Xt是t时刻长短期记忆神经网络的输入, 包含步骤S34-4中的本征模函数 和残余分量R” (t);分别为Xt的权重;分 别为Ht-1的权重; bi, bf, bo, bc分别为输入门、 忘记门、 输出门、 记忆单元的偏置; 为sigmoid 函数; 0053 长短期记忆神经网络的记忆线的t时刻输出Ct的表达式为: 0054 0055 式中, Ct-1表示长短期记忆神经网络的记忆线的t-1时刻输出; 0056 长短期记忆神经网络的隐藏层的输出Ht如下: 0057 HtOttanh(Ct。

28、-1) 0058 式中, tanh为双曲线正切函数。 0059 步骤S43、 长短期记忆神经网络的输出为: Y(t)W2Ht+b; 0060 式中, W2为长短期记忆神经网络的输出层和隐藏层之间的权值矩阵; b为长短期记 忆神经网络的输出层的偏向; 0061 步骤S44、 通过长短期记忆神经网络输出的各预测分量值进行叠加, 得到最终预测 的结果: 0062 Y(t)Y1+Y2+Y3+Ym+Yr; 0063 式中, Y1、 Y2、 Y3Ym分别是长短期记忆神经网络预测本征模函数的各预测值, Yr 是残留分量预测值。 0064 与现有技术相比, 本发明的有益效果在于: 本发明针对船舶流量数据的非线。

29、性非 说明书 4/9 页 9 CN 111241466 A 9 平稳性特点, 采用改进互补集合经验模态进行分解(complementary ensemble empirical mode decomposition, CEEMD), 减少了船舶流量数据处理的复杂度, 减少了分解后的伪分 量, 提高了预测时效性; 本发明中, 由于CEEMD(改进互补集合经验模态分解)用到了EMD(经 验模态分解)算法, 对EMD算法中采用的三次样条插值改为四次Hermite插值, 解决了算法存 在的过冲和欠冲的问题; 用训练好的长短期记忆神经网路模型去预测, 预测精度提高, 且该 模型对不同时间尺度的时间序列具。

30、有较好的适应性。 附图说明 0065 图1为本发明的基于改进的IF-CEEMD-LSTM的船舶流量预测方法流程图; 0066 图2为本发明改进的互补集合经验模态分解图; 0067 图3为本发明长短期记忆神经网络记忆单元。 具体实施方式 0068 使本发明实施例的目的、 技术方案和优点更加清楚, 下面将结合本发明实施例中 的附图, 对本发明实施例中的技术方案进行清楚、 完整地描述, 显然, 所描述的实施例仅仅 是本发明一部分实施例, 而不是全部的实施例。 基于本发明中的实施例, 本领域普通技术人 员在没有做出创造性劳动前提下所获得的所有其他实施例, 都属于本发明保护的范围。 0069 本发明提供。

31、了一种基于改进的IF-CEEMD-LSTM(孤立森林-互补集合经验模态分 解-长短期记忆神经网络)的船舶流量预测方法, 首先用森林孤立算法去除原始船舶数据中 的异常分量后归一化处理; 然后在归一化处理后的船舶流量数据中加入一对互补的白噪声 后; 再对已加入白噪声后的船舶流量数据进行互补集合经验模态分解, 得到有限个平稳的 本征模函数分量和一个单调的残余分量, 并结合排列熵算法去除分解后的伪分量; 最后把 这些分量送到长短期记忆神经网络单独进行预测, 把预测后单独分量的值进行叠加就是最 后的预测结果。 本发明在深度学习的环境下, 建立IF-CEEMD-LSTM的模型, 解决了传统方法 因素选取不。

32、确定及原始数据复杂度影响预测精度问题。 0070 如图1-图3结合所示, 具体地, 本发明的基于改进的IF-CEEMD-LSTM的船舶流量预 测方法包含以下步骤: 0071 步骤S1、 数据预处理; 0072 所述步骤S1中进一步包含: 采用森林孤立算法(IF)去除原始船舶流量数据X(t)的 异常点, 得到去除异常点的船舶流量数据S(t); 所述孤立森林算法是通过不断地分割原始 船舶流量数据集X(t), 从而把异常点给孤立出来; 而分割原始船舶流量数据集X(t)的依据 是反复随机选取样本特征, 不断地分割数据集X(t), 直到每个样本点都是孤立为止。 在此情 况下, 异常点因为具有不同或者特殊。

33、的特征值, 因此异常点的路径通常很短, 也会比较早被 分离出来, 去除异常点后再对船舶流量数据S(t)进行归一化处理。 0073 步骤S2、 对经过数据预处理后的船舶流量数据S(t)进行平稳性验证; 0074 所述步骤S2中进一步包含: 采用ADF检验方法对船舶流量数据S(t)的时间序列进 行平稳性校验, 当船舶流量数据S(t)的时间序列平稳, 则不存在单位根, 反之, 则存在单位 根。 0075 步骤S3、 通过步骤S2校验得到的非平稳性的船舶流量数据S(t)进行改进的互补集 说明书 5/9 页 10 CN 111241466 A 10 合经验模态分解(CEEMD), 得到有限个平稳的本征模。

34、函数分量和一个残余分量。 0076 如图2所示是改进的互补集合经验模态分解图。 本发明中的改进的互补集合经验 模态分解的算法步骤如下所说; 步骤S3中进一步包含以下内容(即改进互补集合经验分解 原理如下): 0077 S31、 在船舶流量数据S(t)中分别多次加入一对互补(相反且大小相等)的白噪声, 则分别得到添加白噪声后的一对船舶流量数据和 式中, ni(t)为添加的白噪声信号, i1,2,.,Ne, Ne表示添加白噪声的对数。 0078S32、 对已添加白噪声后的一对船舶流量数据和分别进行EMD分解, 分别 得到各自的IMF分量序列(也称本征模函数分量序列)。 0079所述步骤S32进一步。

35、包含: 将船舶流量数据和分别看做下述EMD分解(经 验模态分解算法)过程中的待分解的船舶流量数据S (t), 具体如下: 0080 步骤S32-1、 找出待分解的船舶流量数据S (t)的所有极大值和极小值, 用四次 Hermite插值去拟合其上、 下包络线, 上、 下包络线分别为m1、 m2, 然后取这上下两条包络线 的平均值m(t)(m1+m2)/2, 从而得到新序列h1(t)S (t)-m(t); 其中, 若得到的新序列h1 (t)存在正的极小值或者负的极大值, 则一直重复此步骤S32-1, 直至找到第一本征模态数 IMF1, 从而得到新数据S (t)-IMF1; 0081 步骤S32-2。

36、、 根据得到的新数据S (t)-IMF1, 并将该新数据S (t)-IMF1作为下一循 环的步骤S32-1中的S (t), 循环执行步骤S32-1, 直至将最初的待分解的船舶流量数据S (t)分解为有限个(如m个)IMF分量(本征模函数分量)和一个残余的单调分量R(t), 得到公 式(1): 0082 S(t)IMF1+IMF2+IMF3+IMFm+R(t) (1)。 0083对应地, 将船舶流量数据和对应地代入到公式(1)中, 进一步得到公式 (2)和公式(3): 0084 0085 0086根据公式(2)和公式(3)可知, 加入噪声的船舶流量数据和由加入不同 的成对噪声, 可得到通过EMD。

37、分解各自得到第一个本征模 函数分量分别为IMFi1、 IMFi1, 它们的分量序列, 分别表示为和(i1 , 2,.,Ne)则: 0087 0088 0089S33、 根据步骤S32-2中的由和通过EMD分解得出第一个本征模函数分量 分别为IMFi1和IMFi1(i1,2,.,Ne), 集成第一个平均本征模函数分量, 如下: 说明书 6/9 页 11 CN 111241466 A 11 0090 0091 其中, N表示原始船舶流量序列的长度。 0092 步骤S34、 对步骤S33得到的分解后的平均IMF分量做排列熵算法检查, 在判断步骤 S33得到的平均IMF分量是否为异常分量后, 去除伪分。

38、量后, 再对剩下的分量进行EMD分解。 0093 所述步骤S34进一步包含以下过程: 0094 S34-1、 对于船舶流量数据S(t)时间序列的相空间重构后得到的矩阵, 矩阵的每一 行都得到一组符号序列, 记为S(l)(j1,j2,.,jm), 式中, l1,2,.,k且km! , 即m维空 间映射m! 种符号序列(j1,j2,.,jm); 这里表示的S(l)为符号序列, S(l)是这些排列中一 种。 0095 若每种S(l)符号序列出现的概率分别为P1,P2,.,Pk, 则船舶流量数据S(t)时间 序列的排列熵为: 0096 0097 进一步地, 对排列熵归一化后得到: 0098 0HpHp。

39、(m)/ln(m! )1 (8)。 0099 S34-2、 执行步骤S34-1, 计算平均IMF分量I1(t)的排列熵, 检查平均IMF分量I1(t) 是不是异常信号: 设定平稳信号的排列熵的范围为0.550.6(本示例选取的是0.6, 但本发 明并不局限于该范围), 将平均IMF分量I1(t)的排列熵与设定值0.6比较: 若大于设定值 0.6, 则平均IMF分I1(t)是异常信号, 若小于设定值0.6, 则第一个平均IMF分I1(t)不是异常 信号。 在所述步骤S34-2中, 如果判断结果是平均IMF分I1(t)为异常信号, 则循环执行步骤 S32和S33, 直至判断出第p个平均IMF分量I。

40、p(t)不是异常信号, p1,2,.,Ne, 则Ip(t)为: 0100 0101 S34-3、 将已分解的前p-1个平均IMF分量从最初的船舶流量数据S(t)中分离出来, 得到r(t)是指船舶流量数据S(t)分离后的剩余信号。 0102 S34-4、 再对剩余信号r(t)进行EMD分解, 即一直重复上述步骤S32-1, 直至找到第 一个本征模态数d1, 从而得到新数据r(t)-d1作为为下一循环的步骤S32-1中的S (t), 循环 执行步骤S32-1, 最终将剩余信号r(t)分解为有限个本征模函数分量dl(t)和一个残余单调 分量R” (t)为: 0103 0104 即得到船舶流量的最终分。

41、解为: 0105 0106 dl(t)表示最终得到IMF分量, 它本质上就是本征模数分量, 为了与上述本征模数 区分, 这里用dl(t)表示; R” (t)表示残余分量。 说明书 7/9 页 12 CN 111241466 A 12 0107 S4、 对步骤S34分解后的每个本征模函数和余数分别单独使用长短期记忆神经网 络进行预测, 将得到各独立的长短期记忆神经网络的预测分量值进行叠加, 得到船舶流量 预测结果。 其中, 图3是长短期记忆神经网络的记忆单元示意图。 以下进一步阐述长短期记 忆神经网路的预测部分。 本发明对长短期记忆神经网络(LSTM)的数据输入设置timestep、 bach_。

42、size、 epoch, 通过大量的数据对长短期记忆神经网络模型进行训练, 选取最优的神经 网络参数, 达到好的预测效果。 0108 所述步骤S4进一步包含以下: 0109S41、 将船舶流量数据S(t)分解后的本征模函数和残余分量R” (t)反归一化 后作为长短期记忆神经网络(LSTM)的输入; 0110 S42、 长短期记忆神经网络有输入门It、 忘记门Ft、 输出门Ot及记忆单元, 它们的输 入状态的表达式分别为: 0111 0112 0113 0114 0115 式中, Xt是t时刻长短期记忆神经网络的输入, 即上述步骤S344的本征模函数 和残余分量R(t);分别为Xt的权重;分别为。

43、 Ht-1的权重; bi, bf, bo, bc分别为输入门、 忘记门、 输出门、 记忆单元的偏置; 为sigmoid函数。 0116 长短期记忆神经网络的记忆线的t时刻输出Ct的表达式为: 0117 0118 式中, Ct-1表示LSTM记忆线的t-1时刻输出。 0119 长短期记忆神经网络的隐藏层的输出Ht如下: 0120 HtOttanh(Ct-1) (17); 0121 式中, tanh为双曲线正切函数。 0122 S43、 长短期记忆神经网络的输出为: Y(t)W2Ht+b(18); 0123 式中, W2为长短期记忆神经网络的输出层和隐藏层之间的权值矩阵; b为长短期记 忆神经网络。

44、的输出层的偏向。 0124 S44、 最后通过长短期记忆神经网络输出的各预测分量值进行叠加就是最后预测 的结果: 0125 Y(t)Y1+Y2+Y3+Ym+Yr (19); 0126 式中, Y1、 Y2、 Y3Ym分别是长短期记忆神经网络预测本征模函数的各预测值, Yr 是残留分量预测值。 0127 综上所述, 本发明根据船舶流量数据具有非线性非平稳性特点, 采用森林孤立算 法对原始数据去除异常点, 提高了数据的精准性, 进一步提高预测精度; 采用的改进互补集 说明书 8/9 页 13 CN 111241466 A 13 合经验模态分解对原始数据分解为平稳的时间序列, 去除了伪分量的可能, 。

45、提高了预测时 效性; 由于CEEMD用到了EMD算法, 对EMD算法中采用的三次样条插值改为四次Hermite插值, 解决了算法存在的过冲和欠冲的问题, 又提高了IMF分量的准确性; 再利用长短期记忆神经 网络神经元的记忆特性, 选择合适的参数学习和训练数据, 能够根据时间序列数据之间隐 藏的关联性, 进行更好的拟合和预测, 也规避了循环神经网的梯度消失或爆炸问题。 与传统 相比, 本发明具有更广泛的实用性, 且提高了预测精度。 0128 尽管本发明的内容已经通过上述优选实施例作了详细介绍, 但应当认识到上述的 描述不应被认为是对本发明的限制。 在本领域技术人员阅读了上述内容后, 对于本发明的 多种修改和替代都将是显而易见的。 因此, 本发明的保护范围应由所附的权利要求来限定。 说明书 9/9 页 14 CN 111241466 A 14 图1 图2 说明书附图 1/2 页 15 CN 111241466 A 15 图3 说明书附图 2/2 页 16 CN 111241466 A 16 。

展开阅读全文
内容关键字: 基于 深度 学习 船舶 流量 预测 方法
关于本文
本文标题:基于深度学习的船舶流量预测方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9318818.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1