空气污染物浓度预测方法、装置、电子设备及存储介质.pdf
《空气污染物浓度预测方法、装置、电子设备及存储介质.pdf》由会员分享,可在线阅读,更多相关《空气污染物浓度预测方法、装置、电子设备及存储介质.pdf(16页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010322792.X (22)申请日 2020.04.22 (71)申请人 中科三清科技有限公司 地址 100193 北京市海淀区东北旺西路8号 院36号楼5层523室 (72)发明人 孙增怡安刚张海忠秦东明 (74)专利代理机构 北京辰权知识产权代理有限 公司 11619 代理人 付婧 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 空气污染物浓度预测方法、 装。
2、置、 电子设备 及存储介质 (57)摘要 本申请提出一种空气污染物浓度预测方法、 装置、 电子设备及存储介质, 该方法包括: 获取预 设时间段内的环境监测历史数据和气象历史数 据; 根据预设时间段内的环境监测数据和气象数 据, 训练预先创建的编码-解码网络结构, 得到编 码-解码结构模型; 获取第一预设时间单位内的 环境监测数据和气象数据; 根据第一预设时间单 位内的环境监测数据和气象数据, 通过编码-解 码结构模型预测未来第二预设时间单位内的空 气污染物浓度。 本申请将编码-解码结构用于空 气质量预测, 无需进行气象预测, 就能预测出空 气污染物浓度, 预测过程简单快速, 效率和准确 率都很。
3、高。 且能对多种环境特征和气象特征进行 深层次分析, 有效利用环境大数据, 实现环境管 理水平的提升。 权利要求书2页 说明书11页 附图2页 CN 111507533 A 2020.08.07 CN 111507533 A 1.一种空气污染物浓度预测方法, 其特征在于, 所述方法包括; 获取预设时间段内的环境监测历史数据和气象历史数据; 根据所述预设时间段内的环境监测历史数据和气象历史数据, 训练预先创建的编码- 解码网络结构, 得到编码-解码结构模型; 获取第一预设时间单位内的环境监测数据和气象数据; 根据所述第一预设时间单位内的环境监测数据和气象数据, 通过所述编码-解码结构 模型预测未。
4、来第二预设时间单位内的空气污染物浓度。 2.根据权利要求1所述的方法, 其特征在于, 所述根据所述预设时间段内的环境监测历 史数据和气象历史数据, 训练预先创建的编码-解码网络结构, 得到编码-解码结构模型, 包 括: 将所述预设时间段内的环境监测历史数据和气象历史数据划分为多个时长为第一预 设时间单位的切片数据; 从所述预设时间段内的环境监测历史数据中, 分别获取每个切片数据对应的截止时刻 之后第二预设时间单位内的空气污染物浓度; 将切片数据及其对应的第二预设时间单位内的空气污染物浓度组成数据组, 将获得的 多个数据组构成训练集; 通过所述训练集对预先创建的编码-解码网络结构进行训练, 得到。
5、编码-解码结构模 型。 3.根据权利要求2所述的方法, 其特征在于, 所述将所述预设时间段内的环境监测历史 数据和气象历史数据划分为多个时长为第一预设时间单位的切片数据, 包括: 将所述预设时间段划分为多个时长为第一预设时间单位的时间段; 将每个时间段对应的环境监测历史数据和气象历史数据分别确定为每个时间段对应 的切片数据。 4.根据权利要求3所述的方法, 其特征在于, 所述将所述预设时间段划分为多个时长为 第一预设时间单位的时间段, 包括: 以第一预设时间单位为切割窗口, 以预设时长为所述切割窗口的滑动步长, 将所述预 设时间段切割为多个时间段, 所述预设时长小于所述第一预设时间单位。 5.。
6、根据权利要求2所述的方法, 其特征在于, 所述将切片数据及其对应的第二预设时间 单位内的空气污染物浓度组成数据组, 将获得的多个数据组构成训练集, 包括: 分别计算每个切片数据对应的第二预设时间单位内的空气污染物浓度的平均值; 根据每个切片数据对应的平均值, 从所述每个切片数据中选取满足预设均衡条件的切 片数据; 将选取的切片数据及其对应的第二预设时间单位内的空气污染物浓度组成数据组, 将 组成的多个数据组构成训练集。 6.根据权利要求1-5任一项所述的方法, 其特征在于, 所述根据所述预设时间段内的环 境监测历史数据和气象历史数据, 训练预先创建的编码-解码网络结构之前, 还包括: 将第一全。
7、连接层、 第二全连接层和第三全连接层串联, 得到第一自编码器; 所述第一全 连接层包括的神经节点数目与所述环境监测历史数据中环境特征的数目相等; 将第四全连接层、 第五全连接层和第六全连接层串联, 得到第二自编码器; 所述第四全 权利要求书 1/2 页 2 CN 111507533 A 2 连接层包括的神经节点数目与所述气象历史数据中气象特征的数目相等; 将所述第一自编码器和所述第二自编码器并联, 并与拼接层和预设数目个第一循环神 经网络层串联, 得到编码器; 将第二循环神经网络层、 第七全连接层和第八全连接层串联, 得到解码器; 将所述编码器和所述解码器串联, 得到编码-解码网络结构。 7.。
8、根据权利要求6所述的方法, 其特征在于, 所述根据所述第一预设时间单位内的环境 监测数据和气象数据, 通过所述编码-解码结构模型预测未来第二预设时间单位内的空气 污染物浓度, 包括: 通过所述第一自编码器提取所述第一预设时间单位内的环境监测数据中的环境特征; 通过所述第二自编码器提取所述第一预设时间单位内的气象数据中的气象特征; 通过所述拼接层对所述环境特征和所述气象特征进行时域拼接; 通过所述第一循环神经网络层和所述解码器对拼接的所述环境特征和所述气象特征 进行预测, 获得未来第二预设时间单位内的空气污染物浓度。 8.一种空气污染物浓度预测装置, 其特征在于, 所述装置包括; 第一获取模块,。
9、 用于获取预设时间段内的环境监测历史数据和气象历史数据; 模型训练模块, 用于根据所述预设时间段内的环境监测历史数据和气象历史数据, 训 练预先创建的编码-解码网络结构, 得到编码-解码结构模型; 第二获取模块, 用于获取第一预设时间单位内的环境监测数据和气象数据; 预测模块, 用于根据所述第一预设时间单位内的环境监测数据和气象数据, 通过所述 编码-解码结构模型预测未来第二预设时间单位内的空气污染物浓度。 9.一种电子设备, 包括存储器、 处理器及存储在所述存储器上并可在所述处理器上运 行的计算机程序, 其特征在于, 所述处理器运行所述计算机程序以实现如权利要求1-7任一 项所述的方法。 1。
10、0.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 所述程序被处理 器执行实现如权利要求1-7中任一项所述的方法。 权利要求书 2/2 页 3 CN 111507533 A 3 空气污染物浓度预测方法、 装置、 电子设备及存储介质 技术领域 0001 本申请属于环境保护技术领域, 具体涉及一种空气污染物浓度预测方法、 装置、 电 子设备及存储介质。 背景技术 0002 空气污染物包括PM2.5、 PM10、 二氧化氮、 二氧化硫等, 这些空气污染物对人体健康 和大气环境都有恶劣影响。 因此对空气污染物的浓度进行预测, 对空气污染物的治理及人 类活动有重要的指导意义。 0003 。
11、相关技术中提出了一种空气污染物浓度的预测方法, 首先根据天气实况分析图和 预报图, 分析气象条件对空气污染物扩散的影响。 其次考虑外来污染输入情况, 根据周边城 市空气质量实况、 区域空气质量实况以及变化态势等, 对上风向城市制作前向轨迹图, 对未 来气团传输轨迹情况进行预测。 以及, 参考往年气象情况及往年空气质量指数, 根据近几年 对应时间段的气象条件及空气质量指数, 与往年同期相似天气形势案例进行对比分析。 另 外, 还要结合政策因素、 未来关键气象因素、 预测模型等多方面的因素, 最终预测出未来一 段时间内各空气污染物的浓度。 0004 但上述相关技术必须进行气象预测, 才能预测出空气。
12、污染物的浓度, 预测过程复 杂, 准确率低。 发明内容 0005 本申请提出一种空气污染物浓度预测方法、 装置、 电子设备及存储介质, 将编码- 解码结构用于空气质量预测, 无需进行气象预测, 就能预测出空气污染物浓度, 预测过程简 单快速, 效率和准确率都很高。 0006 本申请第一方面实施例提出了一种空气污染物浓度预测方法, 所述方法包括; 0007 获取预设时间段内的环境监测历史数据和气象历史数据; 0008 根据所述预设时间段内的环境监测历史数据和气象历史数据, 训练预先创建的编 码-解码网络结构, 得到编码-解码结构模型; 0009 获取第一预设时间单位内的环境监测数据和气象数据; 。
13、0010 根据所述第一预设时间单位内的环境监测数据和气象数据, 通过所述编码-解码 结构模型预测未来第二预设时间单位内的空气污染物浓度。 0011 在本申请的一些实施例中, 所述根据所述预设时间段内的环境监测历史数据和气 象历史数据, 训练预先创建的编码-解码网络结构, 得到编码-解码结构模型, 包括: 0012 将所述预设时间段内的环境监测历史数据和气象历史数据划分为多个时长为第 一预设时间单位的切片数据; 0013 从所述预设时间段内的环境监测历史数据中, 分别获取每个切片数据对应的截止 时刻之后第二预设时间单位内的空气污染物浓度; 0014 将切片数据及其对应的第二预设时间单位内的空气污。
14、染物浓度组成数据组, 将获 说明书 1/11 页 4 CN 111507533 A 4 得的多个数据组构成训练集; 0015 通过所述训练集对预先创建的编码-解码网络结构进行训练, 得到编码-解码结构 模型。 0016 在本申请的一些实施例中, 所述将所述预设时间段内的环境监测历史数据和气象 历史数据划分为多个时长为第一预设时间单位的切片数据, 包括: 0017 将所述预设时间段划分为多个时长为第一预设时间单位的时间段; 0018 将每个时间段对应的环境监测历史数据和气象历史数据分别确定为每个时间段 对应的切片数据。 0019 在本申请的一些实施例中, 所述将所述预设时间段划分为多个时长为第一。
15、预设时 间单位的时间段, 包括: 0020 以第一预设时间单位为切割窗口, 以预设时长为所述切割窗口的滑动步长, 将所 述预设时间段切割为多个时间段, 所述预设时长小于所述第一预设时间单位。 0021 在本申请的一些实施例中, 所述将切片数据及其对应的第二预设时间单位内的空 气污染物浓度组成数据组, 将获得的多个数据组构成训练集, 包括: 0022 分别计算每个切片数据对应的第二预设时间单位内的空气污染物浓度的平均值; 0023 根据每个切片数据对应的平均值, 从所述每个切片数据中选取满足预设均衡条件 的切片数据; 0024 将选取的切片数据及其对应的第二预设时间单位内的空气污染物浓度组成数据。
16、 组, 将组成的多个数据组构成训练集。 0025 在本申请的一些实施例中, 所述根据所述预设时间段内的环境监测历史数据和气 象历史数据, 训练预先创建的编码-解码网络结构之前, 还包括: 0026 将第一全连接层、 第二全连接层和第三全连接层串联, 得到第一自编码器; 所述第 一全连接层包括的神经节点数目与所述环境监测历史数据中环境特征的数目相等; 0027 将第四全连接层、 第五全连接层和第六全连接层串联, 得到第二自编码器; 所述第 四全连接层包括的神经节点数目与所述气象历史数据中气象特征的数目相等; 0028 将所述第一自编码器和所述第二自编码器并联, 并与拼接层和预设数目个第一循 环神。
17、经网络层串联, 得到编码器; 0029 将第二循环神经网络层、 第七全连接层和第八全连接层串联, 得到解码器; 0030 将所述编码器和所述解码器串联, 得到编码-解码网络结构。 0031 在本申请的一些实施例中, 所述根据所述第一预设时间单位内的环境监测数据和 气象数据, 通过所述编码-解码结构模型预测未来第二预设时间单位内的空气污染物浓度, 包括: 0032 通过所述第一自编码器提取所述第一预设时间单位内的环境监测数据中的环境 特征; 0033 通过所述第二自编码器提取所述第一预设时间单位内的气象数据中的气象特征; 0034 通过所述拼接层对所述环境特征和所述气象特征进行时域拼接; 003。
18、5 通过所述第一循环神经网络层和所述解码器对拼接的所述环境特征和所述气象 特征进行预测, 获得未来第二预设时间单位内的空气污染物浓度。 0036 本申请第二方面的实施例提供了一种空气污染物浓度预测装置, 所述装置包括; 说明书 2/11 页 5 CN 111507533 A 5 0037 第一获取模块, 用于获取预设时间段内的环境监测历史数据和气象历史数据; 0038 模型训练模块, 用于根据所述预设时间段内的环境监测历史数据和气象历史数 据, 训练预先创建的编码-解码网络结构, 得到编码-解码结构模型; 0039 第二获取模块, 用于获取第一预设时间单位内的环境监测数据和气象数据; 0040。
19、 预测模块, 用于根据所述第一预设时间单位内的环境监测数据和气象数据, 通过 所述编码-解码结构模型预测未来第二预设时间单位内的空气污染物浓度。 0041 本申请第三方面的实施例提供了一种电子设备, 包括存储器、 处理器及存储在所 述存储器上并可在所述处理器上运行的计算机程序, 所述处理器运行所述计算机程序以实 现上述第一方面所述的方法。 0042 本申请第四方面的实施例提供了一种计算机可读存储介质, 其上存储有计算机程 序, 所述程序被处理器执行实现上述第一方面所述的方法。 0043 本申请实施例中提供的技术方案, 至少具有如下技术效果或优点: 0044 本申请实施例将编码-解码结构用于空气。
20、质量预测, 只要将过去第一预设时间单 位内的环境监测数据和气象数据输入编码-解码结构模型中, 即可得到未来第二预设时间 单位内的空气污染物浓度。 无需进行气象预测, 即可得到空气污染物浓度的预测结果, 预测 过程简单快速, 效率和准确率都很高。 而且能够对多种环境特征和气象特征进行深层次的 分析, 有效利用环境大数据, 实现环境管理水平的提升。 0045 本申请附加的方面和优点将在下面的描述中部分给出, 部分将从下面的描述中变 的明显, 或通过本申请的实践了解到。 附图说明 0046 通过阅读下文优选实施方式的详细描述, 各种其他的优点和益处对于本领域普通 技术人员将变得清楚明了。 附图仅用于。
21、示出优选实施方式的目的, 而并不认为是对本申请 的限制。 而且在整个附图中, 用相同的参考符号表示相同的部件。 0047 在附图中: 0048 图1示出了本申请一实施例所提供的一种空气污染物浓度预测方法的流程图; 0049 图2示出了本申请一实施例所提供的编码-解码网络结构的示意图; 0050 图3示出了本申请一实施例所提供的一种空气污染物浓度预测装置的结构示意 图; 0051 图4示出了本申请一实施例所提供的一种电子设备的结构示意图; 0052 图5示出了本申请一实施例所提供的一种存储介质的示意图。 具体实施方式 0053 下面将参照附图更详细地描述本申请的示例性实施方式。 虽然附图中显示了。
22、本申 请的示例性实施方式, 然而应当理解, 可以以各种形式实现本申请而不应被这里阐述的实 施方式所限制。 相反, 提供这些实施方式是为了能够更透彻地理解本申请, 并且能够将本申 请的范围完整的传达给本领域的技术人员。 0054 需要注意的是, 除非另有说明, 本申请使用的技术术语或者科学术语应当为本申 请所属领域技术人员所理解的通常意义。 说明书 3/11 页 6 CN 111507533 A 6 0055 下面结合附图来描述根据本申请实施例提出的一种空气污染物浓度预测方法、 装 置、 电子设备及存储介质。 0056 本申请实施例提供了一种空气污染物浓度预测方法, 该方法将编码器-解码器结 构。
23、用于空气质量预测, 能够对环境监测数据包括的PM2.5浓度、 PM10浓度、 二氧化氮浓度等 环境特征及气象数据包括的温度、 气压、 风速、 风向等气象特征进行深层次的分析, 有效利 用环境大数据, 预测各种空气污染物浓度, 实现环境管理水平的提升。 0057 参见图1, 该方法具体包括以下步骤; 0058 步骤101: 获取预设时间段内的环境监测历史数据和气象历史数据。 0059 上述预设时间段可以为1年、 3年或5年等, 为了提供充足的数据来训练编码-解码 结构模型, 该预设时间段可以取更长时间。 环境监测历史数据包括PM2.5浓度、 PM10浓度、 二 氧化氮浓度等。 气象历史数据包括的。
24、温度、 气压、 风速、 风向等。 0060 本申请实施例收集预设时间段内的环境监测历史数据和气象历史数据, 以一定的 时间间隔将收集的数据整理为多条数据, 每条数据的结构组成为时间区间、 该时间区间内 的环境监测历史数据和气象历史数据。 上述时间区间对应的时长即为上述一定的时间间 隔, 该时间间隔可以为1小时或2小时等。 0061 通过上述方式获取到预设时间段内的环境监测历史数据和气象历史数据之后, 还 对获取的数据进行数据预处理, 如进行缺失值处理、 归一化处理、 冗杂特征去除处理等。 其 中, 缺失值处理指, 若环境监测历史数据或气象历史数据中某个时刻的某项数据缺失, 则可 以该时刻缺失的。
25、数据补充为与该时刻相邻的其他时刻下该项数据的值。 若一定的时间间隔 内缺失了的数据的数目超过了一定量, 则可以直接将该时间间隔内的环境监测历史数据和 气象历史数据删除。 归一化处理是指将环境监测历史数据和气象历史数据中的一些特征值 转换到统一的数值标准下, 如将不同时间的气压均转换到0-1之间。 冗杂特征去除处理是 指, 将与需要预测的空气污染物浓度关联小的特征去除, 以及将相似性高的多个特征中保 留一个特征, 去除其他的。 例如, 需要预测的空气污染物浓度PM2.5浓度, 则去除与PM2.5浓 度关联小的紫外线指数等; 对于气压与海平面压强这种相似性高的特征, 可以去除海平面 压强, 只保留。
26、气压。 0062 本申请实施例还通过如下操作创建编码-解码网络结构, 具体包括: 0063 将第一全连接层、 第二全连接层和第三全连接层串联, 得到第一自编码器; 第一全 连接层包括的神经节点数目与环境监测历史数据中环境特征的数目相等; 将第四全连接 层、 第五全连接层和第六全连接层串联, 得到第二自编码器; 第四全连接层包括的神经节点 数目与气象历史数据中气象特征的数目相等; 将第一自编码器和第二自编码器并联, 并与 拼接层和预设数目个第一循环神经网络层串联, 得到编码器; 将第二循环神经网络层、 第七 全连接层和第八全连接层串联, 得到解码器; 将编码器和解码器串联, 得到编码-解码网络 。
27、结构。 0064 如图2所示的编码-解码网络结构, 图2中的箭头表示数据传输的方向。 该编码-解 码网络结构包括编码器和解码器, 编码器的输出作为解码器的输入。 编码器包括第一自编 码器、 第二自编码器、 拼接层和预设数目个第一循环神经网络层。 其中, 第一自编码器和第 二自编码器并联之后, 与拼接层和预设数目个第一循环神经网络层依次串联。 拼接层用于 拼接第一自编码器和第二自编码器的输出, 第一循环神经网络层可以为LSTM(Long Short- 说明书 4/11 页 7 CN 111507533 A 7 Term Memory, 长短期记忆网络)层、 RNN(Recurrent Neura。
28、l Network, 循环神经网络)层或 GUR(Gated Recurrent Unit, 门控循环单元)层等, 每个第一循环神经网络层中的神经节点 的数目均为256。 0065 第一自编码器由第一全连接层、 第二全连接层和第三全连接层串联而成, 第一全 连接层包括的神经节点数目与环境监测历史数据中环境特征的数目相等, 第二全连接层包 括的神经节点数目为128, 第三全连接层包括的神经节点数目为256。 第二自编码器由第四 全连接层、 第五全连接层和第六全连接层串联而成。 第四全连接层包括的神经节点数目与 气象历史数据中气象特征的数目相等, 第五全连接层包括的神经节点数目为128, 第六全连。
29、 接层包括的神经节点数目为256。 0066 解码器由第二循环神经网络层、 第七全连接层和第八全连接层串联而成, 第二循 环神经网络层可以为LSTM层、 RNN层或GUR层等, 上述编码器的输出结果作为第二循环神经 网络层的输入, 第二循环神经网络层中神经节点的数量为256, 第七全连接层和第八全连接 层中神经节点的数量分别为256和24。 0067 本申请实施例还设置上述编码-解码网络结构的模型损失函数为如公式(1)所示 的RMSE(Root Mean Squared Error, 均方根误差): 0068 0069 在公式(1)中, N为步骤101中获取的数据总条数, i为数据的序号, O。
30、i为第i条数据 的实际值, Pi为第i条数据的预测值。 0070 通过上述操作获取过去预设时间段内的环境监测历史数据和气象历史数据, 并创 建出编码-解码网络结构, 之后通过如下步骤102的操作来训练编码-解码结构模型。 0071 步骤102: 根据预设时间段内的环境监测历史数据和气象历史数据, 训练预先创建 的编码-解码网络结构, 得到编码-解码结构模型。 0072 本申请实施例具体通过如下步骤S1-S4的操作来训练编码-解码结构模型, 具体包 括: 0073 S1: 将预设时间段内的环境监测历史数据和气象历史数据划分为多个时长为第一 预设时间单位的切片数据。 0074 上述第一预设时间单位。
31、可以为48小时、 72小时、 96小时等。 首先将预设时间段划分 为多个时长为第一预设时间单位的时间段。 0075 本申请实施例中, 可以将预设时间段均分为多个第一预设时间单位的时间段, 任 意相邻的两个时间段中前一个时间段的截止时刻与后一个时间段的开始时刻相同。 0076 或者, 本申请实施例还可以对预设时间段内的环境监测历史数据和气象历史数据 进行有重叠的窗口滑动切片。 具体地, 以第一预设时间单位为切割窗口, 以预设时长为切割 窗口的滑动步长, 将预设时间段切割为多个时间段, 预设时长小于第一预设时间单位。 其 中, 上述预设时长可以为1个小时或2个小时等。 通过上述切割窗口以预设时长为。
32、滑动步长 进行切割后, 得到的多个时间段中任意相邻的两个时间段中存在一段重合时间, 该重合时 间的时长为第一预设时间单位与上述预设时长之间的差值。 例如, 假设预设时长为1小时, 第一预设时间单位为72小时, 则切割出的相邻的两个时间段之间存在71个小时的重合时 说明书 5/11 页 8 CN 111507533 A 8 间。 0077 通过上述任意方式将预设时间段划分为多个时长为第一预设时间单位的时间段 之后, 将每个时间段对应的环境监测历史数据和气象历史数据分别确定为每个时间段对应 的切片数据。 0078 S2: 从预设时间段内的环境监测历史数据中, 分别获取每个切片数据对应的截止 时刻之。
33、后第二预设时间单位内的空气污染物浓度。 0079 上述第二预设时间单位可以为24小时或48小时等。 0080 对于每个切片数据, 确定该切片数据对应的时间段的截止时刻。 根据该截止时刻, 确定从该截止时刻起经过第二预设时间单位这段时间对应的时刻范围。 从预设时间段内的 环境监测历史数据中获取上述确定时刻范围内的环境监测历史数据。 从获取的环境监测历 史数据中获取所需要的特定的空气污染物浓度。 其中, 需要使用本申请实施例提供的方法 预测哪种空气污染物浓度, 则此处就获取的哪种空气污染物浓度。 如若需要使用本申请实 施例提供的方法预测PM2.5浓度, 则此处就需要获取切片数据对应的第二预设时间单。
34、位内 的PM2.5浓度。 0081 例如, 假设需要获取PM2.5浓度, 第二时间单位为24小时, 切片数据对应的时间段 为72小时, 假设某个切片数据对应的时间段的截止时刻为2019年1月1日1:00, 则先获取 2019年1月1日1:00至2019年1月2日1:00之间的环境监测历史数据, 然后从这段时间内的环 境监测历史数据中获取这24个小时内的PM2.5浓度, 若过去环境监测过程中每个小时记录 一次PM2.5浓度, 则将获取到24个PM2.5浓度。 0082 S3: 将切片数据及其对应的第二预设时间单位内的空气污染物浓度组成数据组, 将获得的多个数据组构成训练集。 0083 分别将切片。
35、数据与该切片数据对应的第二预设时间单位内的空气污染物浓度组 成一个数据组。 例如, 假设第一时间单位为72小时, 第二预设时间单位为24小时, 且使用本 申请实施例提供的方法预测PM2.5浓度, 则将72小时内的切片数据与该72小时之后的24小 时内的PM2.5浓度组成一个数据组。 0084 本申请实施例可以将组成的所有数据组构成训练集。 本申请实施例还可以设置预 设均衡条件, 根据预设均衡条件从所有切片数据中均衡的选取切片数据, 以避免训练集包 括的数据组中空气污染物浓度过于集中, 进而提高后续利用训练集训练的编码-解码结构 模型的预测准确率。 预设均衡条件规定了空气污染物的不同浓度区间及浓。
36、度区间对应的切 片数据的数量, 如PM2.5浓度区间0, 50对应的切片数据的数量为1000, 区间(50, 100对应 的切片数据的数量为1000等。 0085 具体地, 分别计算每个切片数据对应的第二预设时间单位内的空气污染物浓度的 平均值; 根据每个切片数据对应的平均值, 从每个切片数据中选取满足预设均衡条件的切 片数据。 即对于每个切片数据, 首先分别计算每个切片数据之后第二预设时间单位内的空 气污染物浓度的平均值, 确定每个切片数据对应的平均值所在的空气污染物的浓度区间, 根据预设均衡条件, 从平均值属于某个浓度区间的所有切片数据中, 随机选取该浓度区间 对应的数量个切片数据。 00。
37、86 例如, 假设PM2.5浓度区间0, 50对应的切片数据的数量为1000, 区间(50, 100对 应的切片数据的数量为1000。 对于数据组 “72小时的切片数据与72小时之后的24小时内的 说明书 6/11 页 9 CN 111507533 A 9 PM2.5浓度” , 计算72小时之后的24个PM2.5浓度的平均值。 对于每个切片数据均计算出其对 应的24个PM2.5浓度的平均值之后, 从平均值在0, 50内的切片数据中选取1000个切片数 据, 以及从平均值在(50, 100的切片数据中选取1000个切片数据。 0087 通过上述方式均衡的选取出多个切片数据之后, 将选取的切片数据。
38、及其对应的第 二预设时间单位内的空气污染物浓度组成数据组, 将组成的多个数据组构成训练集。 0088 本申请实施例还可以将组成的所有数据组划分为训练集、 验证集和测试集。 训练 集、 验证集和测试集包括的数据组占有所数据集的比例可以分别为60、 20和20。 0089 S4: 通过训练集对预先创建的编码-解码网络结构进行训练, 得到编码-解码结构 模型。 0090 在训练时, 从训练集中每次随机选取一定数量的数据组, 将选取的数据组输入至 上述创建的编码-解码网络结构中进行训练学习, 对于每个数据组, 通过编码-解码网络结 构进行训练过程中都计算该数据组对应的均方根误差, 当计算的均方根误差小。
39、于预设阈值 时, 停止训练, 得到训练好的编码-解码结构模型。 其中, 上述一定数量设定为大于1的自然 数。 0091 通过训练集训练得到编码-解码结构模型之后, 还可以将验证集输入训练得到的 编码-解码结构模型中进行验证, 若验证出均方根误差大于或等于预设阈值, 则可以对编 码-解码结构模型中第一循环神经网络和/或第二循环神经网络的层数及各层的神经节点 的数目等参数进行调整, 以使最终的编码-解码结构模型对应的均方根误差小于预设阈值。 0092 通过上述步骤101和102的操作训练出编码-解码结构模型后, 即可通过如下步骤 103和104的操作来预测未来第二预设时间单位内的空气污染物浓度。 。
40、0093 步骤103: 获取第一预设时间单位内的环境监测数据和气象数据。 0094 其中, 第一预设时间单位为48小时、 72小时或96小时等。 0095 步骤104: 根据第一预设时间单位内的环境监测数据和气象数据, 通过编码-解码 结构模型预测未来第二预设时间单位内的空气污染物浓度。 0096 将获取的第一预设时间单位内的环境监测数据和气象数据输入训练好的编码-解 码结构模型包括的编码器中。 其中, 第一预设时间单位内的环境监测数据输入编码器中的 第一自编码器, 第一自编码器包括的第一全连接层包括的神经节点数目与环境监测数据中 环境特征的数目相等, 通过第一自编码器提取出第一预设时间单位内。
41、的环境监测数据中的 环境特征。 第一预设时间单位内的气象数据输入编码器中的第二自编码器中。 第二自编码 器包括的第四全连接层包括的神经节点数目与气象数据中气象特征的数目相等, 通过第二 自编码器提取第一预设时间单位内的气象数据中的气象特征。 0097 然后通过编码器中的拼接层对环境特征和气象特征进行时域拼接, 即将同一时刻 的环境特征和气象特征进行关联, 使环境特征和气象特征在时域上对齐。 之后通过编码器 中的预设数目个第一循环神经网络层和解码器中的第二循环神经网络层、 第七全连接层和 第八全连接层依次对拼接好的环境特征和气象特征进行预测分析, 输出未来第二预设时间 单位内的空气污染物浓度。 。
42、0098 本申请实施例提供的方法可适用于对PM2.5、 PM10、 二氧化氮等任意空气污染物的 浓度进行预测。 0099 本申请实施例将编码-解码结构用于空气质量预测, 只要将过去第一预设时间单 说明书 7/11 页 10 CN 111507533 A 10 位内的环境监测数据和气象数据输入编码-解码结构模型中, 即可得到未来第二预设时间 单位内的空气污染物浓度。 无需进行气象预测, 即可得到空气污染物浓度的预测结果, 预测 过程简单快速, 效率和准确率都很高。 而且能够对多种环境特征和气象特征进行深层次的 分析, 有效利用环境大数据, 实现环境管理水平的提升。 0100 本申请实施例提供了一。
43、种空气污染物浓度预测装置, 该装置用于执行上述实施例 所述的空气污染物浓度预测方法, 如图3所示, 该装置包括; 0101 第一获取模块301, 用于获取预设时间段内的环境监测历史数据和气象历史数据; 0102 模型训练模块302, 用于根据预设时间段内的环境监测历史数据和气象历史数据, 训练预先创建的编码-解码网络结构, 得到编码-解码结构模型; 0103 第二获取模块303, 用于获取第一预设时间单位内的环境监测数据和气象数据; 0104 预测模块304, 用于根据第一预设时间单位内的环境监测数据和气象数据, 通过编 码-解码结构模型预测未来第二预设时间单位内的空气污染物浓度。 0105 。
44、上述模型训练模块302包括: 0106 数据划分单元, 用于将预设时间段内的环境监测历史数据和气象历史数据划分为 多个时长为第一预设时间单位的切片数据; 0107 获取单元, 用于从预设时间段内的环境监测历史数据中, 分别获取每个切片数据 对应的截止时刻之后第二预设时间单位内的空气污染物浓度; 0108 训练集获得单元, 用于将切片数据及其对应的第二预设时间单位内的空气污染物 浓度组成数据组, 将获得的多个数据组构成训练集; 0109 训练单元, 用于通过训练集对预先创建的编码-解码网络结构进行训练, 得到编 码-解码结构模型。 0110 上述数据划分单元, 用于将预设时间段划分为多个时长为第。
45、一预设时间单位的时 间段; 将每个时间段对应的环境监测历史数据和气象历史数据分别确定为每个时间段对应 的切片数据。 0111 上述数据划分单元, 具体用于以第一预设时间单位为切割窗口, 以预设时长为切 割窗口的滑动步长, 将预设时间段切割为多个时间段, 预设时长小于第一预设时间单位。 0112 上述训练集获得单元, 用于分别计算每个切片数据对应的第二预设时间单位内的 空气污染物浓度的平均值; 根据每个切片数据对应的平均值, 从每个切片数据中选取满足 预设均衡条件的切片数据; 将选取的切片数据及其对应的第二预设时间单位内的空气污染 物浓度组成数据组, 将组成的多个数据组构成训练集。 0113 该。
46、装置还包括: 编码-解码网络结构创建模块, 用于将第一全连接层、 第二全连接 层和第三全连接层串联, 得到第一自编码器; 第一全连接层包括的神经节点数目与环境监 测历史数据中环境特征的数目相等; 将第四全连接层、 第五全连接层和第六全连接层串联, 得到第二自编码器; 第四全连接层包括的神经节点数目与气象历史数据中气象特征的数目 相等; 将第一自编码器和第二自编码器并联, 并与拼接层和预设数目个第一循环神经网络 层串联, 得到编码器; 将第二循环神经网络层、 第七全连接层和第八全连接层串联, 得到解 码器; 将编码器和解码器串联, 得到编码-解码网络结构。 0114 预测模块304, 用于通过第。
47、一自编码器提取第一预设时间单位内的环境监测数据 中的环境特征; 通过第二自编码器提取第一预设时间单位内的气象数据中的气象特征; 通 说明书 8/11 页 11 CN 111507533 A 11 过拼接层对环境特征和气象特征进行时域拼接; 通过第一循环神经网络层和解码器对拼接 的环境特征和气象特征进行预测, 获得未来第二预设时间单位内的空气污染物浓度。 0115 本申请的上述实施例提供的空气污染物浓度预测装置与本申请实施例提供的空 气污染物浓度预测方法出于相同的发明构思, 具有与其存储的应用程序所采用、 运行或实 现的方法相同的有益效果。 0116 本申请实施方式还提供一种与前述实施方式所提供。
48、的空气污染物浓度预测方法 对应的电子设备, 以执行上空气污染物浓度预测方法。 本申请实施例不做限定。 0117 请参考图4, 其示出了本申请的一些实施方式所提供的一种电子设备的示意图。 如 图4所示, 所述电子设备2包括: 处理器200, 存储器201, 总线202和通信接口203, 所述处理器 200、 通信接口203和存储器201通过总线202连接; 所述存储器201中存储有可在所述处理器 200上运行的计算机程序, 所述处理器200运行所述计算机程序时执行本申请前述任一实施 方式所提供的空气污染物浓度预测方法。 0118 其中, 存储器201可能包含高速随机存取存储器(RAM: Rand。
49、om Access Memory), 也 可能还包括非不稳定的存储器(non-volatile memory), 例如至少一个磁盘存储器。 通过至 少一个通信接口203(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通 信连接, 可以使用互联网、 广域网、 本地网、 城域网等。 0119 总线202可以是ISA总线、 PCI总线或EISA总线等。 所述总线可以分为地址总线、 数 据总线、 控制总线等。 其中, 存储器201用于存储程序, 所述处理器200在接收到执行指令后, 执行所述程序, 前述本申请实施例任一实施方式揭示的所述空气污染物浓度预测方法可以 应用于处理器200中, 或。
50、者由处理器200实现。 0120 处理器200可能是一种集成电路芯片, 具有信号的处理能力。 在实现过程中, 上述 方法的各步骤可以通过处理器200中的硬件的集成逻辑电路或者软件形式的指令完成。 上 述的处理器200可以是通用处理器, 包括中央处理器(Central Processing Unit, 简称 CPU)、 网络处理器(Network Processor, 简称NP)等; 还可以是数字信号处理器(DSP)、 专用 集成电路(ASIC)、 现成可编程门阵列(FPGA)或者其他可编程逻辑器件、 分立门或者晶体管 逻辑器件、 分立硬件组件。 可以实现或者执行本申请实施例中的公开的各方法、 。
- 内容关键字: 空气 污染物 浓度 预测 方法 装置 电子设备 存储 介质
相机模块.pdf
具有防堵机构的浆水处理用滤筛装置.pdf
打包设备.pdf
可回收动脉瘤辅助支架及输送系统.pdf
电梯井道相邻房间的复合隔声墙体构造.pdf
灯具的免接电线的导电铜片触点结构.pdf
管式反应器.pdf
陶瓷纤维管.pdf
留孔装置.pdf
冲压机用的送料机构.pdf
玻璃装饰条组装装置.pdf
电缆抗拉强度检测装置.pdf
电网建设的架线机.pdf
家电玻璃多向磨边机.pdf
用于土壤肥料的均匀泼洒机构.pdf
漏电电流检测仪及防护组件.pdf
洁净室多重复合杀菌过滤风口结构.pdf
纸垛自动整理装置.pdf
有机废气、有机废液及烟气的协同处理系统.pdf
铜锭抛光用夹具.pdf
指纹取景器.pdf
新型电动自楔式安全制动器.pdf
新型血糖试纸盒.pdf
中远距离传输零中频接收机电路.pdf
纳米铁强化磺胺废水厌氧消化的方法.pdf
鱼缸除垢机器人.pdf
可变形手持便携式三防平板电脑.pdf
步进电机散热方法、系统及介质.pdf
建筑施工降尘设备.pdf
防水防潮型家用可燃气体探测器.pdf
基于物联网的智能实验室安全管理策略确定方法及装置.pdf
基于双边带光频梳的快速布里渊光学时域分析仪.pdf
一种一孔两用的隧洞排水孔结构.pdf
钢管桩围堰结构.pdf
一种生态砌块.pdf
一种铁路桥梁用泄水管.pdf
一种卷帘门的抗风装置.pdf
一种掺有非预应力钢筋的管桩钢筋笼.pdf
大型沉管隧道管段基础.pdf
汽车手套箱开启装置.pdf
城市道路上空花园式电动跃层停车商务楼.pdf
蒸压加气砌块砌窗结构.pdf
一种升降式旋转室外消火栓.pdf
框架结构T型连接柱.pdf
防静电地板吸板器.pdf
一种建筑用箱体或井口预留孔洞活动模具.pdf
速成拉建房屋.pdf
预制桥面板精轧螺纹钢筋弧形连接构造.pdf
一种内固定式伸缩门滑行导轨及伸缩门.pdf
多用途封井器.pdf
一种新型圆弧建筑模板紧固件.pdf