《采用空间密度聚类进行雷电运动预测的方法.pdf》由会员分享,可在线阅读,更多相关《采用空间密度聚类进行雷电运动预测的方法.pdf(7页完整版)》请在专利查询网上搜索。
1、(10)申请公布号 CN 102253426 A (43)申请公布日 2011.11.23 CN 102253426 A *CN102253426A* (21)申请号 201110109027.0 (22)申请日 2011.04.29 G01W 1/00(2006.01) (71)申请人 国网电力科学研究院武汉南瑞有限 责任公司 地址 430074 湖北省武汉市洪山区珞瑜路 143 号 申请人 国网电力科学研究院 (72)发明人 郭钧天 谷山强 冯万兴 王海涛 陈家宏 田浩 周自强 刘博 (74)专利代理机构 湖北武汉永嘉专利代理有限 公司 42102 代理人 李双全 (54) 发明名称 采用。
2、空间密度聚类进行雷电运动预测的方法 (57) 摘要 本发明涉及采用空间密度聚类进行雷电运动 预测的方法, 其采用计算机对雷电自动监测数据 进行处理, 建立聚类分析数据库, 结合地理信息系 统 (GIS) 建立分析平台, 通过建立密度聚类算法 模型对不同时刻雷电数据进行聚类分析, 在数据 库中设置雷电数据样本筛选条件, 刻画雷电密度 的基本参数, 按时间顺序取得雷电样本数据并按 照时间段分类 ; 通过雷电数据点和距离值, 构建 出雷电数据空间位置关系表 ; 确定不同雷暴团的 位置特征点 ; 根据雷暴团的位置特征点随着时间 推移上的位移变化, 计算其运动方向和速度, 并预 测下一个时间段雷暴团将要。
3、出现的位置。本发明 的优点是, 构思新颖, 处理雷电数据的方法先进、 合理, 能反映雷电运动的真实性。 (51)Int.Cl. (19)中华人民共和国国家知识产权局 (12)发明专利申请 权利要求书 1 页 说明书 4 页 附图 1 页 CN 102253432 A1/1 页 2 1. 采用空间密度聚类进行雷电运动预测的方法, 采用计算机对雷电自动监测数据进行 处理, 其特征在于, 建立聚类分析数据库, 结合地理信息系统 (GIS) 建立分析平台, 通过建 立密度聚类算法模型对不同时刻雷电数据进行聚类分析, 其聚类分析与雷电运动预测的基 本步骤如下 : (1) 建立聚类分析数据库, 在数据库中。
4、设置雷电数据样本筛选条件, 以及刻画雷电密度 的基本参数距离 、 最小雷电点数 minPts, 按时间顺序取得雷电样本数据并按照时间 段分类 ; (2) 获取同一时间段内的雷电数据, 对每个雷电点, 计算其周边雷电与它之间的距离, 通过雷电数据点和距离值, 构建出雷电数据空间位置关系表 ; (3) 对于刻画雷电密度的基本参数距离 、 最小雷电点数 minPts, 采用定义 : 定义一, 若雷电点p在半径空间范围内存在某一点q, 则称q与p之间是直接密度到 达关系 ; 定义二, 如果存在一个序列的点 p1, p2, pn, 其中 p1 p 且 pn q, 若对于每个 pi+1 与 pi都是直接密。
5、度到达关系, 则称 q 能够密度到达 p ; 根据定义一或定义二计算出任意两个雷电点的密度关系 ; (4) 从任意雷电点开始, 若在其半径 空间范围内包含的雷电点数目未达到 minPts, 则该雷电点标记为噪声点, 否则新生成一个聚类, 将所有与该雷电点为直接密度达到关系 或密度到达关系的雷电点均归到此类并作标记, 然后再找下一个未作过任何标记的点, 重 复上述操作, 生成新的聚类, 直到所有的雷电样本数据均被标记为止 ; (5) 聚类完成后, 确定不同雷暴团的位置特征点 ; (6) 根据雷暴团的位置特征点随着时间推移上的位移变化, 计算其运动方向和速度, 并 预测下一个时间段雷暴团将要出现的。
6、位置。 2. 根据权利要求 1 所述的采用空间密度聚类进行雷电运动预测的方法, 其特征在于, 所述的位置特征点可以通过确定质心得到。 3. 根据权利要求 1 所述的采用空间密度聚类进行雷电运动预测的方法, 其特征在于, 所述的位置特征点可以通过确定几何中心得到。 4. 根据权利要求 1 所述的采用空间密度聚类进行雷电运动预测的方法, 其特征在于, 所述的位置特征点可以通过确定外围轮廓特征点得到。 权 利 要 求 书 CN 102253426 A CN 102253432 A1/4 页 3 采用空间密度聚类进行雷电运动预测的方法 技术领域 0001 本发明属于雷电预测与预警技术领域, 特别是采用。
7、空间密度聚类进行雷电运动预 测的方法, 其是一种采用空间密度聚类法进行雷电运动趋势预测的方法。 背景技术 0002 目前, 对雷电运动进行预测, 通常是根据实时雷电监测数据, 寻找雷电发生时间、 地点的活动规律, 并通过该规律预测雷电未来发展状况。据申请人所知, 由于雷电活动过 于离散、 独立, 并具有随机的特点, 长期以来一直未有好的办法研究雷电活动规律, 也未发 现有人提出雷电运动预测的有效手段, 对于雷电活动的研究限于雷电参数统计和雷电分布 情况研究。随着数据挖掘这门新兴学科的发展, 很多国家都将数据挖掘技术融入到雷电监 测中, 并提出了一些有关雷电预测研究的方法。据有关资料介绍, 聚类。
8、分析作为一种数据 挖掘方法, 它能将雷电空间数据自动分类成一些雷暴团, 从而可以通过分析雷暴团的位移 情况来预测雷电活动情况。直到 2006 年由巴西 SIMEPAR 技术研究所提出了一种利用雷 电数据挖掘的雷暴预测方法 : ELECTRICAL THUNDERSTORM NOWCASTING USING LIGHTNING DATA MINING, C.A.Vasconcellos, 19th International Lightning Detection Conference 24-25AprilTucson, Arizona, USA 他使用 SQL Server 2005 的数据挖。
9、掘工具, 对实时雷电 监测数据进行聚类分析实验, 将30分钟的雷电数据采用K-Means聚类算法分类成为几个雷 暴团, 并将此样本的前、 后 15 分钟数据分别聚类, 对比后得出雷电运动趋势。但是, 申请人 经过研究发现, 该方法存在一些问题 : 首先, K-Means 聚类方法得出的雷暴团在空间上均是 规则的圆形, 而自然环境下, 雷暴团应该由带电的大面积云团携带的, 云团的形状应该是不 规则的, 因此该聚类分析实验结果不能真实反映出雷暴团的实际分布 ; 其次, K-Means 聚类 方法必需人为去规定分类的数目, 由此可知, 分类数目的选定会严重影响雷电数据的聚类 效果, 其采用的算法的人。
10、为界定因素比重太大。最后, 由于 K-Means 聚类方法是根据不断优 化分类后雷暴团的几何中心点来聚类的, 其分类特性决定了分类结果数据包含全部的样本 数据, 无法将一些严重影响分类效果的孤立点剔除, 最终会导致对雷暴团运动预测效果不 佳。 如何将雷电数据以不规则形状分类、 尽可能减少在雷电数据聚类时人为因素的影响、 剔 除影响分类的孤立点, 这些成为雷电运动预测中急需解决的问题。 发明内容 0003 本发明的目的是, 克服现有技术的不足, 提出采用空间密度聚类进行雷电运动预 测的方法。该方法能实现无需人为干预的自动将雷电数据分类, 分类后雷暴团的空间形状 不规则, 并且能够自动消除噪声数据。
11、 ( 孤立点 ) 对聚类的影响。 0004 本发明的技术解决方案是, 采用计算机对雷电自动监测数据进行处理, 其特征在 于, 建立聚类分析数据库, 结合地理信息系统 (GIS) 建立分析平台, 通过建立密度聚类算法 模型对不同时刻雷电数据进行聚类分析, 其聚类分析与雷电运动预测的基本步骤如下 : 0005 (1) 建立聚类分析数据库, 在数据库中设置雷电数据样本筛选条件, 以及刻画雷电 说 明 书 CN 102253426 A CN 102253432 A2/4 页 4 密度的基本参数距离 、 最小雷电点数 minPts, 按时间顺序取得雷电样本数据并按照 时间段分类 ; 0006 (2) 获。
12、取同一时间段内的雷电数据, 对每个雷电点, 计算其周边雷电与它之间的距 离, 通过雷电数据点和距离值, 构建出雷电数据空间位置关系表 ; 0007 (3) 对于刻画雷电密度的基本参数距离 、 最小雷电点数 minPts, 采用定义 : 0008 定义一, 若雷电点p在半径空间范围内存在某一点q, 则称q与p之间是直接密 度到达关系 ; 0009 定义二, 如果存在一个序列的点 p1, p2, pn, 其中 p1 p 且 pn q, 若对于每个 pi+1与 pi都是直接密度到达关系, 则称 q 能够密度到达 p ; 0010 根据定义一或定义二计算出任意两个雷电点的密度关系 ; 0011 (4)。
13、 从任意雷电点开始, 若在其半径 空间范围内包含的雷电点数目未达到 minPts, 则该雷电点标记为噪声点, 否则新生成一个聚类, 将所有与该雷电点为直接密度达 到关系或密度到达关系的雷电点均归到此类并作标记, 然后再找下一个未作过任何标记的 点, 重复上述操作, 生成新的聚类, 直到所有的雷电样本数据均被标记为止 ; 0012 (5) 聚类完成后, 确定不同雷暴团的位置特征点 ; 0013 (6) 根据雷暴团的位置特征点随着时间推移上的位移变化, 计算其运动方向和速 度, 并预测下一个时间段雷暴团将要出现的位置。 0014 其特征在于, 所述的位置特征点可以通过确定质心得到。 0015 其特。
14、征在于, 所述的位置特征点可以通过确定几何中心得到。 0016 其特征在于, 所述的位置特征点可以通过确定外围轮廓特征点得到。 0017 本发明的优点是, 构思新颖, 处理雷电数据的方法先进、 合理, 能反映雷电运动的 真实性, 为预测雷电运动趋势提供了有效的途径。本发明采用空间密度聚类进行雷电运动 预测, 实现了用计算机自动的对雷电进行无人为监督和参与的聚类, 自动剔除了噪声点, 生 成形状不规则的雷暴团, 解决了目前无法用雷电定位监测数据有效预测雷电运动轨迹的难 题。本发明的方法简单、 明了, 具有很好的操作性和实用性。 附图说明 0018 图 1、 本发明的原理框图 ; 具体实施方式 0。
15、019 下面, 结合附图对本发明作实施例进一步详细描述说明。 0020 如图 1 所示, 本发明使用计算机处理数据, 通过计算机在雷电定位系统监测数据 库中提取选定范围内的数据样本, 该样本为某区域内发生在当前时间前的最近一次历史雷 暴过程中的雷电数据。 0021 第二步, 采用计算机进行数据预处理, 在样本数据中提取雷电定位系统中定位精 度较高的雷电数据, 并对所有雷电数据进行标识, 标识为未聚类分析状态。 0022 第三步, 采用以下方式按时间段将雷电样本数据进行分类 : 0023 首先将数据样本按时间排序, 再根据选定的运动时间间隔 ( 可人为制定, 通常采 用 5 分钟 ) 将数据样本。
16、时间分段, 然后将每个时间段之前的一段时间 ( 通常为 30 分钟, 可 说 明 书 CN 102253426 A CN 102253432 A3/4 页 5 人为制定该参数 ) 内的雷电数据和该时间段内的雷电数据归为一类, 存放到聚类分析数据 库中。数据按上述方法以时间段分类后, 将成为每个时间片内进行空间聚类计算的数据样 本。 0024 第四步, 对于每个时间段内的每个雷电点, 采用大地椭球面距离计算公式计算其 周边其他雷电点与它之间的距离, 通过雷电数据点和距离值, 构建出雷电数据空间位置关 系表。 0025 设置刻画雷电密度的基本参数, 其中距离参数 5km, 最小雷电点数 minPt。
17、s 3 个, 根据定义计算出任意两个雷电点的密度到达关系 ; 采用定义包括 : 定义一, 若雷电点 p 在半径 空间范围内存在某一点 q, 则称 q 与 p 之间是直接密度到达关系 ; 定义二, 如果 存在一个序列的点 p1, p2, pn, 其中 p1 p 且 pn q, 若对于每个 pi+1与 pi都是直接密 度到达关系, 则称 q 能够密度到达 p ; 对时间段内的雷电点集, 从任意标记为未聚类分析状 态的雷电点开始, 判断在其半径 空间范围内包含的密度可到达雷电点数目是否达到了 minPts要求, 即该雷电点周边5km内达到密度要求的邻近点是否多于3个, 若达到要求则说 明该雷电点处于。
18、高密度区域, 可以作为某一聚类的元素, 否则该雷电点在空间上应处于相 对孤立的状态, 因此标记为噪声点。 若该雷电点符合密度要求则新生成一个聚类, 并将所有 与该雷电点为直接密度达到关系或密度到达关系的雷电点均归到此类并标记聚类分析状 态, 被标记过的雷电点表明了该雷电点已被分配至某一个分类, 不得再分配至其他类中。 此 步骤完成后自动计算出了雷电点集中的第一个分类, 然后再找下一个标记为未聚类分析状 态的点, 重复上述操作, 生成新的聚类, 直到所有的雷电样本数据均被标记为聚类分析状态 为止 ; 此时完成了该时间段内的雷电空间密度聚类过程。 0026 第五步, 通过上述密度聚类分析方法可获得。
19、不同时间段内的雷暴团, 再计算每个 时间段内不同雷暴团的质心, 质心通过公式其中 xi, yi为雷暴团中雷电点的 经纬度坐标。 0027 第六步, 对于每个时间段内的不同雷暴团, 判断其质心较上一时间段是否发生过 位移。若发生过位移, 则通过雷暴团不同时间段质心位置的不同计算出其平均运动速度和 方向, 并将当前时刻雷电分布区域按照速度和方向推移一个时间片的距离作为预测区域, 否则将当前时刻雷电分布区域作为预测区域。 0028 采用本发明对 2009 年在湖北省的一次历史雷暴过程的进行了预测效果试验。在 此次雷暴活动分析中, 采用 5 分钟为时间间隔, 对湖北省 2009 年 8 月 16 日 。
20、15:30 到 16:00 这半个小时中的雷电运动进行预测。 在计算机中将这些预测数据以及实际发生的雷电数据 结合GIS平台进行演示, 采用灰色的网格代表预测结果, 黄色的点代表当前5分钟内的实时 雷电信息。对这半小时内的雷电活动及预测结果进行效果评估, 可将实际雷电数据的地理 信息与预测网格进行比对, 即判断 GIS 平台中黄色的点是否落在灰色网格的内部, 通过数 据比对可得出每个时间段的预测效果, 形成雷电活动预测效果表。表中被预测雷电数表示 实时雷电中被预测区域所包括的雷电数量, 总雷电数表示的当前时间段实时雷电数量, 预 测精度为被预测雷电数与总雷电数的比值。 0029 表 1 : 雷。
21、电活动预测效果表 说 明 书 CN 102253426 A CN 102253432 A4/4 页 6 0030 时间 预测精度 被预测雷电数 总雷电数 2009-08-16 15:30:00.000 0.873704 927 1061 2009-08-16 15:35:00.000 0.841958 602 715 2009-08-16 15:40:00.000 0.799537 690 863 2009-08-16 15:45:00.000 0.850178 715 841 2009-08-16 15:50:00.000 0.831522 612 736 2009-08-16 15:55:00.000 0.832599 567 681 2009-08-16 16:00:00.000 0.799110 1078 1349 0031 由上述对 2009 年在湖北省的一次历史雷暴过程的进行了预测效果试验的情况可 知, 采用本发明进行预测效果试验, 其结果能反映雷电运动的真实性。 说 明 书 CN 102253426 A CN 102253432 A1/1 页 7 图 1 说 明 书 附 图 CN 102253426 A 。