基于模糊关联规则的电力系统设备故障预警方法.pdf

上传人:刘** 文档编号:9183006 上传时间:2021-05-09 格式:PDF 页数:16 大小:817.57KB
收藏 版权申诉 举报 下载
基于模糊关联规则的电力系统设备故障预警方法.pdf_第1页
第1页 / 共16页
基于模糊关联规则的电力系统设备故障预警方法.pdf_第2页
第2页 / 共16页
基于模糊关联规则的电力系统设备故障预警方法.pdf_第3页
第3页 / 共16页
文档描述:

《基于模糊关联规则的电力系统设备故障预警方法.pdf》由会员分享,可在线阅读,更多相关《基于模糊关联规则的电力系统设备故障预警方法.pdf(16页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010274132.9 (22)申请日 2020.04.09 (71)申请人 国网山东省电力公司 地址 250001 山东省济南市市中区大观园 经二路150号 申请人 东北电力大学 (72)发明人 马强王勇李磊管荑李慧聪 田大伟耿玉杰刘勇林琳 娄建楼李燕李建坡 (74)专利代理机构 西安合创非凡知识产权代理 事务所(普通合伙) 61248 代理人 于波 (51)Int.Cl. G06Q 10/06(2012.01) G06Q 10/00(2012.01) G06Q 50/0。

2、6(2012.01) G06K 9/62(2006.01) (54)发明名称 一种基于模糊关联规则的电力系统设备故 障预警方法 (57)摘要 本发明公开了一种基于模糊关联规则的电 力系统设备故障预警方法, 涉及故障预警方法, 包括以下步骤: 由K均值和信息熵混合迭代确定 电力设备数据的最佳分区数, 以实现动态自适应 边界划分; 引入模糊集以软化属性边界划分, 使 用模糊C均值进行模糊区间划分; 使用Apriori算 法, 选取一组最佳的最小支持度和信任度作为挖 掘算法的主参数, 以此参数挖掘出关联规则构建 规则库, 以分析预测电力设备的故障状态。 本发 明的方法能够定量地得到属性离散化时的最佳。

3、 分区数, 实现动态自适应属性边界划分; 相较传 统的关联规则方法能够快速准确地检测到设备 的故障状态。 权利要求书1页 说明书9页 附图5页 CN 111401785 A 2020.07.10 CN 111401785 A 1.一种基于模糊关联规则的电力系统设备故障预警方法, 其特征在于, 包括以下步骤: 由K均值和信息熵混合迭代确定电力设备数据的最佳分区数, 以实现动态自适应边界 划分; 引入模糊集以软化属性边界划分, 使用模糊C均值进行模糊区间划分; 使用Apriori算法, 选取一组最佳的最小支持度和信任度作为挖掘算法的主参数, 以此 参数挖掘出关联规则构建规则库, 以分析预测电力设备。

4、的故障状态。 2.根据权利要求1所述的基于模糊关联规则的电力系统设备故障预警 方法, 其特征在于, 包括以下步骤: 由改进的K均值和信息熵混合迭代求出初始类个数以及初始类中心, 由FCM聚类求出最 终聚类结果; 设待聚类的样本集为, 基于模糊关联规则的电力系统设备 故障预警方法的具体步骤为: S1: 确定初始聚类个数的范围; S2: 在聚类个数逐渐增加的过程中, 每对应一个聚类数j, 利用改进的K-means算法求出 聚类中心, 再在计算数据偏离度的基础上求出信息熵的跃迁差值; S3: 在已求得的序列中, 得到的达到最小值时的聚类个数k及此时的聚类中心 ; S4: 将最佳聚类个数k及类中心作为。

5、初始化参数, 对FCM算法进行初始化; S5: 更新模糊聚类的隶属度矩阵; S6: 如果, 则聚类算法停止并输出隶属度矩阵和类中心, 否则 转向S5继续迭代; S8: 获取最终的隶属度矩阵和类中心, 将数据集中的数据划分到对应的类中。 权利要求书 1/1 页 2 CN 111401785 A 2 一种基于模糊关联规则的电力系统设备故障预警方法 技术领域 0001 本发明涉及故障预警方法, 具体涉及一种基于模糊关联规则的电力系统设备故障 预警方法。 背景技术 0002 目前, 随着智能电网的不断发展, 电网规模的不断扩大, 对电力系统运行安全的要 求也越来越高。 为了保证电力系统设备的安全运行,。

6、 降低其故障突发率, 减少设备的检修成 本, 对电力系统设备的状态检测和安全维护是至关重要的。 0003 国内外对于电力系统故障预警方面的研究有的采用了基于密度的DBSCAN聚类算 法计算采样数据和历史故障数据簇的相对邻近度, 完成对数据的类别划分; 有的采用了三 种不同的归一化方法处理数据样本, 将其作为模糊C均值算法的输入, 通过求隶属度确定样 本的故障类型; 有的对变压器的不同短路匝数、 轴向位移和径向变形进行聚类, 聚类结果用 于解释频率响应分析来诊断设备的故障; 有的采用了模糊c均值的隶属度函数的指数形式 来获取距离的判断指标, 得到的隶属度矩阵实现对变压器故障数据的划分。 目前电力。

7、设备 的故障预警方法大多是通过简单的聚类算法实现, 无法挖掘分析出数据间的隐含的相关关 系, 且无法尽快地检测到故障趋势, 不能为运维人员争取更多的维修时间, 从而造成严重的 损失。 0004 若要对电力系统设备的故障状态做出及时有效的预警, 必须深度挖掘数据间隐含 的关联关系。 由于电力系统在线监测数据每天都是呈现指数增长趋势, 而关联规则算法正 好具备能从大量的数据集中挖掘出无法直观感受的规则的优势, 往往能给出意想不到的规 则组合, 因此被广泛应用在电力系统故障诊断、 火电厂优化、 网络安全等诸多领域。 发明内容 0005 本发明的主要目的在于提供一种基于模糊关联规则的电力系统设备故障预。

8、警方 法。 0006 本发明采用的技术方案是: 一种基于模糊关联规则的电力系统设备故障预警方 法, 包括以下步骤: 由K均值和信息熵混合迭代确定电力设备数据的最佳分区数, 以实现动态自适应边界 划分; 引入模糊集以软化属性边界划分, 使用模糊C均值进行模糊区间划分; 使用Apriori算法, 选取一组最佳的最小支持度和信任度作为挖掘算法的主参数, 以此 参数挖掘出关联规则构建规则库, 以分析预测电力设备的故障状态。 0007 进一步地, 包括以下步骤: 由改进的K均值和信息熵混合迭代求出初始类个数以及初始类中心, 由FCM聚类求出最 终聚类结果; 说明书 1/9 页 3 CN 11140178。

9、5 A 3 设待聚类的样本集为, 基于模糊关联规则的电力系统设 备故障预警方法的具体步骤为: S1: 确定初始聚类个数的范围; S2: 在聚类个数逐渐增加的过程中, 每对应一个聚类数j, 利用改进的K-means算法求出 聚类中心, 再在计算数据偏离度的基础上求出信息熵的跃迁差值; S3: 在已求得的序列中, 得到的达到最小值时的聚类个数k及此时的聚类中心 ; S4: 将最佳聚类个数k及类中心作为初始化参数, 对FCM算法进行初始化; S5: 更新模糊聚类的隶属度矩阵; S6: 如果, 则聚类算法停止并输出隶属度矩阵和类中心, 否则 转向S5继续迭代; S8: 获取最终的隶属度矩阵和类中心, 。

10、将数据集中的数据划分到对应的类中。 0008 本发明的优点: (1) 能够定量地得到属性离散化时的最佳分区数, 实现动态自适应属性边界划分。 0009 (2) KEFCM算法的使用和最小支持度、 最小置信度的选取能够有效地保留数据边缘 信息, 避免在挖掘关联规则的过程中忽略有研究价值的规则, KEFCM算法分类准确度高。 0010 (3) 相较传统的关联规则方法能够快速准确地检测到设备的故障状态。 0011 除了上面所描述的目的、 特征和优点之外, 本发明还有其它的目的、 特征和优点。 下面将参照图, 对本发明作进一步详细的说明。 附图说明 0012 构成本申请的一部分的附图用来提供对本发明的。

11、进一步理解, 本发明的示意性实 施例及其说明用于解释本发明, 并不构成对本发明的不当限定。 0013 图1是本发明实施例的方法流程图; 图2是本发明实施例的信息熵跃迁差值变化图; 图3 是本发明实施例的三种聚类算法对比结果图; 图4是本发明实施例的获得频繁1-项集流程图; 图5是本发明实施例的获得频繁k-项集流程图; 图6是本发明实施例的不同支持度下, 匹配率均值与信任度的关系图; 图7是本发明实施例的不同支持度下, 匹配率方差与信任度的关系图。 具体实施方式 0014 为了使本发明的目的、 技术方案及优点更加清楚明白, 以下结合附图及实施例, 对 本发明进行进一步详细说明。 应当理解, 此处。

12、所描述的具体实施例仅仅用以解释本发明, 并 不用于限定本发明。 说明书 2/9 页 4 CN 111401785 A 4 0015 本发明提供了一种基于模糊关联规则的电力系统设备故障预警方法。 0016 聚类算法 K均值聚类: K均值(K-means)是聚类分析中使用最广泛的方法之一, 是一种简单的迭代型聚类算 法 , 其目的是达到类内数据距离最小化 , 类间数据距离最大化。 对于给定数据集 , 其中n为数据个数, d为数据维度。 x 中的每个数据根据各自属 性划分为个不同的类, 每个类都有一个聚类中心, 对于第j个类的类别 空间, 由类中所有数据的均值表示, 计算公式如下: (1) 给定一个。

13、聚类中心为, 数据间采用欧式距离作为划分指标, 计算公式如下: (2) K-means算法的基本步骤: S1: 选取数据空间中的 k个数据作为初始聚类中心; S2: 对于数据集 x中的每个数据, 根据它们与这些聚类中心的欧氏距离dij, 按距离最 近的准则将它们分到最近的聚类中心所对应的类; S3: 将每个类中所有数据所对应的均值作为该类别的聚类中心, 更新聚类中心; S4: 判断聚类中心是否发生改变, 若不变, 则输出结果; 反之, 返回S2继续。 0017 K-means算法使所获得的聚类满足同一类中的数据对象相似度较高, 而不同类的 数据对象相似度较低。 但是K-means算法是根据初始。

14、聚类中心来确定一个初始的划分, 然后 再对初始划分进行优化。 这个初始聚类中心的选择对聚类结果有很大的影响, 一旦初始值 选择地不好, 就可能无法得到有效的聚类结果, 这也成为K-means算法的一个主要问题。 因 此, 改进K-means算法选取聚类中心的方法以保证初始聚类中心间的相互距离尽可能的远。 聚类中心初始化算法流程如下: S1: 从输入的数据点集合 x 中随机选择一个点作为第一个聚类中心; S2: 对于 x 中的每一个数据: (1) 计算它们与已选择的聚类中心的距离; (2) 计算每个数据被选为下一个聚类中心的概率p(xi); (3) (3) 在0,1间取一个随机数r, 用r减去第。

15、一个数据的概率, 如果减去的结果小于等于 0, 则选其成为下一个聚类中心; 反之, 若结果大于0, 则继续减去下一个数据的概率值, 重复 说明书 3/9 页 5 CN 111401785 A 5 该过程, 直到减去后的结果小于等于0为止; 最后减去的概率值所对应的数据被选做下一个 聚类中心; S3: 重复S2直到 k个聚类中心全部被选出。 0018 信息熵: 1948年, C.E.Shannon 将熵(Entropy)概念引入信息学领域, 用信息熵来度量数据所含 的信息量。 对于划分为k个类集合的数据集x, 用Pij表示第i个样本点对于第j个类聚类中心 的偏离度, 其值越小表示第i个样本属于第。

16、j个类的可能性越小, 离j类越远。 其中, 偏离度 Pij的计算公式如下: (4) 类的总体信息熵计算公式如下: (5) 从第j-1个状态跳跃到第j个状态的信息熵差称为信息熵跳变值, 计算公式如下: (6) 从第j-1个到第j个状态熵跳变值与从第j个到第j+1个状态熵跳变值的差值称为信息 熵跃迁差值, 计算公式如下: (7) 随着聚类个数的增加, 每个类中的数据量减少, 每个数据属于一个类的概率增大, 该类 总体的信息熵就变大。 在类个数由少增多的过程中, 类划分按无序到有序再到无序的顺序 进行, 最初的无序是因为聚类太笼统, 不能了解数据集的整体特征, 而最后的无序是聚类太 细碎, 缺乏对数。

17、据集整体的认识。 因此, 可以用数据集信息熵跃迁差值来确定最佳聚类 数, 即在聚类数量从 (k-1个类k个类) 到 (k个类k+1个类) 的最低时, 表示已经没有将 数据集从k个类增加到k+1个类的必要, 此时k为最佳聚类数。 0019 模糊C均值聚类: 模糊C均值(fuzzy c-means algorithm, FCM)是一种无监督的模糊聚类算法, 用于将高 维空间分布的数据划分成特定的类别。 它通过优化目标函数得到每个样本点对所有类中心 的隶属度, 从而决定样本点以达到自动对样本数据进行分类的目的。 FCM算法的基本思想是 将给定的样本集划分成k个模糊簇, 使给定的目 标函数J最小。 目。

18、标函数J定义如下: (8) 式中:为模糊指数,为第i个数据属于第j类的隶 属度矩阵。 说明书 4/9 页 6 CN 111401785 A 6 0020在每次迭代中, 使用隶属度函数计算隶属度值, 并更新聚类中心和隶属度矩阵 , 该算法的基本步骤为: S1: 初始化聚类个数k, 模糊加权指数m, 迭代终止阈值, 迭代次数, 以及隶属度 矩阵; S2: 计算模糊聚类中心: (9) S3: 更新模糊聚类的隶属度矩阵: (10) S4: 如果满足迭代终止条件, 则说明目标函数已达到极小值, 迭代终 止, 并输出隶属度矩阵和类中心, 否则转向S2继续运算, 直到满足条件。 0021 KEFCM算法的实。

19、现: 整体算法分为两个阶段, 第一阶段由改进的K均值和信息熵混合迭代求出初始类个数 以及初始类中心, 第二阶段由FCM聚类求出最终聚类结果。 0022参考图1, 如图1所示, 已知待聚类的样本集为, KEFCM ( Fuzzy c-means algorithm based on K-means and Entropy)算法的整体步骤为: S1: 确定初始聚类个数的范围; S2: 在聚类个数逐渐增加的过程中, 每对应一个聚类数j, 利用改进的K-means算法求出 聚类中心, 再在计算数据偏离度的基础上求出信息熵的跃迁差值; S3: 在已求得的序列中, 得到的达到最小值时的聚类个数k及此时的聚。

20、类中心 ; S4: 将最佳聚类个数k及类中心作为初始化参数, 对FCM算法进行初始化; S5: 更新模糊聚类的隶属度矩阵; S6: 如果, 即隶属度矩阵相对于上次的隶属度矩阵的更新 值小于迭代终止阈值, 则聚类算法停止并输出隶属度矩阵和类中心, 否则转向S5继续 迭代; S8: 获取最终的隶属度矩阵和类中心, 将数据集中的数据划分到对应的类中。 0023 本发明能够定量地得到属性离散化时的最佳分区数, 实现动态自适应属性边界划 分; 说明书 5/9 页 7 CN 111401785 A 7 KEFCM算法的使用和最小支持度、 最小置信度的选取能够有效地保留数据边缘信息, 避 免在挖掘关联规则的。

21、过程中忽略有研究价值的规则, KEFCM算法分类准确度高; 相较传统的关联规则方法能够快速准确地检测到设备的故障状态。 0024 算例验证: 采用测试数据集验证本文所提算法的有效性, 选取UCI Wine数据集作为测试数据, 该 数据集共有178个样本, 13个特征 (Alcohol、 Malic acid、 Ash等) , 总共分为3类, 数据集的部 分样本数据如表1所示。 0025 表1Wine部分样本数据 由信息熵结合K均值迭代计算求得熵跃迁差值如图2所示, 由图可知, 跃迁状况为2时, 系统的跃迁差值最小, 故该数据集的最佳分类数为3, 此值与测试数据集的实际分类数相 符。 0026 。

22、实际上, Wine数据集的三类样本分别含有59、 71、 48个样本, 分别用k-means、 FCM 和KEFCM这三种算法对Wine数据集进行分类, 结果如图3所示, 可见本文提出的KEFCM算法分 类准确度最高。 0027 Apriori算法的基本理论: Apriori算法是一种发现频繁项集的布尔型管理规则算法, 该算法使用逐层迭代法进 行计算, 并基于候选项集来生成频繁项集, 即使用(k-1)-项集L k-1产生k-项集L k。 频繁1- 项集及频繁k-项集的计算过程如图4和图5所示。 通过扫描数据库, 累计每个项的计数, 获取 满足最小支持度的项, 找出频繁1-项集的集合, 记为L1。

23、, 之后通过频繁1-项集的集合L1寻找 频繁2-项集的集合L2, 以此类推, 直到无法获取满足条件的项集, 此时得到的项集称为最大 频繁项集。 0028 从L k-1项集获取L k项集时需要执行连接步与剪枝步操作。 连接步: 将L k-1与自 身连接产生候选k-项集的集合, 记为Ck。 剪枝步: 若候选k-项集的任意一个(k-1)项子集不 存在于L k-1中, 则将该候选项集删除。 0029 关联规则的有效性是由支持度和信任度来决定的。 根据关联规则的定义, 对于数 据库, 假如A和B是的子集事务, 则满足, 且为空集, 则 的式子为关联规则, A和B为关联规则的前件和后件。 支持度是数据库中。

24、的百分 比, 如式 (12) 所示。 说明书 6/9 页 8 CN 111401785 A 8 0030(11) 式中: A为关联规则的前件; B为关联规则的后件。 0031信任度是数据库中表示A出现时B的概率, 如式 (13) 所示。 0032(12) 实验分析: 数据准备: 变压器发生的故障不同主要产生的故障特征气体就不同。 国内现有的GB/T7252-2001 变压器油中溶解气体分析与判断导则 中表明影响变压器故障产生的特征气体主要为H2、 CH4、 C2H2、 C2H4、 C2H6五个属性如表2所示, 提取其 2017年1000组气体组分历史正常数据以 及2018年5月发生的一次故障记。

25、录点前后共600组数据进行分析。 0033 表2变压器属性 采用KEFCM聚类算法对五个连续属性的1000组数据进行离散化处理, 获得各属性最佳 分类数后的离散化区间如表3所示 (保留两位有效小数) 。 0034 表3变压器属性离散化区间 鉴于数据挖掘的需要, 属于不同属性的区间要加以区分, 以免重复, 故需对待挖掘数据 编号。 例如, 某一组数据中H2值为14.88, 即该值落在x0属性的第五个区间, 故将该数据记为 05, 以此类推。 最终得到的待挖掘数据库形式如表4所示。 0035 表4待挖掘数据库 说明书 7/9 页 9 CN 111401785 A 9 4.2 关联规则库的建立 为了。

26、使挖掘出的关联规则准确地表达变压器各属性之间的关系, 最小支持度minSup与 最小信任度minConf的选取也是最关键的一步。 本文采用 “匹配率” 这一指标, 并结合其均值 与方差, 作为评价在某一组minSup与minConf下所挖掘出的关联规则的准确性指标, 并通过 多组实验, 找到一组最佳的minSup与minConf, 以此参数下挖掘出的规则组成关联规则库。 匹配率的计算公式如下: (13) 式中:为当前数据所符合的规则数,为只符合规则前件而不符合规则后件的规 则数,为该组数据与规则库的匹配程度。 0036越大, 表示规则更准确地反映了该组数据各属性的内在联系。 用所有匹配数据 的。

27、匹配率均值来表示规则库与训练数据的平均匹配程度, 匹配率方差来表示规则库适用于 训练数据的稳定程度。 0037 在不同minSup与minConf下建立规则库, 比较匹配率均值与方差在不同规则库中 的变化, 确定一组最佳的minSup与minConf, 作为挖掘算法的参数来建立规则库。 实验分析 结果如下图6和图7所示。 0038 总体而言支持度数值越大、 信任度越高, 那么均值越小、 方差越大, 但支持度和信 任度过大都会导致均值骤然降低、 方差骤然升高。 这是由于支持度和信任度过大导致规则 数骤减, 降低了规则库的覆盖率, 即大量数据找不到与之匹配的规则。 由图6和图7可知, 当 ,时为A。

28、priori算法最佳的一组最小支持度和信任度。 在 此基础上挖掘出的频繁属性集共2781条, 关联规则共5546条, 部分频繁属性集及关联规则 的形式如表5和表6所示。 0039 表5部分频繁属性集 表6部分关联规则 说明书 8/9 页 10 CN 111401785 A 10 以表8中第一条关联规则 (11, 2302) 为例, 其代表的含义为: 若给CH4值在第一个区间 (11.53, 12.61) , C2H2的值在第三个区间 (2.29, 3.43) , 那么H2的值落在第二个区间 (5.51, 8.35) 的概率为95.14%。 0040 预警效果验证: 为进一步验证该故障预警方法的。

29、实用性, 选取2018年5月发生的一次故障记录点前后 共600组数据进行有效性验证 (其中第300组数据为初始故障点) 。 该方法下的预警结果和传 统关联规则下的预警结果如表7所示。 0041 表7变压器故障诊断结果 关联规则是设备在正常状态下各属性之间关系的一种体现, 在故障前期, 各属性间现 有的关联关系正在逐渐被打破, 不断恶化。 原本的关联规则对当前运行数据的适用性逐渐 降低, 从而发生报警。 由表8可得, 模糊关联规则的诊断结果在第276组数据时即已检测出存 在故障趋势, 而传统关联规则方法在第293组数据才识别出故障趋势, 说明本文方法能够较 为准确地诊断变压器的故障状态。 综述,。

30、 该实验结果验证了模糊关联规则在故障预警过程 中的有效性和高效性。 0042 以上所述仅为本发明的较佳实施例, 并不用以限制本发明, 凡在本发明的精神和 原则之内, 所作的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。 说明书 9/9 页 11 CN 111401785 A 11 图 1 说明书附图 1/5 页 12 CN 111401785 A 12 图 2 图 3 说明书附图 2/5 页 13 CN 111401785 A 13 图 4 说明书附图 3/5 页 14 CN 111401785 A 14 图 5 说明书附图 4/5 页 15 CN 111401785 A 15 图 6 图 7 说明书附图 5/5 页 16 CN 111401785 A 16 。

展开阅读全文
内容关键字: 基于 模糊 关联 规则 电力系统 设备 故障 预警 方法
关于本文
本文标题:基于模糊关联规则的电力系统设备故障预警方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9183006.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1