基于数据整体信息和邻域结构的工业过程故障检测方法.pdf

上传人:sha****007 文档编号:9185805 上传时间:2021-05-09 格式:PDF 页数:11 大小:695.08KB
收藏 版权申诉 举报 下载
基于数据整体信息和邻域结构的工业过程故障检测方法.pdf_第1页
第1页 / 共11页
基于数据整体信息和邻域结构的工业过程故障检测方法.pdf_第2页
第2页 / 共11页
基于数据整体信息和邻域结构的工业过程故障检测方法.pdf_第3页
第3页 / 共11页
文档描述:

《基于数据整体信息和邻域结构的工业过程故障检测方法.pdf》由会员分享,可在线阅读,更多相关《基于数据整体信息和邻域结构的工业过程故障检测方法.pdf(11页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010088167.3 (22)申请日 2020.02.12 (71)申请人 江南大学 地址 214000 江苏省无锡市滨湖区蠡湖大 道1800号 (72)发明人 栾小丽李智豪陈珺刘飞 (74)专利代理机构 哈尔滨市阳光惠远知识产权 代理有限公司 23211 代理人 林娟 (51)Int.Cl. G06K 9/62(2006.01) G06N 3/12(2006.01) G06Q 10/06(2012.01) (54)发明名称 一种基于数据整体信息和邻域结构的工业 过程故障。

2、检测方法 (57)摘要 本发明提供了一种基于数据整体信息和邻 域结构的工业过程故障检测方法, 属于过程监控 领域。 包括对正常工况下的训练集进行数据预处 理、 计算整体信息、 最优投影矩阵、 计算潜变量空 间和残差、 计算与数据集相关联的T2统计量和 SPE(Q)统计量、 采用非参数检验的方法估计出T2 统计量和SPE(Q)统计量的控制上限; 并与监控数 据集的T2统计量和SPE(Q)统计量进行比较, 判断 是否超出控制限。 本发明利用了挖掘数据全局和 局部特征能够获得更优性能的思想, 有效避免了 由数据降维展开造成的信息损失问题, 大大提高 了过程监控中故障检测的效果。 权利要求书2页 说明。

3、书5页 附图3页 CN 111340072 A 2020.06.26 CN 111340072 A 1.一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述方 法包括: 离线建模和在线监控两个部分, 所述离线建模包括: 采集工业过程中在系统正常时 与在系统处于故障状态下的工业过程数据作为系统原始的过程信息; 并对工业过程数据采 用除单一属性变量、 填充缺失数据、 剔除异常数据等方法进行预处理, 再经过标准化处理, 得到具有零均值和单位方差的工业过程数据集; 得到与工业过程数据集相关联的T2统计量 和SPE(Q)统计量; 获取T2统计量和SPE(Q)统计量的控制上限; 所述。

4、在线监控包括: 采用与上述相同的方法得到工业过程测试数据集和与其相关联的 T2new统计量和SPE(Q)new; 根据T2new统计量和SPE(Q)new是否同时超过控制上限, 从而实现故障 检测。 2.如权利要求1所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述获取工业过程数据集的T2统计量、 控制上限, SPE(Q)统计量、 控制上限的 方法包括: 步骤一: 获取工业数据集X的均值与协方差矩阵C, 步骤二: : 获取数据集X的邻域; 首先计算所有样本点之间的欧式距离, 根据样本数目设 定适当的近邻个数, 然后通过聚类学习算法选取每个样本点的近邻点; 步骤三:。

5、 计算各邻域内样本点到近邻中心点的距离; 设W为稀疏对称矩阵; 如果两点之 间没有点连接, 则Wij0; 如果两点是邻近点, 则W由热核函数计算得出; 步骤四: 利用智能学习算法求解出最优投影矩阵G; 步骤五: 建立监控模型; 包括: 潜变量特征空间模型Y和残差空间模型E; 步骤六: 计算与数据集X相关联的T2统计量和SPE(Q)统计量; 步骤七: 采用非参数检验的方法估计出T2统计量和SPE(Q)统计量的控制上限。 3.如权利要求2所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述聚类学习算法为k近邻算法, 包括以下步骤: 计算所有样本点之间的欧式 距离, 接着。

6、根据样本数目设定适当的近邻个数k, 然后通过k近邻算法选取每个样本点的近 邻点, 若两点之间有一个点在另一个点的邻域内, 那么这两个点之间有边连接, 反之没有。 4.如权利要求2所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述热核函数为: 其中, tR。 5.如权利要求2所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述最优投影矩阵G采用遗传算法得出, 根据下式解得: M(1-WT)(1-W) 其中, 为平滑参数。 6.如权利要求2所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述潜变量特征空间Y为: 。

7、YGX。 权利要求书 1/2 页 2 CN 111340072 A 2 7.如权利要求2所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述残差空间模型E为: EX-YGT。 8.如权利要求2所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述与数据集X相关联的T2统计量为: 9.如权利要求2所述的一种基于数据整体信息和邻域结构的工业过程故障检测方法, 其特征在于, 所述与数据集X相关联的SPE(Q)统计量为: 10.权利要求1-9任一所述的一种基于数据整体信息和邻域结构的工业过程故障检测 方法用于化工、 炼油、 轻工等工业过程; 工业过。

8、程中的过程信息由通过各种物理、 化学性质 来表征产品质量的参数组成。 权利要求书 2/2 页 3 CN 111340072 A 3 一种基于数据整体信息和邻域结构的工业过程故障检测方法 技术领域 0001 本发明涉及一种基于数据整体信息和邻域结构的工业过程故障检测方法, 属于过 程监控领域。 背景技术 0002 我国正处于新型工业化、 信息化、 城镇化和农业现代化的快速发展阶段, 生产安全 问题是工业过程备受关注的问题之一。 工业过程是指如石化、 电力、 冶金、 造纸、 医药、 食品 等工业; 它们的特点是连续性; 其原料和产品多为均一相(固、 液或气体)的物料。 其产品质 量多由纯度和各种物。

9、理、 化学性质表征。 化工、 炼油、 冶金、 轻工、 建材、 制药等行业均属于过 程工业。 0003 过程监控的目的是通过监控生产过程的运行状态, 不断检测过程的变化和状态信 息, 防止故障发生, 使系统在给定的性能指标下平稳运行。 因此, 在生产过程中建立高效、 准 确、 实时的故障检测和诊断系统, 对故障进行准确及时的检测、 诊断和消除, 对于保障操作 人员的人身安全, 确保化工过程的顺利实施, 改进产品质量降低产品成本, 保护社会和自然 环境有着重要的社会效益和巨大的经济意义。 而故障检测是展开后续研究的基础, 同时也 是过程监控领域的研究热点之一。 0004 传统的过程监控方法被分为三。

10、大类: 基于定量机理模型、 基于知识和基于数据驱 动的方法。 随着信息技术的发展和大数据时代的来临, 计算机性能和数据存储能力大大提 升, 采集和测量海量数据变得更加方便快捷。 这些数据为客观现象提供了更全面、 更丰富、 更详细的过程状态, 能够帮助人们更好地认识事物的形态特征和客观规律, 也为过程建模, 监控和控制提供了有用的信息基础。 近些年数据挖掘、 机器学习等技术的快速发展为基于 数据驱动的过程监控奠定了强大的理论基础。 0005 主元分析作为一种基于数据驱动的过程控制方法, 在工业生产过程中被广泛应用 并取得了不错的成果。 但主元分析方法仅能捕捉到过程数据的全局结构, 仅仅体现了数据。

11、 间的整体信息, 忽视了数据间的邻域结构, 而工业数据之间存在很强的相关性, 这就使得过 程监控中出现很多的误报和漏报, 效果大大降低。 近年来, 为了解决此问题, 出现了很多流 形学习的方法, 从数据间的邻域结构角度进行分析, 充分挖掘了数据间的局部关系, 但忽视 了数据间的全局结构, 现有的故障检测方法仅从数据的整体信息角度或者数据间的邻域结 构关系出发, 有数据从高维降到低维产生的信息损失等问题, 能够既实现数据整体方差最 大化, 又能保证数据间邻域结构不变的方法在故障检测中比较匮乏。 发明内容 0006 本发明提供一种基于数据整体信息和邻域结构工业过程故障检测方法, 所述方法 包离线建。

12、模和在线监控两个部分, 所述离线建模包括: 采集工业过程中在系统正常时与在 系统处于故障状态下的工业过程数据作为系统原始的过程信息; 并对工业过程数据采用除 单一属性变量、 填充缺失数据、 剔除异常数据等方法进行预处理, 再经过标准化处理, 得到 说明书 1/5 页 4 CN 111340072 A 4 具有零均值和单位方差的工业过程数据集; 得到与工业过程数据集相关联的T2统计量和 SPE(Q)统计量; 获取T2统计量和SPE(Q)统计量的控制上限; 0007 所述在线监控包括: 采用与上述相同的方法得到工业过程测试数据集和与其相关 联的T2new统计量和SPE(Q)new; 根据T2new。

13、统计量和SPE(Q)new是否同时超过控制上限, 从而实现 故障检测。 0008 在本发明的一种实施方式中, 所述获取工业过程数据集的T2统计量、 控制上限, SPE(Q)统计量、 控制上限的方法包括: 0009步骤一: 获取工业数据集X的均值与协方差矩阵C,RD n为维数为D的n个向量集; 0010 步骤二: 获取数据集X的邻域; 首先计算所有样本点之间的欧式距离, 根据样本数 目设定适当的近邻个数, 然后通过聚类学习算法选取每个样本点的近邻点; 0011 步骤三: 计算各邻域内样本点到近邻中心点的距离; 设W为稀疏对称矩阵; 如果两 点之间没有点连接, 则Wij0; 如果两点是邻近点, 则。

14、W由热核函数计算得出; 0012 步骤四: 利用智能学习算法求解出最优投影矩阵G; 0013 步骤五: 建立监控模型; 包括: 潜变量特征空间模型Y和残差空间模型E; 0014 步骤六: 计算与数据集X相关联的T2统计量和SPE(Q)统计量; 0015 步骤七: 采用非参数检验的方法估计出T2统计量和SPE(Q)统计量的控制上限。 0016 在本发明的一种实施方式中, 所述聚类学习算法为k近邻算法, 包括以下步骤: 计 算所有样本点之间的欧式距离, 接着根据样本数目设定适当的近邻个数k, 然后通过k近邻 算法选取每个样本点的近邻点, 若两点之间有一个点在另一个点的邻域内, 那么这两个点 之间有。

15、边连接, 反之没有。 0017 在本发明的一种实施方式中, 所述热核函数为: 0018 0019 其中, t为热核函数参数, tR, R为实数集。 0020 在本发明的一种实施方式中, 所述最优投影矩阵G采用遗传算法得出, 根据下式解 得: 0021 M(1-WT)(1-W) 0022 0023 其中, 为平滑参数。 0024 在本发明的一种实施方式中, 所述潜变量特征空间Y为: YGX。 0025 在本发明的一种实施方式中, 所述残差空间模型E为: EX-YGT。 0026 在本发明的一种实施方式中, 所述与数据集X相关联的T2统计量为: 0027 0028 其中, xi为数据集X中第i个向。

16、量, yi为潜变量特征空间Y中第i个向量。 说明书 2/5 页 5 CN 111340072 A 5 0029 在本发明的一种实施方式中, 所述与数据集X相关联的SPE(Q)统计量为: 0030 0031 其中, I为单位矩阵。 0032 在本发明的一种实施方式中, 所述非参数检验的方法为核密度估计的方法。 0033 本发明的一种基于数据整体信息和邻域结构的工业过程故障检测方法用于原油 脱盐脱水过程的故障检测。 0034 有益效果: 0035 本发明在故障检测中不仅实现了数据整体信息的极大保留, 而且兼顾了数据间邻 域结构的保持, 并且可以经过调整平滑参数来改变整体信息和邻域结构的保持比例, 。

17、克服 了现有的故障检测方法仅从数据的全局角度或者局部关系出发、 数据从高维降到低维产生 的信息损失等问题, 提高了对非线性故障特征提取的能力; 利用了挖掘数据全局和局部特 征能够获得更优性能的思想, 有效避免了由数据降维展开造成的信息损失问题, 大大提高 了过程监控中故障检测的效果。 附图说明 0036 图1为基于数据整体信息和邻域结构的工业过程故障检测手段实施流程框图。 0037 图2为实施例1的原油脱盐脱水过程潜变量特征空间分布图。 0038 图3为实施例1的原油脱盐脱水过程的T2统计量监控图。 0039 图4为实施例1的原油脱盐脱水过程的SPE(Q)统计量监控图。 具体实施方式 0040。

18、 下面结合附图和实施例对本发明作进一步详细说明。 0041 实施例1 0042 下面结合原油脱盐脱水过程, 具体阐述本发明的过程。 原油脱盐脱水为针对未处 理的轻质石油, 即原油, 通过注入水和破乳剂, 经过混合使油水充分接触, 原油中能溶于水 的杂质进入水中, 经过电脱盐装置, 在电场、 温度下的作用下, 破坏乳状液, 实现油水分离沉 降, 从而完成电化学脱盐脱水的过程。 0043 如图1所示, 一种基于数据整体信息和邻域结构的工业过程故障检测方法, 所述方 法分为离线建模和在线监控两个部分, 所述离线建模包括: 0044 S101: 采集原油脱盐脱水过程中的过程变量样本作为系统原始的过程信。

19、息, 所述 过程变量包括: 破乳剂含量、 温度、 压力、 Cl含量、 水的密度, 采集的过程变量样本总数共为 1680个, 所述样本总数中960个为系统正常时采集得到, 720个为系统处于故障状态下采集 得到; 通过去除单一属性变量、 填充缺失数据、 剔除异常数据等方法对训练数据集进行预处 理, 再进行标准化处理, 化为具有零均值和单位方差的数据集X, 0045S102: 获取数据集X的整体信息, 包括均值与协方差矩阵C; 计算如下: 0046 说明书 3/5 页 6 CN 111340072 A 6 0047 0048 S103: 获取数据集X的邻域; 首先计算所有样本点之间的欧式距离, 根。

20、据样本数目 设定适当的近邻个数, 然后通过聚类学习算法选取每个样本点的近邻点, 所述聚类学习算 法选择现有技术中较为成熟的K-NN(k近邻)算法, 包括以下步骤: 计算所有样本点之间的欧 式距离, 接着根据样本数目设定适当的近邻个数k, 本实施例中k10, 然后通过K-NN算法选 取每个样本点的近邻点, 若两点之间有一个点在另一个点的邻域内, 那么这两个点之间有 边连接, 反之没有。 0049 S104: 计算各邻域内样本点到近邻中心点的距离; 设W为稀疏对称矩阵; 如果两点 之间没有点连接, 则Wij0; 如果两点是邻近点, 则W由热核函数计算得出, 即 0050 0051 其中, tR。 。

21、0052 S105: 利用智能学习算法求解出最优投影矩阵G, 如遗传算法, 神经网络等; 本实施 例采用遗传算法, 根据下式解得最优投影矩阵G; 0053 M(1-WT)(1-W) (0.4) 0054 0055 其中, 为平滑参数, 选定 0.5。 0056 S106: 建立监控模型; 包括: 潜变量特征空间模型Y和残差空间模型E; 0057根据公式(1.6)计算潜变量特征空间 0058 YGX (0.6) 0059 绘制出的潜变量特征空间图如图2所示, 可见正常数据点和故障数据点在特征空 间中被分开的很清楚。 0060 根据公式(1.7)计算残差E, 0061 EX-YGT (0.7) 0。

22、062 S107: 计算与数据集X相关联的T2统计量和SPE(Q)(平方预报误差)统计量; 0063 0064 0065 S108: 采用非参数检验的方法估计出T2统计量和SPE(Q)统计量的控制上限, 本实 施例采用核密度估计的方法, 通过Matlab仿真计算, 得出T2统计量控制上限为1.39, SPE(Q) 统计量的控制上限为111.64。 0066 所述在线监控包括: 0067 S201: 选定原油脱盐脱水过程中的破乳剂含量、 温度、 压力、 Cl含量、 水的密度等相 说明书 4/5 页 7 CN 111340072 A 7 关过程变量作为系统原始的过程信息, 一共采集600个样本, 。

23、其中前400个是在系统正常时 采集得到的, 后200个样本是在系统处于故障状态下采集得到的, 并进行与S101相同的标准 化处理, 得到测试数据集Xnew; 0068 S202: 根据公式(1.6)、 (1.7)得到监控数据的潜变量空间Ynew和残差Enew; 0069 S203: 利用公式(1.8)、 (1.9)求出与监控数据Xnew相关联的T2new统计量和SPE(Q)new 统计量; 0070 S204: 根据T2统计量和SPE(Q)统计量是否同时超过其控制上限, 来实现故障检测。 T2统计量和SPE(Q)统计量同时超过控制限则系统处于故障。 如图3和图4所示, 图中虚线即 为控制上限,。

24、 可以看出后200数据的T2统计量和SPE(Q)统计量同时超出了其控制限, 则此阶 段原油脱盐脱水过程处于故障模式。 通过Matlab仿真计算可知误报率为1.00, 漏报率为 0.00。 0071 本发明的保护范围并不仅局限于上述实施例, 凡是在本发明构思的精神和原则之 内, 本领域的专业人员能够做出的任何修改、 等同替换和改进等均应包含在本发明的保护 范围之内。 说明书 5/5 页 8 CN 111340072 A 8 图1 说明书附图 1/3 页 9 CN 111340072 A 9 图2 图3 说明书附图 2/3 页 10 CN 111340072 A 10 图4 说明书附图 3/3 页 11 CN 111340072 A 11 。

展开阅读全文
内容关键字: 基于 数据 整体 信息 邻域 结构 工业 过程 故障 检测 方法
关于本文
本文标题:基于数据整体信息和邻域结构的工业过程故障检测方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/9185805.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1