基于深度学习的营配用数据自动聚类分析设备及方法.pdf

上传人:jo****n 文档编号:10090116 上传时间:2021-06-03 格式:PDF 页数:9 大小:472.76KB
收藏 版权申诉 举报 下载
基于深度学习的营配用数据自动聚类分析设备及方法.pdf_第1页
第1页 / 共9页
基于深度学习的营配用数据自动聚类分析设备及方法.pdf_第2页
第2页 / 共9页
基于深度学习的营配用数据自动聚类分析设备及方法.pdf_第3页
第3页 / 共9页
文档描述:

《基于深度学习的营配用数据自动聚类分析设备及方法.pdf》由会员分享,可在线阅读,更多相关《基于深度学习的营配用数据自动聚类分析设备及方法.pdf(9页完成版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010650325.X (22)申请日 2020.07.08 (71)申请人 国网浙江省电力有限公司杭州供电 公司 地址 310000 浙江省杭州市上城区建国中 路219号 (72)发明人 祝春捷徐晓华潘坚跃周波 李强强倪萍杨阳孔仪潇 谢赟向新宇雷云王瑾丁晖 (74)专利代理机构 杭州华鼎知识产权代理事务 所(普通合伙) 33217 代理人 项军 (51)Int.Cl. G06K 9/62(2006.01) G06F 16/215(2019.01) G06N 3/04(20。

2、06.01) G06N 3/08(2006.01) G06Q 50/06(2012.01) (54)发明名称 基于深度学习的营配用数据自动聚类分析 设备及方法 (57)摘要 本发明公开了一种基于深度学习的营配用 数据自动聚类分析设备及方法, 解决了现有技术 的不足, 方法包括预训练方法和微调方法, 预训 练方法首先将营配用数据输入预训练模块, 然后 预训练模块通过对营配用数据进行预训练构成 预训练模型, 微调方法首先读取预训练模型, 然 后加载营配用数据通过多次微调优化预训练模 型构成最后自动聚类分析模型。 权利要求书2页 说明书4页 附图2页 CN 111898650 A 2020.11.0。

3、6 CN 111898650 A 1.一种基于深度学习的营配用数据自动聚类分析方法, 其特征是, 包括预训练方法和 微调方法, 预训练方法首先将营配用数据输入预训练模块, 然后预训练模块通过对营配用 数据进行预训练构成预训练模型, 微调方法首先读取预训练模型, 然后加载营配用数据通 过多次微调优化预训练模型构成最后自动聚类分析模型。 2.根据权利要求1所述的一种基于深度学习的营配用数据自动聚类分析方法, 其特征 是, 所述的预训练方法的预训练模块为受限玻尔兹曼机, 具体方法为: 步骤1, 设置受限玻尔兹曼机各层节点数、 迭代次数以及聚类个数; 步骤2, 加载营配用数据, 对数据进行清洗和归一化。

4、处理; 步骤3, 将清洗后的数据作为输入, 对玻尔兹曼机进行训练, 得到各层权值, 并保存; 步骤4, 利用模糊C均值法对训练学习到的特征进行聚类并保存聚类结果, 构成预训练 模型。 3.根据权利要求1所述的一种基于深度学习的营配用数据自动聚类分析方法, 其特征 是, 所述的微调方法具体为: 步骤5, 读取预训练部分预训练模型的网络参数和初始聚类中心; 步骤6, 加载营配用数据, 对数据进行清洗和归一化处理; 步骤7, 设置最大微调次数和循环初值; 步骤8, 利用批量梯度下降法对目标函数进行迭代寻优, 直至迭代停止。 4.根据权利要求2或3所述的一种基于深度学习的营配用数据自动聚类分析方法, 。

5、其特 征是, 所述的步骤2中, 对数据进行清洗的具体方法为: 获取营配用数据的误报样本, 然后对 误报样本所对应的营配用数据进行数据清洗。 5.根据权利要求4所述的一种基于深度学习的营配用数据自动聚类分析方法, 其特征 是, 判断误报样本的方法具体为: 受限玻尔兹曼机的营配用数据设有期望数据, 加载营配用 数据后, 输出得到实际输出数据, 将实际输出数据和期望数据进行对比, 如果存在差异则判 断为误报样本。 6.根据圈了要求2或3所述的一种基于深度学习的营配用数据自动聚类分析方法, 其特 征是, 所述的步骤2中, 对数据进行清洗的具体方法为: 获取营配用数据的误报样本, 若误报 样本的数量大于。

6、预设的阈值, 则对误报样本所对应的营配用数据进行数据清洗。 7.根据权利要求6所述的一种基于深度学习的营配用数据自动聚类分析方法, 其特征 是, 判断误报样本的方法具体为: 受限玻尔兹曼机的营配用数据设有期望数据, 加载营配用 数据后, 输出得到实际输出数据, 将实际输出数据和期望数据进行对比, 如果存在差异则判 断为误报样本。 8.根据权利要求3所述的一种基于深度学习的营配用数据自动聚类分析方法, 其特征 是, 所述的梯度下降法替换模拟退火算法, 具体为设置初始数据为x(n), 以一定跪在在当前 状态x(n)附近产生新的状态x (n), 计算f(x(n)与f(x (n), 得到 ff(x(n。

7、)-f(x(n) 如果f0, 则说明离最优位置变远, 进行概率操作, 计算 权利要求书 1/2 页 2 CN 111898650 A 2 再从01之间产生一个随机数 , 如果 p, 则接受x (n)为下一个状态值, 否则拒绝x (n), 下个状态值保持不变, x(n+1)x(n)。 9.一种基于深度学习的营配用数据自动聚类分析设备, 其特征是, 包括存储器和处理 器, 所述的存储器用于存储程序数据, 所述的处理器用于处理器程序数据以实现如权1-权8 中任一项权利要求所述的营配用数据自动聚类分析方法。 权利要求书 2/2 页 3 CN 111898650 A 3 基于深度学习的营配用数据自动聚类。

8、分析设备及方法 技术领域 0001 本发明涉及智能电网技术领域, 尤其是指一种基于深度学习的营配用数据自动聚 类分析设备及方法。 背景技术 0002 近年来, 随着电力专业间的纵向贯通与横向融合进度不断加快, 电力公司积极开 展营配数据采录贯通工作, 将变电站、 公用配变、 高压用户、 低压表箱等营配信息与营业网 点、 计量库房等营销服务资源信息进行采录, 实现了电网与客户信息的全覆盖。 电网营配贯 通后, 产生了海量异构数据, 这些数据对现有的分析与处理方法提出了新的挑战。 一方面, 具有海量、 异构、 多源、 高维等特征的营配用数据导致传统数据分析方法无法直接适用; 另 一方面, 营配用数。

9、据自身存在的数据质量低、 挖掘手段匮乏造成了贯通后的应用困难。 0003 中国专利公开号CN110766032A, 公开日2020年2月7日, 名称为 基于分层递进策略 的配电网数据聚类集成方法 的发明专利中公开了一种配电网数据聚类集成方法, 包括: 生 成配电网数据的备选聚类集合; 基于分层递进的局部权重算法对所述备选聚类集合进行筛 选获得基础聚类集合; 通过层次聚类方法对所述基础聚类集合进行集成获得最后的集成聚 类。 不足之处在于, 该专利的聚类方法较为简单, 不能做到准确的数据聚类, 数据质量仍然 较低。 发明内容 0004 本发明的目的是克服现有技术中营配用数据自身存在的数据质量低、 。

10、挖掘手段匮 乏造成了贯通后的应用困难的缺点, 提供一种基于深度学习的营配用数据自动聚类分析设 备及方法。 0005 本发明的目的是通过下述技术方案予以实现: 0006 一种基于深度学习的营配用数据自动聚类分析方法, 包括预训练方法和微调方 法, 预训练方法首先将营配用数据输入预训练模块, 然后预训练模块通过对营配用数据进 行预训练构成预训练模型, 微调方法首先读取预训练模型, 然后加载营配用数据通过多次 微调优化预训练模型构成最后自动聚类分析模型。 0007 作为一种优选方案, 所述的预训练方法的预训练模块为受限玻尔兹曼机, 具体方 法为: 0008 步骤1, 设置受限玻尔兹曼机各层节点数、 。

11、迭代次数以及聚类个数; 0009 步骤2, 加载营配用数据, 对数据进行清洗和归一化处理; 0010 步骤3, 将清洗后的数据作为输入, 对玻尔兹曼机进行训练, 得到各层权值, 并保 存; 0011 步骤4, 利用模糊C均值法对训练学习到的特征进行聚类并保存聚类结果, 构成预 训练模型。 0012 作为一种优选方案, 所述的微调方法具体为: 说明书 1/4 页 4 CN 111898650 A 4 0013 步骤5, 读取预训练部分预训练模型的网络参数和初始聚类中心; 0014 步骤6, 加载营配用数据, 对数据进行清洗和归一化处理; 0015 步骤7, 设置最大微调次数和循环初值; 0016。

12、 步骤8, 利用批量梯度下降法对目标函数进行迭代寻优, 直至迭代停止。 0017 作为一种优选方案, 所述的步骤2中, 对数据进行清洗的具体方法为: 获取营配用 数据的误报样本, 然后对误报样本所对应的营配用数据进行数据清洗。 0018 作为一种优选方案, 判断误报样本的方法具体为: 受限玻尔兹曼机的营配用数据 设有期望数据, 加载营配用数据后, 输出得到实际输出数据, 将实际输出数据和期望数据进 行对比, 如果存在差异则判断为误报样本。 0019 作为一种优选方案, 所述的步骤2中, 对数据进行清洗的具体方法为: 获取营配用 数据的误报样本, 若误报样本的数量大于预设的阈值, 则对误报样本所。

13、对应的营配用数据 进行数据清洗。 由于在预训练过程中很难达到完全不存在误报样本, 因此可以设置关于误 报样本的阈值。 统计存在误报样本的数量, 并判断误报样本的数量是否大于预设的阈值, 完 成对数据进行清洗。 0020 作为一种优选方案, 所述的梯度下降法替换模拟退火算法, 具体为设置初始数据 为x(n), 以一定跪在在当前状态x(n)附近产生新的状态x (n), 计算f(x(n)与f(x (n), 得 到 0021 ff(x (n)-f(x(n) 0022 如果f0, 则说明x (n)优于x(n), 就用x (n)作为下一个状态的值, x(n+1)x (n)。 如果f0, 则说明离最优位置变。

14、远, 进行概率操作, 计算 0023 0024 再从01之间产生一个随机数 , 如果 p, 则接受x (n)为下一个状态值, 否则拒 绝x (n), 下个状态值保持不变, x(n+1)x(n)。 0025 使用梯度下降进行最优解搜寻时, 多变量的误差曲面很像是连绵起伏的山峰一 样, 变量越多, 山峰和山谷也越多, 这就导致梯度下降法极容易陷入到局部的一个小山谷, 而停止搜索(局部最优)。 这就是常规的梯度下降法在解决多维度的优化问题中最常见的局 部最优问题。 因此局部极小问题可以通过模拟退火算法来解决。 0026 一种基于深度学习的营配用数据自动聚类分析设备, 包括存储器和处理器, 所述 的存。

15、储器用于存储程序数据, 所述的处理器用于处理器程序数据以实现如权1-权8中任一 项权利要求所述的营配用数据自动聚类分析方法。 0027 本发明的有益效果是: 基于深度学习的营配用数据自动聚类分析设备及方法通过 对营配用数据进行预训练模型进行初始聚类, 然后对初始聚类不断进行优化调整, 直至获 得最佳的聚类效果。 本发明很好地解决了营配贯通后的信息全面与维数灾难之间的矛盾, 具有良好的工程实用价值。 附图说明 0028 图1是本发明的预训练方法的流程图; 0029 图2是本发明的微调方法的流程图。 说明书 2/4 页 5 CN 111898650 A 5 具体实施方式 0030 下面结合附图和实。

16、施例对本发明进一步描述。 0031 实施例1: 0032 一种基于深度学习的营配用数据自动聚类分析设备, 包括存储器和处理器, 所述 的存储器用于存储程序数据, 所述的处理器用于处理器程序数据以实现营配用数据自动聚 类分析方法。 0033 一种基于深度学习的营配用数据自动聚类分析方法, 包括预训练方法和微调方 法, 预训练方法首先将营配用数据输入预训练模块, 然后预训练模块通过对营配用数据进 行预训练构成预训练模型, 微调方法首先读取预训练模型, 然后加载营配用数据通过多次 微调优化预训练模型构成最后自动聚类分析模型。 0034 作为一种优选方案, 所述的预训练方法的预训练模块为受限玻尔兹曼机。

17、, 如图1所 示, 具体方法为: 0035 步骤1, 设置受限玻尔兹曼机各层节点数、 迭代次数以及聚类个数; 0036 步骤2, 加载营配用数据, 对数据进行清洗和归一化处理; 0037 步骤3, 将清洗后的数据作为输入, 对玻尔兹曼机进行训练, 得到各层权值, 并保 存; 0038 步骤4, 利用模糊C均值法对训练学习到的特征进行聚类并保存聚类结果, 构成预 训练模型。 0039 图中RMB级为受限玻尔兹曼机。 0040 所述的微调方法具体为如图2所示, : 0041 步骤5, 读取预训练部分预训练模型的网络参数和初始聚类中心; 0042 步骤6, 加载营配用数据, 对数据进行清洗和归一化处。

18、理; 0043 步骤7, 设置最大微调次数和循环初值; 0044 步骤8, 利用批量梯度下降法对目标函数进行迭代寻优, 直至迭代停止。 0045 图中BP指代BP神经网络。 0046 所述的步骤2中, 对数据进行清洗的具体方法为: 获取营配用数据的误报样本, 然 后对误报样本所对应的营配用数据进行数据清洗。 0047 判断误报样本的方法具体为: 受限玻尔兹曼机的营配用数据设有期望数据, 加载 营配用数据后, 输出得到实际输出数据, 将实际输出数据和期望数据进行对比, 如果存在差 异则判断为误报样本。 0048 实施例2: 一种基于深度学习的营配用数据自动聚类分析设备及方法, 其原理和实 施方法。

19、和实施例1基本相同, 不同之处在于所述的步骤2中, 对数据进行清洗的具体方法为: 获取营配用数据的误报样本, 若误报样本的数量大于预设的阈值, 则对误报样本所对应的 营配用数据进行数据清洗。 由于在预训练过程中很难达到完全不存在误报样本, 因此可以 设置关于误报样本的阈值。 统计存在误报样本的数量, 并判断误报样本的数量是否大于预 设的阈值, 完成对数据进行清洗。 0049 实施例3: 一种基于深度学习的营配用数据自动聚类分析设备及方法, 其原理和实 施方法和实施例1基本相同, 不同之处在于所述的梯度下降法替换模拟退火算法, 具体为设 置初始数据为x(n), 以一定跪在在当前状态x(n)附近产。

20、生新的状态x (n), 计算f(x(n)与f 说明书 3/4 页 6 CN 111898650 A 6 (x (n), 得到 0050 ff(x (n)-f(x(n) 0051 如果f0, 则说明x (n)优于x(n), 就用x (n)作为下一个状态的值, x(n+1)x (n)。 如果f0, 则说明离最优位置变远, 进行概率操作, 计算 0052 0053 再从01之间产生一个随机数 , 如果 p, 则接受x (n)为下一个状态值, 否则拒 绝x (n), 下个状态值保持不变, x(n+1)x(n)。 0054 使用梯度下降进行最优解搜寻时, 多变量的误差曲面很像是连绵起伏的山峰一 样, 变量越多, 山峰和山谷也越多, 这就导致梯度下降法极容易陷入到局部的一个小山谷, 而停止搜索(局部最优)。 这就是常规的梯度下降法在解决多维度的优化问题中最常见的局 部最优问题。 因此局部极小问题可以通过模拟退火算法来解决。 0055 以上所述的实施例只是本发明的一种较佳的方案, 并非对本发明作任何形式上的 限制, 在不超出权利要求所记载的技术方案的前提下还有其它的变体及改型。 说明书 4/4 页 7 CN 111898650 A 7 图1 说明书附图 1/2 页 8 CN 111898650 A 8 图2 说明书附图 2/2 页 9 CN 111898650 A 9 。

展开阅读全文
内容关键字: 基于 深度 学习 营配用 数据 自动 聚类分析 设备 方法
关于本文
本文标题:基于深度学习的营配用数据自动聚类分析设备及方法.pdf
链接地址:https://www.zhuanlichaxun.net/pdf/10090116.html
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1