基于多算法模型融合的故障接报量预测方法.pdf
《基于多算法模型融合的故障接报量预测方法.pdf》由会员分享,可在线阅读,更多相关《基于多算法模型融合的故障接报量预测方法.pdf(8页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201911233976.2 (22)申请日 2019.12.05 (71)申请人 国网浙江省电力有限公司杭州供电 公司 地址 310000 浙江省杭州市上城区建国中 路219号 (72)发明人 徐晓华王一达马列徐汉麟 杜立宇钱锦徐李冰翟遂初 张敏雷云 (74)专利代理机构 杭州华鼎知识产权代理事务 所(普通合伙) 33217 代理人 项军 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) 。
2、(54)发明名称 基于多算法模型融合的故障接报量预测方 法 (57)摘要 本申请实施例提出了基于多算法模型融合 的故障接报量预测方法, 包括获取故障接报量数 据, 对接报量数据进行基于特征提取后输入至组 合模型中; 对组合模型中的各个模型进行训练, 基于训练结果调整对应每个模型输出结果的权 重值; 基于调整后的权重值得到组合模型输出的 接报量预测值。 通过采取包括基于深度学习技术 的循环神经网络LSTM、 基于梯度提升树的 XGBoost算法和LightGBM算法以及传统的时间序 列算法SARIMA算法在内的多模型融合的算法设 计, 并且采取加权的方式得到最终预测结果, 能 够提成预测的准确性。
3、。 权利要求书1页 说明书5页 附图1页 CN 111178585 A 2020.05.19 CN 111178585 A 1.基于多算法模型融合的故障接报量预测方法, 其特征在于, 所述故障接报量预测方 法包括: 获取故障接报量数据, 对接报量数据进行基于特征提取后输入至组合模型中; 对组合模型中的各个模型进行训练, 基于训练结果调整对应每个模型输出结果的权重 值; 基于调整后的权重值得到组合模型输出的接报量预测值。 2.根据权利要求1所述的基于多算法模型融合的故障接报量预测方法, 其特征在于, 所 述获取故障接报量数据, 对接报量数据进行基于特征提取后输入至组合模型中, 包括: 确定输入特。
4、征; 基于已确定的输入特征对故障接报量数据进行特征提取。 3.根据权利要求2所述的基于多算法模型融合的故障接报量预测方法, 其特征在于, 所 述确定输入特征包括: 对初始特征进行处理, 获取组合特征; 计算跨天的长时特征, 将已知特征进行组合得到最终的输入特征。 4.根据权利要求1所述的基于多算法模型融合的故障接报量预测方法, 其特征在于, 所 述对组合模型中的各个模型进行训练, 基于训练结果调整对应每个模型输出结果的权重 值, 包括: 利用季节性ARIMA模型SARIMA作为时间序列预测模型; 通过参数搜索的方法得到LightGBM的主要参数; 通过参数搜索方法的得到的XGBoost的主要参。
5、数; 通过参数搜索方法的得到的LSTM的主要参数; 分别训练完三种算法后, 需要将三种算法输出结果根据权重进行融合。 5.根据权利要求1所述的基于多算法模型融合的故障接报量预测方法, 其特征在于, 所 述故障接报量预测方法, 还包括: 构建平均绝对误差MAE作为组合模型的性能评价指标, 其中yi表示第i个组合模型输出的实际值, fi表示对应第i个实际值的预测值, n、 i的取 值范围为正整数。 权利要求书 1/1 页 2 CN 111178585 A 2 基于多算法模型融合的故障接报量预测方法 技术领域 0001 本发明属于数据预测领域, 尤其涉及基于多算法模型融合的故障接报量预测方 法。 背。
6、景技术 0002 由于抢修时长更容易受到各种人为和客观因素的影响, 相比于故障接报量, 抢修 时长更难预测。 影响故障抢修时长的因素众多, 包括环境因素(温度等天气状况)、 抢修人因 素(抢修队、 抢修人等)、 发生时间、 故障所在位置、 故障类型等。 为了对抢修时长进行更加精 确的预测, 有必要对影响故障抢修时长的因素进行分析。 发明内容 0003 为了解决现有技术中存在的缺点和不足, 本发明提出了基于多算法模型融合的故 障接报量预测方法, 通过构建多个模型组成的组合模型进行接报量预测, 能够得到更为精 准的预测结果, 以便于根据预测结果进行事先准备, 降低出错概率。 0004 具体的, 本。
7、申请实施例提出的基于多算法模型融合的故障接报量预测方法, 包括: 0005 获取故障接报量数据, 对接报量数据进行基于特征提取后输入至组合模型中; 0006 对组合模型中的各个模型进行训练, 基于训练结果调整对应每个模型输出结果的 权重值; 0007 基于调整后的权重值得到组合模型输出的接报量预测值。 0008 可选的, 所述获取故障接报量数据, 对接报量数据进行基于特征提取后输入至组 合模型中, 包括: 0009 确定输入特征; 0010 基于已确定的输入特征对故障接报量数据进行特征提取。 0011 可选的, 所述确定输入特征包括: 0012 对初始特征进行处理, 获取组合特征; 0013 。
8、计算跨天的长时特征, 0014 将已知特征进行组合得到最终的输入特征。 0015 可选的, 所述对组合模型中的各个模型进行训练, 基于训练结果调整对应每个模 型输出结果的权重值, 包括: 0016 利用季节性ARIMA模型SARIMA作为时间序列预测模型; 0017 通过参数搜索的方法得到LightGBM的主要参数; 0018 通过参数搜索方法的得到的XGBoost的主要参数; 0019 通过参数搜索方法的得到的LSTM的主要参数; 0020 分别训练完三种算法后, 需要将三种算法输出结果根据权重进行融合。 0021 可选的, 所述故障接报量预测方法, 还包括: 0022 构建平均绝对误差MA。
9、E作为组合模型的性能评价指标, 说明书 1/5 页 3 CN 111178585 A 3 0023 0024 其中yi表示第i个组合模型输出的实际值, fi表示对应第i个实际值的预测值, n、 i 的取值范围为正整数。 0025 本发明提供的技术方案带来的有益效果是: 0026 通过采取包括基于深度学习技术的循环神经网络LSTM、 基于梯度提升树的 XGBoost算法和LightGBM算法以及传统的时间序列算法SARIMA算法在内的多模型融合的算 法设计, 并且采取加权的方式得到最终预测结果, 能够提成预测的准确性。 附图说明 0027 为了更清楚地说明本发明的技术方案, 下面将对实施例描述中。
10、所需要使用的附图 作简单地介绍, 显而易见地, 下面描述中的附图仅仅是本发明的一些实施例, 对于本领域普 通技术人员来讲, 在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。 0028 图1为本申请实施例提出的基于多算法模型融合的故障接报量预测方法的流程示 意图。 具体实施方式 0029 为使本发明的结构和优点更加清楚, 下面将结合附图对本发明的结构作进一步地 描述。 0030 实施例一 0031 本申请实施例提出的基于多算法模型融合的故障接报量预测方法, 如图1所示, 包 括: 0032 11、 获取故障接报量数据, 对接报量数据进行基于特征提取后输入至组合模型中; 0033 。
11、12、 对组合模型中的各个模型进行训练, 基于训练结果调整对应每个模型输出结 果的权重值; 0034 13、 基于调整后的权重值得到组合模型输出的接报量预测值。 0035 在实施中, 故障接报量是以天为单位、 随着时间变化的时间序列, 因此故障接报量 的预测也属于时间序列的预测问题。 故障抢修时长的预测则是典型的回归预测问题。 时间 序列的预测大致可以分为两种方法, 一种是传统的时间序列分析方法, 一种是将其转化成 有监督机器学习问题; 对于后者, 可以从有监督学习的角度出发, 建立机器学习模型来进行 预测。 而实际情况是, 往往影响时间序列数据变化的因素是不确定或者不完备的, 现实中也 不能。
12、找出所有的影响因素, 这使得建立的模型不够精确。 更一般的情况是, 只能得到预测变 量本身, 这种情况下不能再将其转化为有监督的机器学习问题, 此时需要使用传统时间序 列分析模型进行处理。 本项目采取传统的时间序列分析方法和有监督机器学习结合的方 法, 使用多种模型进行建模。 0036 基于对故障接报量的业务理解和数据探索, 采用字符编码、 独热向量、 归一化等方 法进行数据清洗, 对数据进行一致性校验以提升数据质量, 通过对主要天气数据、 节假日等 因素进行分析, 采用组合、 差分等方式提取了包含初始特征、 组合特征和差分特征等共26种 说明书 2/5 页 4 CN 111178585 A 。
13、4 特征指标。 由于预测任务比较复杂, 为了取得较好的预测效果, 本项目采取了多模型融合的 算法设计。 这里使用的模型有基于深度学习技术的循环神经网络LSTM、 基于梯度提升树的 XGBoost算法和LightGBM算法以及传统的时间序列算法SARIMA算法, 最终的预测结果采取 加权的方式得到。 0037 可选的, 所述获取故障接报量数据, 对接报量数据进行基于特征提取后输入至组 合模型中, 包括: 0038 确定输入特征; 0039 基于已确定的输入特征对故障接报量数据进行特征提取。 0040 上一部分分析的影响接报量的天气因素包括: 白天温度、 夜间温度、 白天降水量、 夜间降水量、 白。
14、天风力、 夜间风力、 白天天气状况、 夜间天气状况等, 此外还包括是否为节假 日等因素, 具体的特征列表如表1所示。 0041 初始特征组合特征差分特征 故障接报量平均温度故障接报量-差分 白天温度温差白天温度-差分 夜间温度全天降水量夜间温度-差分 白天降水量平均风力白天降水量-差分 夜间降水量-夜间降水量-差分 白天风力-白天风力-差分 夜间风力-夜间风力-差分 白天天气状况-故障接报量-差分 夜间天气状况-平均温度-差分 节假日-温差-差分 -全天降水量-差分 -平均风力-差分 0042 表1数据主要来源 0043 特征提取的第一步需要对初始特征进行处理, 获取组合特征。 例如可以根据白。
15、天 温度和夜间温度求出平均温度和温差, 根据白天降水量和夜间降水量求出全天降水量等。 第二步计算跨天的长时特征, 例如前两天特征的差分特征, 最后将三种特征进行组合得到 最终的输入特征。 0044 预测接报量以天为单位, 可以使用多天的历史数据来预测未来一天数据, 除了当 天的特征可用, 还可以输入多天的历史数据。 本项目使用前三天的数据进行建模, 最终特征 需要分别对三天的数据进行处理, 再将三天的数据拼接在一起作为最终输入特征, 0045 可选的, 所述对组合模型中的各个模型进行训练, 基于训练结果调整对应每个模 型输出结果的权重值, 包括: 0046 利用季节性ARIMA模型SARIMA。
16、作为时间序列预测模型; 0047 通过参数搜索的方法得到LightGBM的主要参数; 0048 通过参数搜索方法的得到的XGBoost的主要参数; 0049 通过参数搜索方法的得到的LSTM的主要参数; 0050 分别训练完三种算法后, 需要将三种算法输出结果根据权重进行融合。 说明书 3/5 页 5 CN 111178585 A 5 0051 由于模型涉及三种算法的融合问题, 训练模型是需要分别对三种算法进行调优。 下面分别给出三种算法的调优参数。 0052 SARIMA: 0053 由于故障接报量的预测存在季节性的影响因素, 利用季节性ARIMA模型SARIMA作 为时间序列预测模型, 表。
17、示为SARIMA(p,d,q)(P,D,Q)s。 这里, (p,d,q)是上述非季节性参 数, 而(P,D,Q)遵循相同的定义, 但适用于时间序列的季节分量。 s是时间序列的周期(季度 为4、 年度为12等)。 这里使用网格搜索技术, 对超参数进行遍历调优工作。 最终得到(p,d,q) (1,1,1),(P,D,Q,s)(0,1,1,4)。 0054 LightGBM: 0055 通过参数搜索的方法得到LightGBM的主要参数表如下: 0056 模型参数备注取值 boosting_typebooster类型gbdt objective目标函数regression metric评价指标mae 。
18、num_leaves最大叶子数32 learning_rate学习率0.01 feature_fraction随机选择特征比例0.9 bagging_freqbagging频率3 verbose日志输出-2 0057 表2 LightGBM参数设置表 0058 XGBoost: 0059 通过参数搜索方法的得到的XGBoost的主要参数如表2所示: 0060 0061 0062 表2 XGBoost参数设置表 说明书 4/5 页 6 CN 111178585 A 6 0063 LSTM: 0064 通过参数搜索方法的得到的LSTM的主要参数如表3所示: 0065 网络层超参设置输出尺寸 Inp。
19、ut- Bidirection LSTMunits64(,64) Dropout0.5(,64) Dense1(,1) 0066 表3数据主要来源 0067 分别训练完三种算法后, 需要将三种算法输出结果根据权重进行融合。 这里根据 多次实验结果, 经过分析给出LightGBM、 SARIMA、 XGBoost和LSTM的权重分别为: 0.65、 0.1、 0.1、 0.15。 0068 可选的, 所述故障接报量预测方法, 还包括: 0069 构建平均绝对误差MAE作为组合模型的性能评价指标, 0070 0071 其中yi表示第i个组合模型输出的实际值, fi表示对应第i个实际值的预测值, n。
20、、 i 的取值范围为正整数。 0072 算法模型建立后需要进行评估, 以判断模型的优劣。 一般使用训练集建立模型, 使 用测试集来评估模型。 对于回归预测任务, 常用的性能评价指标有平均绝对误差MAE(Mean Absolute Error)、 均方误差RMSE(Root Mean Square Error)、 MAPE(Mean Absolute Percentage Error)、 R平方等。 本项目数据较为复杂, 存在各种异常数据, 因此不选择使用 对异常数据更加敏感的RMSE、 MSE, 而使用平均绝对误差MAE作为主要的性能评价指标。 0073 表4给出了三种算法的性能对比。 从表中。
21、可以看出, 单个算法中XGBoost的效果最 佳; 进行多模型的融合后加权结果会平均结果好。 由于时长的预测以15分钟为单位, 预测结 果的MAE为1.15, 对应的抢修时长误差大概为17.25分钟。 0074 算法类型平均绝对误差MAE LightGBM1.52 Xgboost1.21 LSTM1.43 平均结果1.28 加权结果1.15 0075 表4算法性能对比 0076 上述实施例中的各个序号仅仅为了描述, 不代表各部件的组装或使用过程中的先 后顺序。 0077 以上所述仅为本发明的实施例, 并不用以限制本发明, 凡在本发明的精神和原则 之内, 所作的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。 说明书 5/5 页 7 CN 111178585 A 7 图1 说明书附图 1/1 页 8 CN 111178585 A 8 。
- 内容关键字: 基于 算法 模型 融合 故障 接报量 预测 方法
立体均温板.pdf
旋塞阀卡套压装机.pdf
干式变压器的风机底座.pdf
汽车电致光变色器件.pdf
电力巡检机器人.pdf
熔体和包含该熔体的熔断器.pdf
迷宫高压差流量调节角阀.pdf
麦克风.pdf
避雷器试验设备.pdf
具有喷射功能的薄膜冷却水槽.pdf
肠镜活检器.pdf
旋转式玩具泡泡机.pdf
用于市输水管道的采集终端装置.pdf
可燃和有毒气体检测装置.pdf
混砂前降阻剂筛分装置.pdf
具有防护功能的分支电缆.pdf
仓储机器人视觉识别的设备智能调度方法.pdf
可移动发电机组配电柜.pdf
带有辅助张嘴结构的儿童雾化器.pdf
污泥处理装置.pdf
垃圾桶抓举收集装置、控制方法及车辆.pdf
微流控芯片及核酸扩增分析仪.pdf
雷达产品检测方法、装置、设备及介质.pdf
压缩空气管路的智能监测方法及系统.pdf
基于SSPP结构的SIW带通滤波器.pdf
遥感模糊图像复原方法及系统.pdf
果树施肥量计算方法及系统.pdf
胃黏膜上皮细胞提取液及其制备方法与应用.pdf
面向多样性的代码审查者推荐方法及存储介质、设备.pdf
基于大数据的人工智能节能管理方法及系统.pdf
矿井用智能应急电源系统.pdf
基于脑电信号的个性化人机交互方法、装置、设备及介质.pdf
基于ZIGBEE的电力高压设备无线测温终端.pdf
相控阵天线T/R组件的内定标方法.pdf
磁石保健酒及其制备方法.pdf
具有充电线清洁机构的图像形成装置.pdf
一种多孔氧化锌电致发光材料.pdf
一种暖手鼠标.pdf
使用共享存储来迁移虚拟机的技术.pdf
一种风扇噪音的抑制方法和装置.pdf
图像处理装置及图像处理方法.pdf
彩色图像形成装置.pdf
GPS和GLONASS多信道并行信号追踪方法及追踪模块.pdf
卷绕物张力在线软检测电路.pdf
感测放大器和包括感测放大器的半导体装置.pdf
图像处理装置和图像处理方法.pdf
用于控制层叠芯片的刷新操作的半导体系统、器件和方法.pdf
边缘电场型液晶显示器阵列基板及其制作方法.pdf
审批系统、审批用终端、服务器、审批方法、信息管理方法.pdf
银杏叶保健枕.pdf
作为减少甜味制品牙齿生物膜粘附的剂的食品添加剂组合物.pdf