书签 分享 收藏 举报 版权申诉 / 12

安全水平位移与水位的滑动可变窗口动态数据拟合方法.pdf

  • 上传人:54
  • 文档编号:4557989
  • 上传时间:2018-10-20
  • 格式:PDF
  • 页数:12
  • 大小:714.95KB
  • 摘要
    申请专利号:

    CN201410735262.2

    申请日:

    2014.12.04

    公开号:

    CN104462808A

    公开日:

    2015.03.25

    当前法律状态:

    授权

    有效性:

    有权

    法律详情:

    著录事项变更IPC(主分类):G06F 19/00变更事项:发明人变更前:毛莺池 贾必聪 王久龙 朱沥沥 王龙宝 周晓峰 接青变更后:毛莺池 易魁 陈豪 杨萍 贾必聪 王久龙 王龙宝 曹学兴 周晓峰|||专利权的转移IPC(主分类):G06F 19/00登记生效日:20170927变更事项:专利权人变更前权利人:河海大学变更后权利人:河海大学变更事项:地址变更前权利人:211100 江苏省南京市江宁区佛城西路8号变更后权利人:211100 江苏省南京市江宁区佛城西路8号变更事项:共同专利权人变更后权利人:华能澜沧江水电股份有限公司 华能集团创新技术中心|||授权|||实质审查的生效IPC(主分类):G06F19/00申请日:20141204|||公开

    IPC分类号:

    G06F19/00(2011.01)I

    主分类号:

    G06F19/00

    申请人:

    河海大学

    发明人:

    毛莺池; 贾必聪; 王久龙; 朱沥沥; 王龙宝; 周晓峰; 接青

    地址:

    211100江苏省南京市江宁区佛城西路8号

    优先权:

    专利代理机构:

    南京苏高专利商标事务所(普通合伙)32204

    代理人:

    李玉平

    PDF完整版下载: PDF下载
    内容摘要

    本发明公开了一种基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法。所述方法包括以下步骤:数据导入与预处理,导入水平位移与水位数据,将拟合所需要的数据导入到工作平台上,通过剔除空值和利用箱线图模型处理异常值进行数据预处理;选取最优模型,根据样本均方差选择最优模型,包括选择最优步长和最优函数模型;预测数据,用选择的最优函数模型所需预测当天前一天的值,与真实值进行比较得到误差值,计算出模型的精确程度,用所得到的模型对所需预测当天的水平位移进行预测;结果验证与报表生成,将已有预测值保存,与现有真实数据进行对比,用于评估当前函数模型和数据拟合方法,并对此次拟合方法得到的结果生成报表上报。

    权利要求书

    权利要求书
    1.  一种安全水平位移与水位的滑动可变窗口动态数据拟合方法,其特征在于,包括以下步骤:
    (1)数据导入与预处理,导入水平位移与水位数据,将拟合所需要的数据导入到工作平台上,通过剔除空值和利用箱线图模型处理异常值进行数据预处理;
    (2)选取最优模型,根据样本均方差选择最优模型,包括选择最优步长和最优函数模型;
    (3)预测数据,用选择的最优函数模型预测所需预测当天前一天的值,与真实值进行比较得到误差值,计算出模型的精确程度,用所得到的模型对所需预测当天的水平位移进行预测;
    (4)结果验证与报表生成,将已有预测值保存,与现有真实数据进行对比,用于评估当前函数模型和数据拟合方法,并对此次拟合方法得到的结果生成报表上报。

    2.  根据权利要求1所述的安全水平位移与水位的滑动可变窗口动态数据拟合方法,其特征在于,所述步骤(1)的具体步骤为:
    (1.1)导入水平位移与水位数据,从原始数据库中读取需要处理的数据,主要为坝段测点、时间、水位数据和水平位移数据;
    (1.2)剔除部分本身有误的数据,对读取到的数据进行预处理,包括对空值的处理和对异常值的处理;根据条件“水位数据是否为空”和“水平位移数据是否为空”对水平位移和水位数据中出现空值的情况进行剔除,将剔除的数据保存到数据库异常值表中。利用箱线图原理对数据进行异常值处理,定义所选数据中水平位移数据的上下四分位数分别为Q1和Q3,定义四分点间距为IQR,将Q3+3IQR和Q1-3IQR之外的数据剔除,将剔除的数据保存到数据库异常值表中;
    (1.3)样本选择,针对所选择的候选函数模型,根据拟合方法中步长至少为4才能出现不完全拟合,符合实践需要,将步长(即样本量)下限设定为4,拟合步长上限不做规定,但应不大于数据总条数。

    3.  根据权利要求1所述的安全水平位移与水位的滑动可变窗口动态数据拟合方法,其特征在于,所述内容(2)根据候选模型进行拟合,通过对样本均方差的比较确定最优模型;
    (2.1)从步长下限开始,使用处在所选步长内的数据对候选模型分别进行拟合,得到对应的拟合的方程,用拟合方程计算所需预测日期的前一天的水平位移作为校验,得到校验误差,校验误差作为对模型的校验,可以分析模型本身的合理性以及预测的准确性;
    (2.2)从步长下限开始,计算使用处在所选步长内的数据对候选模型分别进行拟合得到的样本均方差,样本均方误差(RMSE)作为预测模型好坏的评判标准,其计算公式为:其中n为样本的数量,yi为当前的水平位移的估计值,为估计值的平均值,n-1即为计算一元回归分析时样本均方误差的自由度;
    (2.3)将每次将样本量(即步长加1),进行步骤(2.1)和(2.2)操作;如果增加样本量,样本均方误差减小,则将此时的样本均方误差更新为最新的样本均方误差RMSE_New并继续找最优模型,如果连续7次都没有更新两种方法的样本均方误差,根据概率学中在出现局部最优样本均方误差之后更新样本均方误差的概率小于0.003且在一次随机试验的过程中,这种小概率事件发生的概率近乎于0,将此时的RMSE_New及其对应的步长选取为局部最优值。

    4.  根据权利要求1所述的安全水平位移与水位的滑动可变窗口动态数据拟合方法,其特征在于,所述内容(3)的具体过程如下:
    (3.1)将步骤(2.3)中得到的不同数学模型下的局部最优值以样本均方误差值作为模型拟合的衡量指标进行比较,取均方误差最小的拟合模型为最优模型,将其作为当日水平位移数据预测的参考模型;
    (3.2)在得到当日水位数据的情况下,使用已经选择的最优模型预测当日水平位移,根据实现设定的阈值标准,判断该测点当日水平位移是否在正常范围内。

    5.  根据权利要求1所述的安全水平位移与水位的滑动可变窗口动态数据拟合方法,其特征在于,所述内容(4)结果验证与报表生成的具体过程如下:
    (4.1)根据步骤(2)和步骤(3),对所需预测数据当日之前的水平位移进行处理,得到之前所有天数的预测值,将得到的预测值与已有的实际值进行统计分析,以评估当前拟合模型;
    (4.2)记录拟合结果,生成报表;报表内容包括预测结果、不同拟合模型预测结果对比和异常值。

    说明书

    说明书安全水平位移与水位的滑动可变窗口动态数据拟合方法
    技术领域
    本发明涉及一种数据拟合方法,具体涉及一种基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法,属于水库大坝安全监测技术领域。
    背景技术
    大坝安全监测对于水库能否正常运行至关重要,水库大坝安全监测要做到定时定点、规律系统,以观测数据的分析结果为主要依据,为水库安全运行提供服务。大坝的安全监测主要包括对大坝坝体的固定测点按照一定频率连续地进行仪器测量、对采集来的数据进行资料整编和分析,通过计算和查证原始观测数据来实现监测资料的连续性与准确性。大坝安全监测的目的是为了更好地节约水库建设维护的投资、尽可能大地发挥水库效益。大坝安全监测不只是为了保证被监测大坝的安全运营,还要对其他大坝包括待建坝安全运营、建设施工提供准确的实验依据和安全鉴定的数据指导。
    由此可见,每座水库的安全运营都离不开大坝安全监测工作,只有通过连续稳定的监测和分析才能及时发现各种问题,保证国家和人民的生命财产安全。大坝安全监测是对水利建筑工程安全的一种管理,主要包括了信息的采集、处理,结论的得出,措施的制定以及信息的反馈,而其最根本目的就是为了工程效益。
    对于大坝安全监测,安全阈值作为一项重要的参考数据对于监测分析具有重要意义。而需要求得精确的安全阈值,则需要精确的估计值,这就需要先进的数据拟合方法进行拟合计算。
    因此,如何计算出精确的估计值,选取最优的模型进行计算,为计算安全阈值数据支持,是数据拟合方法必须解决大问题,也是本发明所要解决的问题。
    发明内容
    发明目的:本发明是基于对大坝安全阈值的分析中得出的。为了计算出大坝的安全阈值需要对某一点的值进行估计,因而需要对大量数据进行拟合,从而得到一个精确的估计值,最终得到了一种基于滑动窗口动态的数据拟合方法。与以往的拟合方法不同,是基于滑动窗口的,可以动态的选取样本容量;同时,又可以动态的选取函数模型,根据样本的均方差值选取最优模型。最终获取到最优的 模型,获得精确的估计值。
    技术方案:一种基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法,包括以下四个方面:
    (1)数据导入与预处理,导入水平位移与水位数据,将拟合所需要的数据导入到工作平台上,通过剔除空值和利用箱线图模型处理异常值进行数据预处理;
    (2)选取最优模型,根据样本均方差选择最优模型,包括选择最优步长和最优函数模型;
    (3)预测数据,用选择的最优函数模型预测所需预测当天前一天的值,与真实值进行比较得到误差值,计算出模型的精确程度,用选择的最优函数模型对所需预测当天的水平位移进行预测;
    (4)结果验证与报表生成,将已有预测值保存,与现有真实数据进行对比,用于评估当前函数模型和数据拟合方法,并对此次拟合方法得到的结果生成报表上报。
    所述内容(1)数据导入与预处理,导入水平位移与水位数据,将拟合所需要的数据导入到工作平台上,通过剔除空值和利用箱线图模型处理异常值进行数据预处理,具体为:
    (1.1)导入水平位移与水位数据,从原始数据库中读取需要处理的数据,主要为坝段测点、时间、水位数据和水平位移数据。
    (1.2)剔除部分本身有误的数据,对读取到的数据进行预处理,包括对空值的处理和对异常值的处理。根据条件“水位数据是否为空”和“水平位移数据是否为空”对水平位移数据和水位数据中出现空值的情况进行剔除,将剔除的数据保存到数据库异常值表中。利用箱线图原理对数据进行异常值处理,定义所选数据中水平位移数据的上下四分位数分别为Q1和Q3,定义四分点间距为IQR,将Q3+3IQR和Q1-3IQR之外的数据剔除,将剔除的数据保存到数据库异常值表中。
    所述内容(2)选取最优模型,根据样本均方差选择最优模型,包括选择最优步长和最优函数模型,具体为:
    (2.1)从步长下限开始,使用处在所选步长内的数据对候选模型分别进行拟合,得到对应的拟合的方程,用拟合方程计算所需预测日期的前一天的水平位 移作为校验,得到校验误差,校验误差作为对模型的校验,可以分析模型本身的合理性以及预测的准确性;
    (2.2)从步长下限开始,计算使用处在所选步长内的数据对候选模型分别进行拟合得到的样本均方差,样本均方误差(RMSE)作为预测模型好坏的评判标准,其计算公式为:其中n为样本的数量,yi为当前的水平位移的估计值,为估计值的平均值,n-1即为计算一元回归分析时样本均方误差的自由度;
    (2.3)然后每次将样本量(即步长加1),进行上述操作。如果增加样本量,样本均方误差减小,则将此时的样本均方误差更新为最新的样本均方误差RMSE_New并继续找最优模型,如果连续7次都没有更新两种方法的样本均方误差,根据概率学中在出现局部最优样本均方误差之后更新样本均方误差的概率小于0.003且在一次随机试验的过程中,这种小概率事件发生的概率近乎于0,将此时的RMSE_New及其对应的步长选取为局部最优值。
    所述内容(3)预测数据,用选择的最优函数模型所需预测当天前一天的值,与真实值进行比较得到误差值,计算出模型的精确程度,用所得到的模型对所需预测当天的水平位移进行预测;具体为:
    (3.1)将步骤(2.3)中得到的不同数学模型下的局部最优值以样本均方误差值作为模型拟合的衡量指标进行比较,取均方误差最小的拟合模型为最优模型,将其作为当日水平位移数据预测的参考模型。
    (3.2)在得到当日水位数据的情况下,使用已经选择的最优模型预测当日水平位移,根据实现设定的阈值标准,判断该测点当日水平位移是否在正常范围内。
    本发明采用上述技术方案,具有以下有益效果:
    1.滑动窗口具有可变性,可以根据选择的不同的点动态的选取样本容量;
    2.可以动态的选取函数模型,不同的点根据其数据特征选取更贴合自身的函数模型,获得模型更加精确;
    3.可以根据需求,动态加入新的函数模型进行计算。
    附图说明
    图1为基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法流程图;
    图2为基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的样本均方误差的点图;
    图3为基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的样本均方误差的直方图;
    图4为基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的最优模型步长的数据分布图形;
    图5为基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的校验误差图。
    具体实施方式
    下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
    图1是基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的流程图。可以看出,基于滑动可变窗口动态的数据拟合方法的具体流程如下:
    (1)数据导入与预处理,导入水平位移与水位数据,将拟合所需要的数据导入到工作平台上,通过剔除空值和利用箱线图模型处理异常值进行数据预处理:
    (1.1)导入水平位移与水位数据,从原始数据库中读取需要处理的数据,主要为坝段测点、时间、水位数据和水平位移数据;
    (1.2)剔除部分本身有误的数据,对读取到的数据进行预处理,包括对空值的处理和对异常值的处理。根据条件“水位数据是否为空”和“水平位移数据是否为空”对水平位移和水位数据中出现空值的情况进行剔除,将剔除的数据保存到数据库异常值表中。利用箱线图原理对数据进行异常值处理,定义所选数据中水平位移数据的上下四分位数分别为Q1和Q3,定义四分点间距为IQR,将Q3+3IQR和Q1-3IQR之外的数据剔除,将剔除的数据保存到数据库异常值表中。如一组水平位移数据(0.1,0.2,0.2,0.2,0.2,0.2,0.2,0.3),其上四分位数Q1=0.2,其下四分位数Q3=0.2,其四分点间距IQR=0,将Q3+3IQR和 Q1-3IQR之外的数据剔除,即将数据中值小于Q1-3IQR或者大于Q3+3IQR的剔除,在本例中Q1-3IQR=0.2,Q3+3IQR=0.2,则应去掉并存入异常值数据库中的水平位移数据为0.1和0.3。就实际情况来看,0.1和0.3确实为异常数据。
    (1.3)样本选择,针对所选择的候选函数模型,根据拟合方法中步长至少为4才能出现不完全拟合,符合实践需要,将步长(即样本量)下限设定为4,拟合步长上限不做规定,但应不大于数据总条数。
    (2)选取不同预测模型对应的局部最优模型,根据样本均方差选择局部最优步长和局部最优模型;
    (2.1)从步长下限开始,使用处在所选步长内的数据对候选模型分别进行拟合,得到对应的拟合的方程,用拟合方程计算所需预测日期的前一天的水平位移作为校验,得到校验误差,校验误差作为对模型的校验,可以分析模型本身的合理性以及预测的准确性。以Y代表水平位移,X代表水位,拟合过程描述如下。以步长为4为例,所取样本数据为(x1,y1),(x2,y2),(x3,y3),(x4,y4),候选模型为二次多项式Y=aX2+bX+c和指数函数Y=a^X+b。数学中,三个不相同的点可以确定二次多项式和指数函数的系数,此时两个函数模型均通过选取的三点,为完全拟合的理想情况,考虑到对于四点不相同的实际工程中的点,出现完全拟合的理想情况的概率极小,因此步长最低应选为4,数学中在数据已知的情况下,可以求出对应二次多项式和指数函数的系数,从而确定二次多项式和指数函数模型。记为Y=a1X2+b1X+c1和Y=a1^X+b1,则可以将所需预测日期的前一天的水位代入得到的拟合函数模型,得到预测到的所需预测日期的前一天的水平位移,该值与所需预测日期的前一天的水平位移真实值的插值为校验误差,作为对模型的校验,可以分析模型本身的合理性以及预测的准确性。
    (2.2)从步长下限开始,使用处在所选步长内的数据对候选模型分别进行拟合得到的样本均方差,样本均方误差(RMSE)作为预测模型好坏的评判标准,其计算公式为:其中n为样本的数量,yi为当前的水平位移的估计值,为估计值的平均值,n-1即为计算一元回归分析时样本均方误差的自由度;
    (2.3)确定局部最优步长和局部最优函数模型。每次将样本量(即步长加1),进行步骤(2.1)和(2.2)操作。如果增加样本量,样本均方误差减小,则将此 时的样本均方误差更新为最新的样本均方误差RMSE_New并继续找最优模型,如果连续7次都没有更新两种方法的样本均方误差,而在这之后更新样本均方误差的概率小于0.003,由于在一次随机试验的过程中,这种小概率事件发生的概率近乎于0,所以有理由找到局部最优值,将此时的RMSE_New选取为局部最优均方误差,其对应的步长选取为局部最优步长,此时确定的函数模型为预测该点时该方法的局部最优函数模型。
    (3)确定最终动态最优模型并预测数据,从步骤(2.3)中选择的不同预测模型所对应的局部最优函数模型(每种预测模型均存在一个局部最优函数模型)中选择最终动态最优模型,预测所需预测当天前一天的值,与真实值进行比较得到误差值,计算出模型的精确程度,用所得到的模型对所需预测当天的水平位移进行预测;
    (3.1)比较拟合结果,确定最终的动态最优模型,仍以样本均方误差值作为模型拟合的衡量指标,比较上述两种模型中的样本均方误差的大小来确定最终的动态最优模型;
    (3.2)在得到当日水位数据的情况下,使用已经选择的最优模型预测当日水平位移,根据实现设定的阈值标准,判断该测点当日水平位移是否在正常范围内。
    (4)结果验证与报表生成,将已有预测值保存,与现有真实数据进行对比,用于评估当前函数模型和数据拟合方法,并对此次拟合方法得到的结果生成报表上报;
    (4.1)根据步骤(2)和步骤(3),对所需预测数据当日之前的水平位移进行处理,得到之前所有天数的预测值,将得到的预测值与已有的实际值进行统计分析,以供大坝工程安全人员分析当前拟合模型;
    (4.2)记录拟合结果,生成报表。报表内容包括预测结果、不同拟合模型预测结果对比和异常值,上报到大坝安全管理部门,供安全决策参考。
    图2、图3和表1皆为选取某一个具体测点的数据运用本发明的方法所得到的结果,分别是得到样本均方差的点图、直方图和累积分布表。图2和图3直观显示:0.2、0.4、0.6可以作为该测点下的三个阈值标准。表1显示,样本均方误差小于0.4mm的所占比例达到95%。如果选择0.4mm作为所选拟合模型准确性的衡量指标,那么在某一次的拟合模型的均方误差大于0.4。则表明所确定的动 态最优模型在95%的准确率的情况下是不可信的,这时应该予以监控。
    表1基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的样本均方误差累计分布表

    图4和表2同样是选取某一个具体测点的数据运用本发明的方法所得到的结果,分别是得到最优模型步长的数据的分布图形和累积分布表。如图4,样本量在15以内所占的比例达到95.78%(如表2),拟合的结果比较理想。这也就说明了步长上限为115的合理性(或许上限远小于115,但是动态最优拟合模型并不需要这个最小上限值)。如果样本每次增加1来求解局部最优看成是一次伯努利实验,且认为它是相互独立的(因为每次都有可能达到最优),并且认为它在每次实验中达到最优或者达不到最优的概率均为1/2,那么经过连续的7次实验都不能改善样本均方误差,那么7次以后再次改善样本均方误差值的概率小于0.00391(即2^(-8))为小概率事件,而小概率事件在一次随机试验中发生的概率近乎于0。因此有理由认为所得到的结果是局部最优的。
    表2基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的样本步长累计分布表

    图5和表3同样是选取某一个具体测点的数据运用本发明的方法所得到的结果,分别是得到校验误差图和校验误差的累积分布表。为进一步探讨动态最优模型的预测能力,选取所选择样本紧邻的下一次测点数据进行检验,得到校验误差 图(如图5)和其统计表(表3),大约91.7%的值落在±0.4mm误差范围内。
    表3基于大坝工程安全水平位移与水位的滑动可变窗口动态数据拟合方法的校验误差累积分布表

    关 键  词:
    安全 水平 位移 水位 滑动 可变 窗口 动态 数据 拟合 方法
      专利查询网所有文档均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:安全水平位移与水位的滑动可变窗口动态数据拟合方法.pdf
    链接地址:https://www.zhuanlichaxun.net/p-4557989.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
    经营许可证编号:粤ICP备2021068784号-1