一种堤坝边坡变形监测数据分析新方法技术领域
本发明涉及一种堤坝边坡变形监测数据分析新方法,属于水利工程边坡变形监测技术领
域。
背景技术
我国全国现有水库98002座,大型756座(其中大(1)127座、大(2)型629座)、
中型3938座、小型93308座;过闸流量大于5m3/s的水闸97019座,其中大型860座,中
型6332座,小型89827座;堤防约413679km。上述水利、水电、水运和交通工程中,许多
都包括或含有土坡工程。边坡失稳破坏是土坝破坏的主要形式,也是类似工程安全的重要影
响因素,严重影响工程和相关人员和设施安全。1954~2013年,全国共有3500余座水库溃
坝失事,其中绝大多数是土石坝。“63.8”海河流域特大洪水导致河北省5座中型、17座小(1)
型、297座小(2)型总计319座水库溃坝;“75.8”特大洪水导致河南驻马店地区板桥、石漫
滩等62座水库大坝溃决,22564人死亡,1029.5万人受灾。设立监测设施进行边坡变形监
测是有效及时了解边坡稳定程度的有效措施,这种有效程度与数据分析方法密切相关。目前
常见的数据分析方法为逐步回归模型,这种模型对样本分布、因变量之间的独立性以及因变
量大小都有严格要求,可是实际上的边坡监测数据都难以满足上述要求。
发明内容
本发明的目的在于提供一种堤坝边坡变形监测数据分析方法,采用基于特征正交分解的
分位数回归分析方法,得到原始数据的分位数回归方程,并分析不同自变量对堤坝边坡位移
的影响程度。
为达到上述目的,本发明采用的技术方案如下:
一种堤坝边坡变形监测数据分析新方法,包括以下步骤:
1)对堤坝边坡位移及影响堤坝边坡位移的关键影响因素进行监测,影响堤坝边坡位移
的关键影响因素即为自变量,堤坝边坡位移即为因变量,选取相应监测数据,对自变量监测
数据矩阵在标准化的基础上进行特征正交分解,获得特征正交基与自变量的关系,利用特征
正交基与因变量进行回归分析,再获得因变量与特征正交基的关系,最后通过转化得到自变
量与因变量的回归方程;
2)对所述步骤1)得到的特征正交基与堤坝边坡位移进行分位数回归,得到各分位数
的回归方程参数,进而得到各分位数下堤坝边坡位移与特征正交基的回归方程,再代入原始
数据,得到原始数据的分位数回归方程;
3)分析不同分位数下各个自变量的回归方程参数估计值是否通过显著性检验,判断不
同自变量对因变量的影响程度;分析不同分位数下各个自变量的回归方程参数估计值的变化
情况,判断空间上不同测点测值对堤坝边坡位移的影响程度。
前述的步骤1)具体包括以下步骤:
1-1)选取监测数据:对于n个观测样本,每个观测样本有p个观测变量q1,q2…qp,
即p个自变量,定义qij,i=1,2,...,n,j=1,2,...,p,表示第i个观测样本的第j个观测变
量,则第k个观测样本表示为:qk1,qk2...qkp;
1-2)构造快照矩阵:将观测样本数据进行标准化处理,得到标准化后的快照矩阵X:
其中,xij表示标准化处理后第i个观测样本的第j个观测变量, X j = X 1 j X 2 j . . . X nj , ]]>
j=1,2,……,p,为一个列向量,表示第j个观测变量不同样本的观测值;
1-3)根据标准化处理以后的快照矩阵,构造关联矩阵R:
R=(1/n)XTX(3);
1-4)利用Matlab软件求出关联矩阵R的特征值以及对应的特征向量,然后将特征值进
行降序排列,并将对应的特征向量进行相应的排序;
1-5)运用一个通用的能量模态F(k)进行截断,设定一个标准ε,通过满足:
F ( k ) = Σ k = 1 l λ k Σ j = 1 p λ j ≥ ϵ - - - ( 4 ) ]]>
确定特征正交分解降阶模型中模态的数目l;
1-6)选取特征向量构成矩阵V:V=[V1,V2,...Vl],
其中,Vi表示降序排列后第i个特征值对应的特征向量;
采用特征向量将快照矩阵进行线性化叠加,得到:Ψ=XV;
即可提取出特征正交分解的特征正交基:Ψ={Ψ1,...Ψl};
1-7)得到因变量与特征正交基之间的回归方程:
y=b0+b1Ψ1+b2Ψ2+...+blΨl(5)
其中,参数B=[b0,b1,...bl],通过最小二乘法估计得到,y表示因变量;
1-8)自变量与特征正交基之前的线性变换为:
Ψ 1 = V 1 ′ X ′ = v 11 X 1 + v 21 X 2 + ... + v p 1 X p Ψ 2 = V 2 ′ X ′ = v 12 X 1 + v 22 X 2 + ... + v p 2 X p ....................... Ψ l = V l ′ X ′ = v 1 l X 1 + v 2 l X 2 + ... + v p l X p - - - ( 6 ) ]]>
其中,Vi'表示降序排列后第i个特征值所对应的特征向量的转置向量,vij表示特征向
量Vi的第j个元素,X'表示标准化的快照矩阵X的转置矩阵;
对特征正交分解回归的参数值进行变换后求出自变量的解释变量c0,c1,…cp,然后求
出因变量相对于自变量之间的回归方程:
y=c0+c1X1+c2X2+...+clXp(7)。
前述的影响堤坝边坡位移的因素包括水位、温度和时效。
前述的步骤1-5)中,标准ε选为0.9。
前述的步骤2)选取的各分位点为0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9。
前述的步骤3)中,对于某自变量,在各分位数下,回归方程参数估计值通过显著性检
验的越多,说明该自变量对堤坝边坡位移影响程度越显著。
前述的步骤3)中,对于某自变量,回归方程参数估计值的绝对值越大的分位数区间,
该自变量对该分位数区间所对应的堤坝边坡位移的分布位置影响程度越大。
本发明的优点为:
(1)能有效克服变量之间的相关性和多重共线性,提高回归分析模型的精度;
(2)适合小样本的数据处理,因此对于施工期或汛期等危险工况十分有用;
(3)具有良好的抗差能力,能减少误差数据对模型的影响;
(4)通过选取不同的分位点,可以有效发现模型各影响因素重要程度;
(5)适应工程实际监测数据含有误差、具有一定相关性等实际情况。
附图说明
图1为本发明的实例中关联矩阵的特征值及能量随POD模态数目的变化情况;
图1(a)表示特征值随POD模态数目的变化情况;图1(b)表示能量随POD模态数
目的变化情况;
图2为本发明的实例中基于特征正交分解的回归模型预测值与实测位移值比较图;
图3为本发明的实例中后15天模型预测值与实测位移值比较图;
图4为不同分位数下回归方程各参数变化图;
图5为不同分位数下对各自变量的分位数回归方程分析图;
图5(a)—(n)分别对应自变量x1—x14;
图6为部分自变量不同分位点回归方程参数估计值变化图;
图6(a)—(g)分别对应自变量x1,x2,x3,x4,x6,x8,x14。
具体实施方式
现结合附图和具体实施方式对本发明作进一步详细说明。
本发明的堤坝边坡变形监测数据分析新方法,包括以下几个方面:
1、基于正交分解的回归分析
对堤坝边坡位移及影响堤坝边坡位移的关键影响因素进行监测,影响堤坝边坡位移的关
键影响因素即为自变量,堤坝边坡位移即为因变量,选取相应监测数据,对自变量监测数据
矩阵在标准化的基础上进行特征正交分解,获得特征正交基与自变量的关系,利用特征正交
基与因变量进行回归分析,再获得因变量与特征正交基的关系,最后通过转化得到自变量与
因变量的回归方程;具体包括以下步骤:
(1)若m个测点的边坡位移在不同的时刻被记录了s次,形成测值矩阵Q:
Q = q 1 ( t 1 ) ... q 1 ( t s ) . . . . . . . . . q m ( t 1 ) ... q m ( t s ) - - - ( 1 ) ]]>
其中,tj表示j个时刻,第qi(tj)表示第j个时刻,第i个测点的观测数据,j=1,2,...s,
i=1,2,……,m。
则特征正交模态(POMS)为G=(1/n)QQT的特征向量,其对应的特征值则为特征正交
值(POVS),可以用特征正交值(POV)来衡量其对应特征向量所具有的能量。
对于n个观测样本,每个观测样本有p个观测变量q1,q2…qp,即p个自变量。定义
qij,i=1,2,...,n,j=1,2,...,p,表示第i个观测样本的第j个观测变量;则第k个观测样
本可以表示为(qk1,qk2...qkp)。
(2)构造快照矩阵
堤坝安全监测所得不同的变量经常具有不同的量纲,对于求取特征正交基时,变量的量
纲不同会使得到的特征正交基的结果不准确,致使后面的回归分析不合理。将自变量进行标
准化处理可避免这种不合理的影响。对自变量进行标准化,首先要得出样本标准差和样本均
值,记sj为样本的标准差, s j = V a r ( q j ) = 1 n ( q i j - q ‾ j ) , q ‾ j = 1 n Σ i = 1 n q i j , ]]>
定义自变量标准化为X: X = q i j - q ‾ j s j , ( j = 1 , 2 ... p ) , ]]>
其中,qij表示样本中第i个观测数据第j个观测变量, q j = q 1 j q 2 j . . . q nj , j = 1,2 , . . . p . ]]>
标准化后的快照矩阵写成矩阵形式为:
其中,xij表示标准化后第i个观测样本的第j个观测变量, X j = X 1 j X 2 j . . . X nj ]]>
(j=1,2,……,p)为一个列向量,表示第j个观测变量不同样本的观测值。
构造关联矩阵
根据自变量标准化处理以后的快照矩阵,构造关联矩阵R如式(3):
R=(1/n)XTX(3)
由式(3)可知关联矩阵R是p×p阶的实对称矩阵。
(3)求解POD正交基
利用Matlab软件求出关联矩阵R的特征值以及对应的特征向量,然后将特征值进行降
序排列,并将对应的特征向量进行相应的排序,特征值排序后表示为:λ1≥λ2≥...λp,λi
表示第i个特征值,i=1,2,……,p。
特征值的大小可以表示对应的正交基在样本中所占能量的比重。
运用一个通用的能量模态F(k)进行截断,设定一个标准ε=0.9,通过满足:
F ( k ) = Σ k = 1 l λ k Σ j = 1 p λ j ≥ 0.9 - - - ( 4 ) ]]>
即可确定POD降阶模型中模态的数目l。
当前l个特征值的累计贡献率超过0.9时,对应的特征向量构成矩阵V:
V=[V1,V2,...Vl],Vi表示第i个特征值对应的特征向量。
采用特征向量将快照矩阵进行线性化叠加,得到:Ψ=XV,
即可提取出POD的特征正交基Ψ={Ψ1,...Ψl}。正交基是相互独立的。
根据已经求出的POD的l个特征正交基,我们可以建立因变量与其之间的关系,将因
变量与原始自变量的回归关系转换成求因变量与特征正交基之间的关系。假设回归模型为:
y=b0+b1Ψ1+b2Ψ2+...+blΨl(5)
记参数B=[b0,b1,...bl],通过最小二乘法来估计参数使误差的平
方和达到最小。
由自变量到转换变量(特征正交基)的线性变换为:
Ψ 1 = V 1 ′ X ′ = v 11 X 1 + v 21 X 2 + ... + v p 1 X p Ψ 2 = V 2 ′ X ′ = v 12 X 1 + v 22 X 2 + ... + v p 2 X p ....................... Ψ l = V l ′ X ′ = v 1 l X 1 + v 2 l X 2 + ... + v p l X p - - - ( 6 ) ]]>
其中,Vi'表示降序排列后第i个特征值所对应的特征向量的转置向量,vij表示特征向
量Vi的第j个元素,X'表示标准化的快照矩阵X的转置矩阵。
对特征正交分解回归的参数值进行变换后求出自变量的解释变量c0,c1,…cp,然后求
出因变量相对于原始自变量之间的回归方程:
y=c0+c1X1+c2X2+...+cpXp(7)。
2、基于正交分解的分位数回归分析
(1)利用上面第(3)步方法得到特征正交基进行分位数回归分析。
(2)利用式(7)得到分位数回归分析的原始自变量和因变量的关系。
本发明方法对于建立边坡(包含大坝)预警模型、提供边坡预测预报方法和分析边坡敏
感影响因素具有十分重要的意义,该方法可以推广到输调水工程等大型水工建筑物的变形监
测分析。
3、基于分位数相关程度分析
利用分位数进行要分析两个测点测值之间分位数回归,通过回归结果分析两测点之间的
相关性。
现结合具体实施例对本发明方法做进一步详细说明。
1、进行基于特征正交分解的回归分析
1.1模型形式
影响堤坝边坡位移y(因变量)的因素主要有水位、温度、时效,可表示为
y=yH+yT+yθ(8)
式中:yH为水位分量,yT为温度分量,yθ为时效分量,下文称为自变量。
为了验证特征正交分解回归模型的有效性,对某土坝边坡水平位移监测数据进行回归分
析,算例一共包含从蓄水期开始的35天监测数据,每天选取4组监测数据,监测数据包含
位移,水位,8个测点的温度,选择以下回归模型进行验证:
y = a 0 + Σ i = 1 4 a i H i + Σ j = 1 8 b j T j + c 1 θ + c 2 ln θ - - - ( 9 ) ]]>
式中:a0,ai,bj,c1,c2为回归系数,由回归估计得到,y为位移量,Hi为水位H的i次
方,Tj为不同测点的温度,θ为时效因子,θ=ti/100,ti为观测天数,观测天数的下标i
表示距离观测基准的天数。模型共14个自变量,对应称为x1~x14。
1.2实测数据分割
上述实例中,位移监测时间从蓄水期算起共计35天。本发明主要研究位移与水位、温
度以及时效之间的回归关系,水位与温度每天变幅不大,每天取4组监量数据,一共有140
组监测数据,每组数据包含位移,水位,温度等15个变量。取前20天监测数据共80组监
测数据进行回归分析,拟合回归方程,然后用后15天共60组监测数据进行验证回归方程的
合理性。
1.3自变量相关分析
由于自变量的量纲不一样,为减少对回归分析的影响,现将变量标准化得到快照矩阵X。
根据标准化后的快照矩阵X,构造关联矩阵(又称相关系数矩阵)R:R=(1/n)XTX,利
用matlab软件构造关联矩阵见表1。
表1自变量关联矩阵
由表1可以看出,许多自变量之间的线性相关性比较强,比如水位值与水位的平方值等,
T1与T3和T6,T7与时效因子等都存在着显著的相关性,说明自变量之间存在很强的相关性,
如果直接采用常规逐步回归分析,会造成回归模型误差大、数据不能解释、预报精度不高甚
至错误等问题,因此本发明将采用新的方法将自变量进行转化为相互独立的新变量。
1.4求关联矩阵特征正交基
对关联矩阵(也即相关系数矩阵)求解特征值以及对应的特征向量,将求解出来的特征
值按照降序排列,对应的特征向量也降序排列。特征值及能量随特征正交分解(POD)模态
数目的变化情况如图1。
由图1可以看出,特征值随特征正交分解(POD)模态数以很快的速度下降,第一个特
征值比较大,第二个特征值以后变得很小,说明第一个模态具有很大的能量。第一个模态的
能量已达到85%以上,到第六个模态能量几乎达到100%。
选择POD的前两阶模态求解特征正交基。选取特征向量构造矩阵V=[V1,V2],其中,
V1,V2分别表示第一个特征值和第二个特征值对应的特征向量,采用特征向量将快照矩阵
进行线性化叠加,得到:Ψ=XV,提取出POD最佳正交基Ψi(i=1,2)。
Ψ1=0.279H1+0.279H2+0.280H3+0.281H4-0.279T1+0.208T2-0.272T3+
0.259T4-0.229T5+0.282T6+0.280T7-0.238T8+0.277θ+0.285lnθ
Ψ2=0.178H1+0.173H2+0.168H3+0.163H4+0.113T1+0.520T2+0.211T3+(10)
0.204T4+0.493T5+0.448T6+0.102T7+0.454T8-0.213θ-0.087lnθ
1.5新模型的建立与分析
将水平位移y与得到的两个最佳正交基Ψ1,Ψ2利用SPSS软件进行逐步回归,分析的
结果如表2~表4。
表2模型汇总
模型
R
R2
调整R2
标准估计的误差
1
0.888
0.789
0.786
12.36992
2
0.978
0.957
0.955
5.64982
表3方差分析
表4系数
拟合优度的可决系数R2表示在因变量y的总变异中,可由回归方程解释部分的比例,
R2的范围是[0,1],R2越接近1,说明回归直线的观测值的拟合度越好,表2的R2=0.957
非常接近1,说明曲线拟合比较好,符合要求。F检验的目的是检验自变量与因变量之间的
线性相关关系是否显著,是否可以线性模型表示,F越大,则说明自变量造成的因变量和线
性变动远大于随机因素对因变量的影响,自变量与因变量之间的线性关系越显著。从表3
的F检验结果来看,方程是有意义的。T检验是回归参数的显著性检验,由表4可以看出,
满足α=0.05的T检验。经过分析得到位移与POD正交基的回归方程为:
y=-6.838Ψ1-9.154Ψ2-168.05(11)
将式(10)代入式(11),得到位移与原始自变量之间的回归方程为:
y=-3.573H1-3.491H2-3.453H3-3.414H4+0.873T1-6.128T2-0.072T3(12)
-3.638T4-2.947T5-6.029T6-2.848T7-2.528T8+0.056θ-1.152lnθ-168.05
为了检验回归方程的合理性,用所建模型对位移监测值进行模拟如图2所示,可见模型
误差很小,精度很高。
为了检验模型的预报效果,用特征正交分解回归模型对后15天共60组的位移量进行预
报。因为模型中各自变量均经过标准化处理,所以先将原始数据进行标准化,然后再代入回
归方程,并将预报值与实测位移值进行比较,见图3。
由图3可以看出前29组预报值与实测值比较接近,说明所建立的模型精度较好,能够
较好的对后期数据进行预测。而29组数据之后预报值与实测值相差较大,说明新模型预报
精度只能在一定的时间尺度内得到保证。
2基于特征正交分解分位数回归分析
2.1常规分位数回归
利用SAS软件对边坡数据进行分位数回归分析,选择上游水位H1~H4、六个不同位
置的温度T1~T6、时间效应量θ,lnθ共12个变量作为自变量,水平位移为因变量,分析
水平位移与自变量之间的回归关系,计算结果见表5。
表5边坡数据分位数回归分析结果
注:表中x1~x12分别对应自变量H1,H2,H3,H4,T1,T2,T3,T4,T5,T6,
θ,lnθ。
由表5可以得到分位数回归分析方程为
y=-401246H1+1232047H2-1260918H3+430099.9H4+0.085T1-0.614T2(13)
-3.406T3-5.245T4-42.217T5-0.756T6+22.577θ-22.724lnθ-167.901
同时由表5还可以看出只有常数项与x1,x2,x3,x4,和x8通过了显著性水平检验
(p<0.05),其他自变量的系数则均未通过显著性水平检验。
表6给出了各自变量的Wald检验。
表6-1自变量x1Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
25.5612
1
25.56
<.0001
似然比
32.4556
1
32.46
<.0001
表6-2自变量x2Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
26.4246
1
26.42
<.0001
似然比
33.1754
1
33.18
<.0001
表6-3自变量x3Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
27.2900
1
27.29
<.0001
似然比
33.8884
1
33.89
<.0001
表6-4自变量x4Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
28.1531
1
28.15
<.0001
似然比
34.5885
1
34.59
<.0001
表6-5自变量x5Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
0.0035
1
0.00
0.9529
似然比
0.0204
1
0.02
0.8865
表6-6自变量x6Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
0.3441
1
0.34
0.5575
似然比
1.6907
1
1.69
0.1935
表6-7自变量x7Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
3.2101
1
3.21
0.0732
似然比
1.6736
1
1.67
0.1958
表6-8自变量x8Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
6.8673
1
6.87
0.0088
似然比
7.2120
1
7.21
0.0072
表6-9自变量x9Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
2.6391
1
2.64
0.1043
似然比
3.3001
1
3.30
0.0693
表6-10自变量x10Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
0.1491
1
0.15
0.6994
似然比
0.6713
1
0.67
0.4126
表6-11自变量x11Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
3.2331
1
3.23
0.0722
似然比
10.2603
1
10.26
0.0014
表6-12自变量x12Wald检验结果
检验项目
检验统计量
自由度
χ2检验
Pr>ChiSq
Wald检验
2.6824
1
2.68
0.1015
似然比
8.3877
1
8.39
0.0038
由表6-1——表6-12可知,只有自变量x1,x2,x3,x4,和x8的系数通过了Wald检
验,其余自变量的系数则均未通过Wald检验。由此说明了边坡实验数据的分位数回归分析
结果并不理想。分位数回归分析得到的方程系数与特征正交分解回归分析得到的系数有一定
的差别,说明自变量之间有相关关系导致直接对原数据进行回归分析结果精度不够。
2.2新型回归模型的建立
因为前面已经分析了原数据的自变量之间有很大的相关性,直接对其回归分析出现了信
息重叠,得到的模型不具实际的指导意义。表6-1——6-12也说明直接做分位数回归分析其
自变量的显著性水平基本上未通过检验,说明得到的回归模型不够合理,精度不满足要求。
为此,本发明先通过特征正交分解的方法得到相互独立的特征正交基,然后对特征正交基进
行分位数回归分析,然后再代入原始数据这样就得到了原始数据的分位数回归方程。
已经求得了特征正交分解的正交基Ψ1,Ψ2,现在直接对正交基Ψ1,Ψ2与因变量位
移y进行分位数回归分析。具体的结果见表7-1——表7-9,分位点为:0.1,0.2,0.3,0.4,
0.5,0.6,0.7,0.8,0.9。
表7-1分位数为0.1的回归分析结果
表7-2分位数为0.2的回归分析结果
表7-3分位数为0.3的回归分析结果
表7-4分位数为0.4的回归分析结果
表7-5分位数为0.5的回归分析结果
表7-6分位数为0.6的回归分析结果
表7-7分位数为0.7的回归分析结果
表7-8分位数为0.8的回归分析结果
表7-9分位数为0.9的回归分析结果
注:表中x1,x2分别表示正交基Ψ1,Ψ2。
各分位数回归方程参数汇总见表8。
表8各分位数回归方程参数分析表
分位数τ
常数项
正交基Ψ1
正交基Ψ2
是否通过显著性水平检验
0.1
-175.347
-6.3097
-9.4248
是
0.2
-173.094
-6.4387
-9.2103
是
0.3
-169.780
-6.4748
-9.3156
是
0.4
-169.147
-6.4933
-8.9245
是
0.5
-167.470
-6.8370
-8.8145
是
0.6
-166.511
-6.9981
-9.0899
是
0.7
-164.887
-7.1532
-8.6686
是
0.8
-162.858
-7.2368
-7.4337
是
0.9
-162.164
-7.2666
-7.6382
是
以上各表给出了基于特征正交分解下各分位数的回归方程参数估计值和95%的置信区
间,以及各参数的显著性结果。由表可知,在每个分位数下各参数均通过了显著性检验,说
明选取的用于回归分析的正交基包含了足够的信息,能够代表原数据进行回归分析。由不同
分位点的回归方程参数可以看出,特征正交分解下的分位数回归的各参数的估计值随着分位
点的不同而有所变化,而且变化的大小以及改变的趋势也有所不同,由此说明,在不同的分
位点下,POD的正交基对于因变量的影响是不同的。图4给出了不同分位点下回归方程各
参数变化图。
图中,灰度表示95%的置信区间,左上图为常数项参数变化,左下图为POD正交基Ψ1
的参数变化,右下图为POD正交基Ψ2的参数变化。由图4我们可以分析,首先看常数项
的参数变化,常数项的参数随着分位点的变化在不断增大的。再来看POD正交基Ψ1的参数
变化,Ψ1的参数随着分位点的变化成减小的趋势,但是减小的趋势可以分成两个变化过程,
第一个变化过程是分位点为0.1~0.4,在该过程,Ψ1的参数减小的比较缓慢,第二个过程是
分位点为0.4~0.9,在该过程,Ψ1的参数减小的程度要较第一过程大。对于POD正交基Ψ2
的参数变化我们可以看出要比模态Ψ1的变化复杂。整体既有增大又有减小的趋势,主要有
三个先增后减的过程,分别为分位点0.1~0.3,0.3~0.6,0.6~0.9这三个过程,第一与第二过
程增减的幅度不是很明显,而在第三过程增减幅度比较明显,其中分位点0.6~0.8的过程有
两个不同的增加过程,在0.8~0.9的过程又有明显的减小。分位数回归方程参数涵义解释与
经典的线性回归的最小二乘法有显著不同,用最小二乘方法得到的回归方程参数是不同解释
变量对回归变量的平均边际效果,而分位数回归方法得到的回归方程参数是不同解释变量对
回归变量的某个特定分位数的边际效果。图4中各个参数是随着分位点的变化而不断变化
的,说明各个自变量在不同的分位点对于大坝的位移变化的影响是不同的。
不同于传统的回归分析方法得到的是一条拟合的回归曲线,分位数回归分析得到的是一
簇回归曲线,拟合的是不同分位点的回归方程。与特征正交分解方法拟合的曲线对比分析,
可以看出,不同的分位点得到的各个回归参数与特征正交分解方法所得到的回归参数是不同
的,但是其正负号是相同的,并且各个参数的相差程度不是很大,这说明POD正交基在两
种回归分析方法下对于回归变量位移的相关性是一样的,不同的分位点其回归系数相差不
大,说明解释变量的分布相对规则,异常点较少。
3基于分位数回归的影响度分析
分位数回归可以分析常规建模方法的稳定性,也可以了解各个自变量测点对因变量的影
响程度,通过自变量的回归系数显著性特点以及系数随着分位点的变化而变化的情况。分别
对各个自变量与因变量之间的关系做分位数回归分析,具体的分析结果见图5。
图中,x1—x14分别对应自变量H1,H2,H3,H4,T1,T2,T3,T4,T5,T6,T7,T8,
θ,lnθ。由图5可以看出,在不同的分位点下对每个自变量进行分位数回归分析,当分位
数变化时,所得到的回归方程是不同的,有的自变量回归分析在不同的分位点得到的方程相
差很大,说明采用常规方法得到的回归方程的稳定性不能得到保证,所以我们对大坝监测数
据进行分位数回归分析是非常有必要的。与传统的回归分析不同,分位数回归分析可以展现
出不同的分位点下各个自变量的回归变化,从而使得对于因变量与自变量之间的回归分析更
加准确有效。通过SAS软件得到不同分位点下各个自变量的回归方程参数估计值变化情况
以及是否通过显著性检验见表9,仅讨论自变量在不同分位点的回归方程参数变化,所以常
数项回归方程参数表中未列出。
表9不同分位点下自变量回归方程参数估计表
τ
x1
x 2
x 3
x 4
x 5
x 6
x 7
0.1
-21.22*
-0.26*
-0*
-0*
0
-85.00*
0
0.2
-22.52*
-0.27*
-0*
-0*
60
-70.00*
50
0.3
-21.93*
-0.25*
-0*
-0*
93.33*
-100.0*
80*
0.4
-21.92*
-0.26*
-0*
-0*
116.67*
-185*
125*
0.5
-23.26*
-0.28*
-0*
-0*
140.00*
-193.33*
166.67*
0.6
-24.71*
-0.29*
-0*
-0*
110.00*
-190*
160*
0.7
-23.57*
-0.28*
-0*
-0*
120.00*
-182.5*
130*
0.8
-23.85*
-0.28*
-0*
-0*
130.00*
-160*
140*
0.9
-23.97*
-0.28*
-0*
-0*
132.00*
-175*
145*
τ
x 8
x 9
x 10
x 11
x 12
x 13
x 14
0.1
-220*
0
-60
-110
0
0
-38.39
0.2
-226.67*
0
-50
-110*
0
-125
-52.39*
0.3
-240*
-6.67
-83.33*
-150*
-3.33
-228.57*
-58.03*
0.4
-243.33*
2.50
-80*
-162.5*
20
-275*
-71.48*
0.5
-235*
22.5
-100*
-180*
30
-320*
-77.11*
0.6
-226.67*
40
-100*
-180*
50
-361.54*
-69.14*
0.7
-230*
84*
-98.33*
-170*
84*
-346.67*
-63.96*
0.8
-206.67*
92*
-98*
-170*
88.33*
-364.71*
-61.43*
0.9
-200*
95*
-100*
-165*
95*
-327.78*
-56.56*
注:带*表示其参数通过了显著性检验,参数为‘0’说明参数估计值非常小。
分析表9的结果,首先来看各个自变量回归方程参数的估计值的显著性检验,水位因子
(x1—x4)的各个分位点下的回归方程参数估计值均通过了显著性检验,这说明水位因子对
于大坝位移的影响比较显著。再看八个不同位置温度因子(x5—x12)的回归方程参数估计
值的显著性,只有x6,x8两个位置的温度因子在各个分位点的回归方程参数估计值均通过
了显著性检验,x5,x7,x10,x11四个位置的温度因子的回归方程参数估计值基本上都通
过了显著性检验,而x9,x12两处的温度因子只在三个分位点的回归方程参数估计值通过了
显著性检验,说明x6,x8两个位置的温度因子对于大坝位移的影响比较显著,而x5,x7,
x10,x11四个位置的温度因子对于大坝位移的影响程度次之,x9,x12两个位置的温度因子
对于大坝位移的影响程度则不是很明显。最后来看时效因子(x13,x14),时效因子的各分
位点回归参数估计值显著性检验基本都通过了,说明时效因子对于大坝位移的影响是不可忽
视的。前面已经通过SAS软件画出各自变量在不同分位点的回归参数值变化图,下面我们
主要分析水位因子以及x6,x8两处的温度因子以及对数时效因子x14的各分位点回归方程
参数估计值的变化情况,具体见图6。
图中,灰度表示95%的置信区间,由图6可以分析,水位因子x1,x2,x3也即H,H2,
H3的分位数回归参数估计值随着分位点的变化而变化的趋势基本相同,都经历了几个增减
的过程,且改变的幅度不是很大,变化过程与位移的变化过程比较相近。在分位点0.4~0.6
参数估计值的绝对值不断增大到最大值,说明水位因子对于位移的分布中心影响较大。而
x4即H4的参数估计值与其余三个水位因子不同,其参数估计值的绝对值随着分位点的变
化而不断的增大,说明对于位移的影响也相应的增大。温度因子x6的参数变幅比较大,参
数估计值的绝对值在分位数的中心部分比两侧要相对较大,说明温度因子x6对于位移的分
布中心影响较大。而温度因子x8的参数估计值的变幅要比x6要小的多,在分位点0.4以后
其参数估计值的绝对值不断减小。对于时间因子的参数变化,我们可以看出,在分位点0.5
的位置,参数估计值的绝对值达到最大值,即位移受时间因子的影响最大,在分位点0.5以
后,随着分位点的增大,其参数估计值的绝对值不断减小,说明自变量时间因子对于位移的
分布中心影响较大。