基于PCA-FIG-SVM的瓦斯绝对涌出量预测方法
技术领域
本发明涉及掘进工作面瓦斯涌出量的预测方法,特别是一种基于主成分分析(PCA)-模糊信息粒化(FIG)-支持向量机(SVM)的瓦斯绝对涌出量预测方法。
背景技术
在煤矿开采过程中,瓦斯问题一直是制约煤矿安全生产的重大隐患之一,精确测量和实时监控煤矿井下瓦斯绝对涌出量是保证煤矿安全生产的重要措施。
目前,国内外许多学者对瓦斯的预测问题已进行了深入而细致的研究,提出了很多有效的预测方法,大致可分为两类:一类是线性模型,如分源预测法、主成分回归分析法、统计法等;另一类是基于非线性组合的预测模型,如人工神经网络法、混沌预测法、支持向量机法、模糊数学以及极速学习机法等;这些方法各有优点且对瓦斯涌出量预测起到了一定的促进作用。
随着国家对煤矿安全生产要求的不断提高和企业自身发展的需要,我国各大中型煤矿都陆续装备了矿井监测系统,极大提高了矿井安全生产水平和安全生产管理效率。然而这些监控数据仅仅是当前工作状态的一种记录,还缺乏在未来一段时间内对监控数据的发展趋势。在现有技术中,吴兆法等在《工矿自动化》期刊2014年第40卷第12期上公开了一种瓦斯浓度趋势预测方法,论文名为:基于插值梯形模糊信息粒化的瓦斯浓度趋势预测,但由于预测方法仅是基于瓦斯浓度原始数据,并未考虑开采条件、煤层条件等影响因素的作用,在采掘过程中,影响瓦斯涌出量的影响因素处于不断变化之中,使得工作面瓦斯涌出量存在非常大的不确定性,因此有必要提出一种新的瓦斯绝对涌出量变化趋势的预测模型,重点研究变化趋势和变化的空间范围。
发明内容
本发明的目的是为克服上述现有技术的不足,提供一种基于PCA-FIG-SVM的瓦斯绝对涌出量预测方法,该方法能提高瓦斯涌出量预测精度,研究变化趋势和变化的空间范围,弥补原有瓦斯涌出量预测缺陷,为煤矿安全生产提供依据。
为实现上述目的,本发明采用下述技术方案:
一种基于PCA-FIG-SVM的瓦斯绝对涌出量预测方法,包括以下步骤:
(1)瓦斯绝对涌出量监测数据及影响因素的收集;其中,影响因素包括煤层厚度、煤层瓦斯含量、煤层间距、日推进速度和日均产量;
(2)对影响因素数据进行主成分建模,重构主成分,具体步骤如下:
①对影响因素数据进行归一化处理,得到样本集矩阵X;
②将样本集矩阵X用下式变换为相关矩阵,得到主成分矩阵R:
R=(rij)p×p
且rij=1nΣd=1n(ddi-x‾i)(xdi-x‾j),(i=1,2,...,p;j=1,2,...,p)]]>
其中:xdi为第i个影响因素第d个样本的数值;为第i个影响因素所有样本数值的平均值;xdj为第j个影响因素第d个样本的数值;为第j个影响因素所有样本数值的平均值;n为样本个数;p为影响因素个数;rij为第i个影响因素与第j个影响因素的相关系数;
③根据主成分矩阵R求出特征值、主成分贡献率和累计贡献率,按照累计贡献率>90%确定主成分个数m,并按下式建立主成分模型:
Fk=α1kX1+α2kX2+...+αpkXp (k=1,2,...,m)
其中,Fk为第k主成分,每个方程中的系数向量(α1k,α2k,…,αpk)分别是特征值λ1,λ2,…,λm所对应的单位特征向量,Xi(i=1、2……p)为第i个影响因素的标准化数据;
(3)对瓦斯绝对涌出量监测数据构成的时间序列进行模糊信息粒化;具体步骤如下:
①划分窗口:确定粒化窗口的大小l,将瓦斯绝对涌出量序列Y={y1,y2,...,yM}以l子列长度划分为[M/l]个子列Y′n,n=1,2,...,M/l,其中[M/l]表示向前取整数;
②在一个子列窗口上建立模糊粒子A;
首先选择模糊粒子的形式:采用三角型模糊粒子,其隶属函数如下:
A(x,a,c,b)=0,x<ax-ac-a,a≤x≤cb-xb-c,c≤x≤b0,x>b]]>
式中:x是采集的瓦斯绝对涌出量;a和b分别是模糊粒子A的支撑下限和上限;c是模糊粒子A的核;
然后,确定模糊粒子A的参数a、b和c:模糊粒子A的核c取子列数据集的平均值;而参数a、b则通过求解式(1)所述的优化问题:
MaxQa,b=Σi=1mA(Yni′)measure(supp(A))=Σi=1mA(Yni′)b-a---(1)]]>
其中,Max表示最大化运算,Y′ni为子列Y′n中的元素,l为子列Y′n的长度,A(Y′ni)表示Y′n的隶 属函数。
③对瓦斯绝对涌出量进行模糊信息粒化;
按照步骤②,分别在Y的[M/l]个子列窗口上建立相应的模糊粒子A,得到瓦斯绝对涌出量进行模糊信息粒化结果,得到3个模糊信息粒化变量序列:
Low=[l1,l2,...,l[M/m]]R=[r1,r2,...,r[M/m]]Up=[u1,u2,...,u[M/m]]]]>
其中,Low参数是Y变化的最小值,R参数是Y变化的大体平均水平,Up参数是Y变化的最大值。
(4)建立粒化数据的支持向量机回归模型,步骤如下:
①对重构主成分进行预处理:按照粒化窗口的大小m,分别将每一个重构主成划分为[M/l]个子列,取每一个子列的重构主成分平均值作为该子列的主成分值。
②建立样本集:以预处理的重构主成分数据和3个模糊信息粒化变量序列数据组成样本集,并选取20%的样本作为检验样本,其余作为训练样本;
③建立模糊信息粒化变量序列Low、R和Up的支持向量机回归模型:首先利用万有引力搜索算法对支持向量机回归模型的惩罚参数c和核参数σ进行寻优,其中核函数选择径向基函数;然后利用寻得的最优参数对训练样本进行训练,分别建立3个模糊信息粒化变量序列Low、R和Up的支持向量机回归模型,并用检验样本对模型检验,若平均相对误差<10%,认为模型可靠,可用来预测,否则,重新主成分建模重构主成分。
(5)瓦斯绝对涌出量预测,具体方法是,首先应用建立的主成分模型提取主成分并进行预处理,将其输入到步骤(4)建立的3个模糊信息粒化变量序列Low、R和Up的支持向量机回归模型,即能预测出瓦斯涌出量的最大值、最小值和平均值。
本发明与现有技术相比具有以下优点:
(1)本发明将瓦斯涌出量影响因素作为建立FIG-SVM模型的输入参数,代替传统FIG-SVM模型中以瓦斯涌出量时间序列监测数据或单纯的时间作为输入参数,建立的模型更加可靠。
(2)利用主成分分析对瓦斯涌出量影响因素进行降维处理,有效减小冗杂信息的影响、缩小模型输入维数,极大提高模型学习效率及精度。
附图说明
图1是本发明流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
如图1所示,基于PCA-FIG-SVM的瓦斯绝对涌出量预测方法,包括以下步骤:
(1)瓦斯绝对涌出量监测数据及影响因素的收集;其中,影响因素包括煤层厚度、煤层瓦斯含量、煤层间距、日推进速度和日均产量。
(2)对影响因素数据进行主成分建模,重构主成分,具体步骤如下
①对影响因素数据进行归一化处理,得到样本集矩阵X;
②将样本集矩阵X用下式变换为相关矩阵,得到主成分矩阵R:
R=(rij)p×p
且rij=1nΣd=1n(ddi-x‾i)(xdi-x‾j),(i=1,2,...,p;j=1,2,...,p)]]>
其中:xdi为第i个影响因素第d个样本的数值;为第i个影响因素所有样本数值的平均值;xdj为第j个影响因素第d个样本的数值;为第j个影响因素所有样本数值的平均值;n为样本个数;p为影响因素个数;rij为第i个影响因素与第j个影响因素的相关系数;
③根据主成分矩阵R求出特征值、主成分贡献率和累计贡献率,按照累计贡献率>90%确定主成分个数m,并按下式建立主成分模型:
Fk=α1kX1+α2kX2+...+αpkXp (k=1,2,...,m)
其中,Fk为第k主成分,每个方程中的系数向量(α1k,α2k,…,αpk)分别是特征值λ1,λ2,…,λm所对应的单位特征向量,Xi(i=1、2……p)为第i个影响因素的标准化数据;
(3)对瓦斯绝对涌出量监测数据构成的时间序列进行模糊信息粒化;具体步骤如下:
①划分窗口:确定粒化窗口的大小l,将瓦斯绝对涌出量序列Y={y1,y2,...,yM}以l子列长度划分为[M/l]个子列Y′n,n=1,2,...,M/l,其中[M/l]表示向前取整数;
②在一个子列窗口上建立模糊粒子A;
首先选择模糊粒子的形式:采用三角型模糊粒子,其隶属函数如下:
A(x,a,c,b)=0,x<ax-ac-a,a≤x≤cb-xb-c,c≤x≤b0,x>b]]>
式中:x是采集的瓦斯绝对涌出量;a和b分别是模糊粒子A的支撑下限和上限;c是模糊粒子A的核;
然后,确定模糊粒子A的参数a、b和c:模糊粒子A的核c取子列数据集的平均值;而参数a、b则通过求解式(1)所述的优化问题:
MaxQa,b=Σi=1mA(Yni′)measure(supp(A))=Σi=1mA(Yni′)b-a---(1)]]>
其中,Max表示最大化运算,Y′ni为子列Y′n中的元素,l为子列Y′n的长度,A(Y′ni)表示Y′n的隶属函数。
③对瓦斯绝对涌出量进行模糊信息粒化;
按照步骤②,分别在Y的[M/l]个子列窗口上建立相应的模糊粒子A,得到瓦斯绝对涌出量进行模糊信息粒化结果,得到3个模糊信息粒化变量序列:
Low=[l1,l2,...,l[M/m]]R=[r1,r2,...,r[M/m]]Up=[u1,u2,...,u[M/m]]]]>
其中,Low参数是Y变化的最小值,R参数是Y变化的大体平均水平,Up参数是Y变化的最大值。
(4)建立粒化数据的支持向量机回归模型,步骤如下:
①对重构主成分进行预处理:按照粒化窗口的大小m,分别将每一个重构主成划分为[M/l]个子列,取每一个子列的重构主成分平均值作为该子列的主成分值。
②建立样本集:以预处理的重构主成分数据和3个模糊信息粒化变量序列数据组成样本集,并选取20%的样本作为检验样本,其余作为训练样本;
③建立模糊信息粒化变量序列Low、R和Up的支持向量机回归模型:首先利用万有引力搜索算法对支持向量机回归模型的惩罚参数c和核参数σ进行寻优,其中核函数选择径向基函数;然后利用寻得的最优参数对训练样本进行训练,分别建立3个模糊信息粒化变量序列Low、R和Up的支持向量机回归模型,并用检验样本对模型检验,若平均相对误差<10%,认为模型可靠,可用来预测,否则,重新主成分建模重构主成分。
(5)瓦斯绝对涌出量预测,具体方法是,首先应用建立的主成分模型提取主成分并进行预处理,将其输入到步骤(4)建立的3个模糊信息粒化变量序列Low、R和Up的支持向量机回归模型,即能预测出瓦斯涌出量的最大值、最小值和平均值。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。