基于DMAP模型的余震预测方法.pdf
《基于DMAP模型的余震预测方法.pdf》由会员分享,可在线阅读,更多相关《基于DMAP模型的余震预测方法.pdf(10页完成版)》请在专利查询网上搜索。
1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202010514266.3 (22)申请日 2020.06.08 (71)申请人 浙江大学 地址 310013 浙江省杭州市西湖区余杭塘 路866号 (72)发明人 赵莎王海岩潘纲刘杰薛艳 方毅董霖李石坚 (74)专利代理机构 杭州天勤知识产权代理有限 公司 33224 代理人 王琛 (51)Int.Cl. G06Q 10/04(2012.01) G06Q 50/26(2012.01) (54)发明名称 一种基于DMAP模型的余震预测方法 (57)摘要 本发明公开了一种基于DM。
2、AP模型的余震预 测方法, 其基于深度学习方法, 利用大量的地震 数据学习主震的震级大小、 被预测区域与主震震 源的空间距离信息以及主震爆发过程对相关区 域造成的应力变化信息与余震的爆发之间的相 互关系, 同时结合数据增强方法提升模型的预测 能力以及降低模型的方差, 并将余震的震级信息 添加到样本的损失函数中来优化模型, 提高模型 的预测能力。 权利要求书2页 说明书6页 附图1页 CN 111695729 A 2020.09.22 CN 111695729 A 1.一种基于DMAP模型的余震预测方法, 包括如下步骤: (1)收集地震发生后的相关信息, 包括主震位置信息、 主震震级信息以及主震。
3、周围相关 区域的应力变化信息以及与主震震源的空间距离信息; (2)在主震发生后, 以主震震源为中心, 对主震的周边区域进行平面二维网格划分, 每 个网格区域的大小为5km5km; 根据主震爆发过程对周边不同网格区域造成的位错计算得 到每个网格区域的应力变化张量; (3)对于任一网格区域, 将主震震级、 该网格区域的应力变化张量以及与主震震源的空 间距离组成特征样本; 若该网格区域发生余震, 则将其特征样本作为正样本; 若该网格区域 未发生余震, 则将其特征样本作为负样本; (4)构建DMAP模型, 利用大量特征样本对DMAP模型进行训练, 得到余震预测模型, 并利 用其对主震震源周围的待测区域。
4、进行余震预测。 2.根据权利要求1所述的余震预测方法, 其特征在于: 所述步骤(4)中的DMAP模型包括 隐向量提取模块、 特征工程模块、 输入层、 特征提取层以及输出层, 其中隐向量提取模块和 特征工程模块与输入层连接, 输入层与特征提取层连接, 特征提取层与输出层连接。 3.根据权利要求2所述的余震预测方法, 其特征在于: 所述隐向量提取模块内置有主震 的震级隐向量矩阵H、 被测区域距离主震震源的空间距离隐向量矩阵L以及被测区域的应力 变化隐向量矩阵M, 其中震级隐向量矩阵H的大小为hp, 空间距离隐向量矩阵L的大小为l p, 应力变化隐向量矩阵M的大小为mp, h为经过离散化后的震级区间。
5、数量, l为经过离散 化后的空间距离区间数量, m为应力变化张量中的应力分量数量, p为自定义的隐向量维度。 4.根据权利要求3所述的余震预测方法, 其特征在于: 所述隐向量提取模块对特征样本 中的主震震级进行离散化后从震级隐向量矩阵H中提取对应该主震震级的一条行向量作为 主震震级隐向量, 同时对特征样本中网格区域与主震震源的空间距离进行离散化后从空间 距离隐向量矩阵L中提取对应该空间距离的一条行向量作为网格区域的空间距离隐向量; 对于特征样本中网格区域的应力变化张量, 根据其中的6个应力分量 xx、 xy、 xz、 yy、 yz、 zz分别从应力变化隐向量矩阵M中提取对应的一条行向量, 并将。
6、对应的行向量 与应力分量相乘得到网格区域的6个应力分量隐向量, 其中 xx为x方向上的拉力或压力, xy为x-y平面上的扭矩力, xz为x-z平面上的扭矩力, yy为y方向上的拉力或压力, yz为y-z平面上的扭矩力, zz为z方向上的拉力或压力。 5.根据权利要求4所述的余震预测方法, 其特征在于: 所述特征工程模块用于将特征样 本中网格区域应力变化张量的6个应力分量 xx、 xy、 xz、 yy、 yz、 zz取绝对值 后进行对数操作组成网格区域的对数应力变化向量, 同时对网格区域的应力变化张量进行 矩阵变换计算得到网格区域的最大剪应力和范式等效应力。 6.根据权利要求5所述的余震预测方法。
7、, 其特征在于: 由于应力分量 xx、 xy、 xz、 yy、 yz、 zz中方向x与y方向彼此等价, 通过互换可对特征数量进行数据增强。 7.根据权利要求5所述的余震预测方法, 其特征在于: 所述输入层将6个应力分量隐向 量相加作为有效的应力向量, 然后将其与主震震级隐向量、 空间距离隐向量、 对数应力变化 向量、 最大剪应力以及范式等效应力进行拼接作为特征提取层的输入; 所述特征提取层采 用DNN进行特征提取, 得到的特征向量送入输出层; 所述输出层是一层输出维度为1的全联 接网络并经Sigmoid激活函数运算后得到网格区域发生余震的概率。 权利要求书 1/2 页 2 CN 1116957。
8、29 A 2 8.根据权利要求7所述的余震预测方法, 其特征在于: 所述步骤(4)中对DMAP模型进行 训练的具体实施过程为: 首先初始化该模型参数, 包括震级隐向量矩阵H、 空间距离隐向量 矩阵L、 应力变化隐向量矩阵M、 DNN中每一层的权值矩阵和偏置向量、 学习率、 优化算法; 然 后将特征样本逐一输入至DMAP模型中进行训练, 计算模型输出的预测结果与对应特征样本 真值之间的损失函数L, 进而根据损失函数L通过反向传播对整个DMAP模型的参数不断进行 调整更新, 直至损失函数最小收敛, 从而完成训练得到余震预测模型。 9.根据权利要求8所述的余震预测方法, 其特征在于: 所述损失函数L。
9、的表达式如下: 其中: pr为第r个特征样本的真值, 若特征样本为正样本, 则其真值1; 若特征样本为负样 本, 则其真值0, 为第r个特征样本对应的预测结果, D为特征样本总数量, 为权重系数, 其大小与余震震级正相关且 Msub+1, 对于正样本, Msub为对应网格区域的余震震级; 对于 负样本, Msub0。 10.根据权利要求1所述的余震预测方法, 其特征在于: 所述步骤(5)中利用余震预测模 型对主震震源周围的待测区域进行余震预测的过程为: 在主震发生后, 将主震震级、 待测区 域的应力变化张量以及与主震震源的空间距离组成特征量输入至余震预测模型, 即可输出 得到待测区域在接下来一。
10、段时间内发生余震的概率。 权利要求书 2/2 页 3 CN 111695729 A 3 一种基于DMAP模型的余震预测方法 技术领域 0001 本发明属于地震预测技术领域, 具体涉及一种基于DMAP模型的余震预测方法。 背景技术 0002 地质工作者多年来利用地震监测台站所记录的连续波形数据在地震预警、 地震速 报、 地震机制等领域进行了大量的工作和研究, 其中地震事件检测、 震相自动拾取以及震级 快速估算等任务是相关研究的重点和热点。 地震事件检测是指对于地震监测台站记录的连 续波形数据, 检测出其中某一段数据是否属于一个地震事件, 从而给出某个时刻是否发生 地震的判断; 震相自动拾取是指在。
11、我们已经知道某段波形数据属于地震事件之后, 给出确 切的地震波传播到达台站的时间; 震级快速估算任务在地震预警中非常重要, 如果能在一 次地震发生的前几秒钟, 给出这次地震的震级的准确估算, 那么就能给地震预警和救灾工 作带来很大的帮助, 争取更多的时间。 0003 由于地震是一种极具破坏力的自然灾害, 大地震爆发过程通常会改变断层周围的 应力分布, 大量实验已证明余震的发生与主震爆发带来的应力变化息息相关, 余震的发生 通常会在主震的基础上带来二次破坏, 因此对余震的空间分布进行有效的预测是一件意义 非凡的工作。 0004 目前的余震预测可以简单的分为两类: 一类是传统地震学中常用的基于物理。
12、量的 余震预测方法, 即余震的预测主要是基于主震爆发过程导致周围相关区域应力变化张量计 算得到的物理量如库仑破裂应力、 最大剪应力、 范式等效应力等来进行余震的预测; 另一类 是基于深度学习模型直接学习应力变化与余震之间的复杂映射关系。 0005 近年来, 随着深度学习的快速发展, 将其应用到地震相关领域中逐渐成为一种发 展趋势, 基于深度学习的余震预测比较典型的研究是DeVries等人在2018年Nature杂志上 发表的基于DNN的余震预测工作DeVries P M R,Vigas F,Wattenberg M et al.Deep learning of aftershock patte。
13、rns following large earthquakesJ.Nature, 2018, 560(7720):632., DeVries直接利用余震后的应力变化张量 的六个独立应力分量 xx、 xy、 xz、 yy、 yz、 zz作为特征, 并利用一个6层的DNN网络来预测每个网格在接下 来的一年内是否会发生余震, 结果发现神经网络能够很好的学习到 与余震之间的关系。 0006 传统地震学中基于物理量的余震预测方法在可解释性方面占据优势, 但随着深度 学习的发展以及数据集的增加, 深度学习在余震预测的效果上展现了一定的优势。 DeVries 基于DNN的余震预测模型只考虑了应力变化与余震之。
14、间的关系, 而没有考虑到主震的震级 大小信息、 被预测区域与震源的空间距离信息以及缺少对应力变化进行的有效特征工程。 发明内容 0007 鉴于上述, 本发明提出了一种基于DMAP模型的余震预测方法, 通过大量的主震与 余震数据, 训练DMAP(Deep Model forAftershockPrediction)模型, 提高对余震的预测能 力。 说明书 1/6 页 4 CN 111695729 A 4 0008 一种基于DMAP模型的余震预测方法, 包括如下步骤: 0009 (1)收集地震发生后的相关信息, 包括主震位置信息、 主震震级信息以及主震周围 相关区域的应力变化信息以及与主震震源的空。
15、间距离信息; 0010 (2)在主震发生后, 以主震震源为中心, 对主震的周边区域进行平面二维网格划 分, 每个网格区域的大小为5km5km; 根据主震爆发过程对周边不同网格区域造成的位错 计算得到每个网格区域的应力变化张量; 0011 (3)对于任一网格区域, 将主震震级、 该网格区域的应力变化张量以及与主震震源 的空间距离组成特征样本; 若该网格区域发生余震, 则将其特征样本作为正样本; 若该网格 区域未发生余震, 则将其特征样本作为负样本; 0012 (4)构建DMAP模型, 利用大量特征样本对DMAP模型进行训练, 得到余震预测模型, 并利用其对主震震源周围的待测区域进行余震预测。 0。
16、013 进一步地, 所述步骤(4)中的DMAP模型包括隐向量提取模块、 特征工程模块、 输入 层、 特征提取层以及输出层, 其中隐向量提取模块和特征工程模块与输入层连接, 输入层与 特征提取层连接, 特征提取层与输出层连接。 0014 进一步地, 所述隐向量提取模块内置有主震的震级隐向量矩阵H、 被测区域距离主 震震源的空间距离隐向量矩阵L以及被测区域的应力变化隐向量矩阵M, 其中震级隐向量矩 阵H的大小为hp, 空间距离隐向量矩阵L的大小为lp, 应力变化隐向量矩阵M的大小为m p, h为经过离散化后的震级区间数量, l为经过离散化后的空间距离区间数量, m为应力变 化张量中的应力分量数量,。
17、 p为自定义的隐向量维度。 0015 进一步地, 所述隐向量提取模块对特征样本中的主震震级进行离散化后从震级隐 向量矩阵H中提取对应该主震震级的一条行向量作为主震震级隐向量, 同时对特征样本中 网格区域与主震震源的空间距离进行离散化后从空间距离隐向量矩阵L中提取对应该空间 距离的一条行向量作为网格区域的空间距离隐向量; 对于特征样本中网格区域的应力变化 张量, 根据其中的6个应力分量 xx、 xy、 xz、 yy、 yz、 zz分别从应力变化隐向量 矩阵M中提取对应的一条行向量, 并将对应的行向量与应力分量相乘得到网格区域的6个应 力分量隐向量, 其中 xx为x方向上的拉力或压力, xy为x-。
18、y平面上的扭矩力, xz为x-z 平面上的扭矩力, yy为y方向上的拉力或压力, yz为y-z平面上的扭矩力, zz为z方向 上的拉力或压力。 0016 进一步地, 所述特征工程模块用于将特征样本中网格区域应力变化张量的6个应 力分量 xx、 xy、 xz、 yy、 yz、 zz取绝对值后进行对数操作组成网格区域的对数 应力变化向量, 同时对网格区域的应力变化张量进行矩阵变换计算得到网格区域的最大剪 应力和范式等效应力。 0017 进一步地, 由于应力分量 xx、 xy、 xz、 yy、 yz、 zz中方向x与y方向彼 此等价, 通过互换可对特征数量进行数据增强。 0018 进一步地, 所述输。
19、入层将6个应力分量隐向量相加作为有效的应力向量, 然后将其 与主震震级隐向量、 空间距离隐向量、 对数应力变化向量、 最大剪应力以及范式等效应力进 行拼接作为特征提取层的输入; 所述特征提取层采用DNN(深度神经网络)进行特征提取, 得 到的特征向量送入输出层; 所述输出层是一层输出维度为1的全联接网络并经Sigmoid激活 函数运算后得到网格区域发生余震的概率。 说明书 2/6 页 5 CN 111695729 A 5 0019 进一步地, 所述步骤(4)中对DMAP模型进行训练的具体实施过程为: 首先初始化该 模型参数, 包括震级隐向量矩阵H、 空间距离隐向量矩阵L、 应力变化隐向量矩阵M。
20、、 DNN中每 一层的权值矩阵和偏置向量、 学习率、 优化算法; 然后将特征样本逐一输入至DMAP模型中进 行训练, 计算模型输出的预测结果与对应特征样本真值之间的损失函数L, 进而根据损失函 数L通过反向传播对整个DMAP模型的参数不断进行调整更新, 直至损失函数最小收敛, 从而 完成训练得到余震预测模型。 0020 进一步地, 所述损失函数L的表达式如下: 0021 0022 其中: pr为第r个特征样本的真值, 若特征样本为正样本, 则其真值1; 若特征样本 为负样本, 则其真值0, 为第r个特征样本对应的预测结果, D为特征样本总数量, 为权重 系数。 0023 进一步地, 所述权重系。
21、数 的大小与余震震级正相关且 Msub+1, 对于正样本, Msub 为对应网格区域的余震震级; 对于负样本, Msub0。 0024 进一步地, 所述步骤(5)中利用余震预测模型对主震震源周围的待测区域进行余 震预测的过程为: 在主震发生后, 将主震震级、 待测区域的应力变化张量以及与主震震源的 空间距离组成特征量输入至余震预测模型, 即可输出得到待测区域在接下来一段时间内发 生余震的概率。 0025 基于上述技术方案, 本发明利用大量的地震数据学习主震的震级大小、 被预测区 域与主震震源的空间距离信息以及主震爆发过程对相关区域造成的应力变化信息与余震 的爆发之间的相互关系, 同时结合数据增。
22、强方法提升模型的预测能力以及降低模型的方 差, 另外将余震的震级信息添加到样本的损失函数中来优化模型, 提高模型的预测能力。 附图说明 0026 图1为本发明余震预测方法的整体流程示意图。 0027 图2为本发明DMAP模型架构示意图。 具体实施方式 0028 为了更为具体地描述本发明, 下面结合附图及具体实施方式对本发明的技术方案 进行详细说明。 0029 如图1所示, 本发明基于DMAP模型的余震预测方法具体步骤如下: 0030 (1)针对过去发生的历史地震, 对以主震为中心的周围相关区域划分平面网格, 收 集主震的震级信息、 每个网格距离震源的空间距离信息以及每个网格区域内由主震爆发过 。
23、程造成的应力变化张量。 0031 其中主震的震级信息以连续特征表征, 我们将主震的震级进行离散化, 具体方法 如下: 0032 1.确定离散化的分桶区间: -, m1),m1,m2),m2,m3),m3,m4),m4, +); 0033 2.确定样本的主震震级所在区间, 得到离散化的one-hot值。 说明书 3/6 页 6 CN 111695729 A 6 0034 经过离散化后的主震得到one-hot编码格式。 通过矩阵相乘的方式进行空间向量 的映射, 如下: 0035 vmainshockvo-mainH 0036 其中: vo-main为1h的向量, h表示主震经过离散化后的维度, H。
24、为hp的矩阵, p为 自定义的隐向量维度; 基于此, 可以将以one-hot编码的主震震级信息vo-main表征为维度为1 p的vmainshock向量。 0037 对被预测区域与主震震源的空间距离我们同样采用分桶的方法首先获得one-hot 编码的向量vo-dis, 并下面的公式获取距离的隐向量表征vdis。 0038 vdisvo-disL 0039 对于应力张量的六个独立应力分量 xx, xy, xz, yy, yz, zz, 处理方 式是将其作为隐向量的权重, 获取其隐向量方法如下所示: 0040 0041其中:表示应力分量方向为mn的空间映射基向量。 0042 主震的震级信息、 被预。
25、测区域与震源的空间距离信息以及应力分量信息通过高维 隐向量表征, 根据以下公式通过高斯分布初始化隐向量, 并通过神经网络反向传播调整。 0043 0044 其中: 为分布的平均值, 设置为0; 为分布的标准差, 设置为0.1。 0045 (2)本发明采用的余震预测模型DMAP结构如图2所示, DMAP模型的输入包含如下四 类特征: 基于高维隐向量表征的主震震级信息; 基于高维隐向量表征的被预测区域与 震源的空间距离信息; 基于高维隐向量表征的应力变化信息; 基于应力张量的特征工 程。 0046 模型的输入首先是将经过隐向量表征的6个独立应力分量向量进行Sum Pooling, 如下所示: 00。
26、47 EmbEmbmn 0048 之后将进行SumPooling后的应力分量向量与主震震级隐向量、 空间距离隐向量以 及特征工程特征向量进行拼接, 输入至DNN网络层, 单层的DNN网格公式如下所示: 0049 hi (WThi-1+bi) 0050 其中: hi-1表示前一层网络的输出向量, bi为偏置向量, WT为网络权重参数, 为激活 函数, hi表示当前层的输出; 对于初始输入, 是采用SumPooling后的应力分量向量与主震震 说明书 4/6 页 7 CN 111695729 A 7 级隐向量、 空间距离隐向量以及特征工程特征向量拼接后所得向量, 激活函数 采用Relu函 数。 0。
27、051 模型的输出层采用Sigmoid激活函数, 如下所示: 0052 ySigmoid(hi) 0053 (3)通过收集到的大量特征样本, 反向传播训练网络参数, 获取有效的网络模型。 0054 使用SGD作为梯度下降方法, 初始学习率设为0.1,并结合淬火的方式不断降低学 习率; 以Relu作为深度网络激活函数, 以减少深度网络梯度消失问题; DNN模块每层添加 Dropout来提高模型的泛化能力, 提高模型稳定性; 设置80的数据作为训练集, 20的数 据作为测试集, 并在训练集中使用5折交叉验证来调整模型和参数。 0055 训练模型时采用以下损失函数: 0056 0057其中: pr为。
28、第r个特征样本中的真值,为第r个特征样本对应的预测结果, D为特 征样本总数量, 为权重系数, 其大小与余震的震级成正相关, 具体设置如下: 0058 Msub+1 0059 其中: Msub表示余震的震级大小, 对于余震震级为0的样本, 值为1。 0060 (4)对于真实预测问题, 将主震震级信息、 被预测区域与震源的空间距离信息、 被 预测区域的应力变化信息以及基于应力变化的特征工程特征作为模型输入, 通过模型最后 一层的Sigmoid激活函数, 输出被预测区域发生余震的概率。 0061 表1为本发明方法与其他预测方法的效果比较, 从中可以看出本发明方法相对现 有其他预测方法在预测效果方面有明显的提升。 0062 表1 0063 0064 0065 上述的对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发 明。 熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改, 并把在此说明的 一般原理应用到其他实施例中而不必经过创造性的劳动。 因此, 本发明不限于上述实施例, 本领域技术人员根据本发明的揭示, 对于本发明做出的改进和修改都应该在本发明的保护 说明书 5/6 页 8 CN 111695729 A 8 范围之内。 说明书 6/6 页 9 CN 111695729 A 9 图1 图2 说明书附图 1/1 页 10 CN 111695729 A 10 。
- 内容关键字: 基于 DMAP 模型 余震 预测 方法
介孔蛋黄壳纳米颗粒及其在构建分泌物代谢指纹谱图中的应用和用其筛选的代谢标志物.pdf
制袋机的放卷机构.pdf
双枪激光焊机.pdf
锂离子正极材料异常料筛分装置.pdf
用于芯片开盖的可调整平台.pdf
防腐伸缩蝶阀.pdf
可分离式检修插座箱.pdf
自承重保温复合屋面板.pdf
螺杆钻具定子壳体打磨装置.pdf
提升机机尾增压防尘结构.pdf
简易分条机构.pdf
煤矿探水钻孔快速密封装置.pdf
新能源电池储能充电用触发控制电路.pdf
加速植株晾干设备.pdf
高可靠电容切换开关.pdf
散热器翅片的冲片装置.pdf
可拆式偏心加强撑.pdf
农业种植用可调节式农业种植架.pdf
饮品和冰棒的新型包装袋.pdf
卧式搅拌反应釜.pdf
平板玻璃切割加工系统.pdf
器件复用的射频收发电路及其控制方法.pdf
基于单片FPGA的PET正弦图数据压缩存储方法、系统及设备.pdf
风机轴承剩余有效寿命优化方法、设备及介质.pdf
远程控制车辆分享解锁方法及系统.pdf
多轴分布式电驱车辆转向控制方法及车辆.pdf
无对照HRD检测方法、系统及装置.pdf
人工植入物以及介入系统.pdf
实心分割铝导体高压电缆制备方法.pdf
基于图像处理的影动方向计算系统及屈光度估计系统.pdf
热塑性复合工程材料缸盖罩自动校平装置及校平方法.pdf
多尺寸的晶圆传输装置、方法及电子设备.pdf
多层复合型高耐温抗侵蚀耐火材料.pdf
气动开窗器.pdf
机械式同心绞放线张力控制系统.pdf
用于数据处理的服务器.pdf
汽车尾门内板模具的快速定位机构.pdf
针对水泥生产工艺的闭合式钢球磨生料粉磨装置.pdf
罗非鱼皮脱灰脱脂方法.pdf
服务提供方法、装置及服务节点.pdf
模式可调的金属-介质-金属波导.pdf
实用型镶针结构.pdf
利用小麦麸皮红曲霉发酵液制备功能馒头的方法.pdf
新型水力扶正器.pdf
纺织用烘干装置.pdf
基于纺织加工用印染设备.pdf
生态环境遥感监测系统.pdf
全自动锁体.pdf
能预设铣刨长度的手推铣刨机.pdf
机械加工用打孔装置.pdf
无极紫外线杀菌灯.pdf