中国地震局工程力学研究所科研亮点：基于可解释集成学习的实时地震烈度预测框架

最新科研动态

科研动态

科研亮点：基于可解释集成学习的实时地震烈度预测框架
发布时间：2023/07/03

研究背景：

破坏性地震可能造成严重的工程破坏和人员伤亡。地震烈度代表了对地面和工程结构的破坏程度。可靠、快速地获取地震烈度可以为应急响应和灾害恢复提供科学依据。在地震预警领域，地震烈度已被使用多年。现地地震预警系统根据P波到来后获得的信息预测地动峰值，在破坏性横波（S波）到来之前提供预警；这使得人们、重要设施和其他物体能够采取有效措施，防止或减少潜在的损害。针对不同需求的用户，地震预警系统根据预测的地震烈度等级不断发布不同的预警信息，以减少地震和次生灾害造成的损失和人员伤亡。因此，有必要对地震烈度进行准确可靠的实时预测。

研究方法及结果：

提出了一个准确、可靠、高效的地震烈度实时预测框架，以解决传统方法（如Pd）拟合能力不足、机器学习模型中存在不相关和冗余参数、以及机器学习模型因其黑箱状态而可信度低等问题。预测模型的建立是基于K-NET数据库和集合学习。然后，研究了特征参数之间的关联性，并对复杂的模型进行了优化。此外，本研究通过使用PDP、ICE和SHAP解释方法解释机器学习模型。得到了以下结论。

1）提出的实时地震烈度预测框架可以连续可靠地预测地震烈度。该框架通过构建数据库、建立和优化模型、验证和解释模型、使用最佳模型进行预测等四个步骤，确保了连续地震烈度预测的准确性和可靠性。

2）提出的基于集合学习的模型比P_d模型更准确，而且同样有效。在时间窗口为1秒的情况下，测试集的准确率可以达到95.947%，在时间窗口为2秒后，其准确率稳定在98%以上。相比之下，在3秒的时间窗口下，xgBoost模型在所有评价指标上都优于P_d模型。此外，每个样本的预测可以在10^-2秒内完成，满足地震预警的实时性要求。

3）消除了冗余和不相关参数的模型实现了复杂性的降低和模型效率的提高。采用皮尔逊相关系数定义特征参数之间的相关性，并将24个特征参数根据其相关程度优化为14个特征参数。这就减少了计算量，优化了模型，同时保证了模型的准确性。

4）对具有最优效果的xgBoost模型进行了解释，提高了黑箱模型的可信度，并确定了对模型有重大影响的参数，为特征参数的选择提供了参考。用PDP、ICE和SHAP方法对模型进行解释，确定参数的重要程度，同时确定参数变化对预测结果的影响。Pv_UD对模型影响最大, Pv_UD和IV2₃主要是与IaUD正向影响；Pv_UD和IV2₃之间的正向影响不显著。

该成果发表在国际期刊《Seismological Research Letters》（Jinjun Hu*, Yitian Ding, Hui Zhang, et al. A Real‐Time Seismic Intensity Prediction Framework Based on Interpretable Ensemble Learning, Seismological Research Letters, doi: 10.1785/0220220167）（IF：3.754，*通讯作者）。

图1 3秒时间窗下的预测值和观测到的地震烈度的比较，时间表示时间窗的大小。灰色区域是正确的预测值，蓝色区域是高估的预测值，黄色区域是低估的预测值。绿点表示（a）P_d模型，红三角表示（b）xgBoost模型。

图2 震中距和预警时间之间的关系。数据点的颜色代表地震烈度

图3 (a)基于SHAP值的参数的全局重要性排名。(b) 不同参数的SHAP汇总图，数据点的颜色从蓝色（低）到红色（高）过渡代表参数的低值到高值。

图4 每个模型对不同烈度范围的实时预测性能。绿色的蓝线和红线表示CART RF和xgBoost模型的实时预测，黄色的虚线表示观察到的实时烈度，水平红线表示观察到的最大烈度。时间T表示实时烈度达到最大值的时刻。