章节 01
SeismicID: 印尼地震概率预测系统核心导读
SeismicID 是基于 FastAPI 开发的印尼地震概率预测系统,整合 USGS 和 BMKG 数据,采用 XGBoost 与 LightGBM 集成模型,结合断层距离、板块深度等物理特征与地震学特征,提供 7/14/30/60 天多时间窗口的地震风险概率预测。项目由 erzanugroho 维护,开源于 GitHub,旨在通过数据科学与机器学习辅助识别高风险区域,强调科学严谨性与概率解释的准确性。
正文
SeismicID 是一个基于 FastAPI 的印尼地震概率预测系统,整合 USGS 和 BMKG 数据,使用 XGBoost 和 LightGBM 集成模型,结合断层距离、板块深度等物理特征,提供 7/14/30/60 天多时间窗口的地震风险预测。
章节 01
SeismicID 是基于 FastAPI 开发的印尼地震概率预测系统,整合 USGS 和 BMKG 数据,采用 XGBoost 与 LightGBM 集成模型,结合断层距离、板块深度等物理特征与地震学特征,提供 7/14/30/60 天多时间窗口的地震风险概率预测。项目由 erzanugroho 维护,开源于 GitHub,旨在通过数据科学与机器学习辅助识别高风险区域,强调科学严谨性与概率解释的准确性。
章节 02
印尼地处环太平洋火山带与阿尔卑斯-喜马拉雅地震带交汇处,地震活动频繁且危害大。传统预警依赖实时监测,SeismicID 则聚焦概率预测,帮助识别未来高风险区域。项目由 erzanugroho 开发,采用 FastAPI 构建后端,整合 USGS(全球数据)与 BMKG(印尼本地数据),注重模型校准、概率解释与不确定性量化,以提升科学严谨性。
章节 03
数据层:采用 Parquet(历史数据)、SQLite(运行时数据)、Geo数据(行政区划与俯冲带);数据源为 USGS ComCat(主)与 BMKG TEWS(补充),含去重清洗流程。 空间模型:印尼区域划分为 0.5°×0.5° 网格(约3000单元格),关联省份与子区域。 特征工程:25+特征,含地震学特征(多窗口b值、Mc估计、事件间隔等)与物理特征(断层距离/类型/滑动速率、俯冲带深度等)——物理特征是重要创新,融合地质学知识提升可解释性。
章节 04
多任务框架:同时预测4时间窗口(7/14/30/60天)×4震级阈值(M≥4.5/5.0/5.5/6.0),每个网格生成16个概率结果。 集成策略:三层集成——基础层(XGBoost+LightGBM)、基线层(泊松过程/ETAS-Ogata)、融合层(加权平均+贝叶斯融合),结合非线性拟合与物理可解释性。 校准与评估:采用 Platt缩放、等渗回归、Beta校准(选最优Brier分数);评估指标含ROC-AUC、Brier分数、可靠性图等,确保概率输出的频率意义。
章节 05
微服务架构:双服务模式——Web服务(公共API+UI,只读缓存保障高并发)、Worker/Cron服务(数据获取、模型推理、预测更新,共享数据卷)。 自动更新:每10分钟检查新事件,5分钟防抖防重复计算,3小时兜底重算确保数据新鲜。 降级策略:三级降级(ML集成→ETAS-Ogata→泊松基线→物理感知演示数据),保证故障时仍有可用信息。
章节 06
SeismicID 明确其输出为相对风险排序的概率预测,非确定性预警:低概率≠安全,高概率≠必然发生;决策需参考BMKG等官方预警。项目经科学审计改进,包括多窗口b值计算、Mc估计、Reasenberg去簇算法等,确保方法论合理。
章节 07
SeismicID 为多场景提供辅助工具:
章节 08
技术亮点:1. 物理信息特征融入(领域知识+ML提升可解释性);2. 概率校准(确保输出准确性);3. 多级降级(系统可靠性);4. 科学透明(模型卡片、解释指南、局限性说明)。 启示:自然灾害预测项目应重视领域知识融入、概率校准、系统可靠性设计,以及诚实说明局限性,为AI在科学与公共安全领域的负责任应用提供参考。