章节 01
StormSense项目导读:解决天气预测类别不平衡的实战方案
StormSense是Tyler Lewinski开发的基于随机森林的天气预测模型,专注于解决天气数据中类别不平衡问题(如雾天等稀有天气)。通过特征工程(时间序列滚动统计)、SMOTE技术及时间感知的训练测试划分,提升稀有天气条件的预测准确率,为航空、交通等领域提供更实用的预测支持。
正文
一个专注于解决天气预测中类别不平衡问题的机器学习项目,通过特征工程和SMOTE技术提升稀有天气条件(如雾天)的预测准确率。
章节 01
StormSense是Tyler Lewinski开发的基于随机森林的天气预测模型,专注于解决天气数据中类别不平衡问题(如雾天等稀有天气)。通过特征工程(时间序列滚动统计)、SMOTE技术及时间感知的训练测试划分,提升稀有天气条件的预测准确率,为航空、交通等领域提供更实用的预测支持。
章节 02
天气数据通常呈现长尾分布(雨天/晴天常见,雾天稀有),朴素模型虽整体准确率高,但对稀有天气预测能力差。这些稀有天气(如雾天)对航空、交通等场景至关重要,StormSense项目直面这一挑战,不追求虚高整体准确率,聚焦提升稀有类别的预测性能。
章节 03
章节 04
测试集整体准确率84%(含雾天),排除雾天则达94%;各类别F1分数:雨天0.97、晴天0.84、雾天0.38。雾天F1较低因真实样本稀缺,SMOTE虽有帮助但无法创造新的模式。
章节 05
章节 06
当前局限:仅适用于西雅图、特征单一、雾天预测待提升;改进方向:集成卫星/雷达数据、尝试XGBoost/深度学习、使用Borderline-SMOTE等变体、多模型集成。