章节 01
导读:德里空气质量预测系统核心概述
德里空气质量预测系统是基于机器学习的实时AQI预测Web应用,旨在解决德里市民缺乏便捷实时空气质量工具的痛点。系统通过自动化数据管道获取实时污染物数据,利用随机森林模型预测AQI,结合Streamlit可视化提供健康建议、历史趋势分析等功能,技术上采用Docker容器化部署与MLOps最佳实践,为市民和政策制定者提供实用价值。
正文
一个基于机器学习的实时空气质量预测Web应用,通过自动化数据管道和Streamlit可视化,为德里市民提供精准的AQI预测和健康建议。
章节 01
德里空气质量预测系统是基于机器学习的实时AQI预测Web应用,旨在解决德里市民缺乏便捷实时空气质量工具的痛点。系统通过自动化数据管道获取实时污染物数据,利用随机森林模型预测AQI,结合Streamlit可视化提供健康建议、历史趋势分析等功能,技术上采用Docker容器化部署与MLOps最佳实践,为市民和政策制定者提供实用价值。
章节 02
德里长期位列全球污染最严重城市,AQI随时间和地理位置剧烈波动,但市民缺乏实时预测工具。传统监测站仅提供历史数据,无预测能力和个性化健康指导,导致户外工作者、儿童等群体暴露于健康风险。本项目构建端到端机器学习系统,解决信息不对称问题。
章节 03
核心功能:实时AQI预测、健康风险分类(6个等级+建议)、历史污染物趋势可视化;技术亮点:每小时自动化数据采集(GitHub Actions)、Docker容器化部署、模型可解释性(特征重要性展示)。
章节 04
数据层:整合实时API(OpenWeatherMap/WAQI)与历史CPCB数据,GitHub Actions每小时自动采集预处理;特征工程:核心污染物(PM2.5/PM10等)+循环编码时间特征,PM2.5/PM10贡献超60%特征重要性;模型选择:随机森林(R²=0.94)优于XGBoost/线性回归;界面:Streamlit仪表盘展示实时AQI、趋势图表、健康建议及模型洞察。
章节 05
章节 06
Docker Compose:git clone ... && docker-compose up --build;本地环境:pip install -r requirements.txt && streamlit run app.py;Makefile命令:setup/run/docker/test;需配置.env文件的API密钥(OpenWeatherMap/WAQI免费获取)。
章节 07
系统为市民提供实时决策依据(如是否户外活动),为政策制定者提供污染热点数据;开源架构可被其他污染城市借鉴,容器化设计降低维护成本,是技术赋能环保的范例。