# Aeris：基于时间分段机器学习的智能空气质量监测与异常检测系统

> Aeris 是专为印尼泗水市设计的空气质量预测系统，采用 PyCaret AutoML 和 Isolation Forest 实现 3 小时污染预测与实时异常检测，遵循 ISPU KLHK 官方标准。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-01T01:45:34.000Z
- 最近活动: 2026-06-01T01:53:51.549Z
- 热度: 150.9
- 关键词: air quality, anomaly detection, PyCaret, Isolation Forest, time-series forecasting, AutoML, environmental monitoring, ISPU
- 页面链接: https://www.zingnex.cn/forum/thread/aeris
- Canonical: https://www.zingnex.cn/forum/thread/aeris
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者：** Kelompok Aeris (Linda Anggara Wati, Yuhanidz Habibah, Intan Azzuhra Permadani) / PENS 2026
- **来源平台：** GitHub
- **原始标题：** aeris-air-quality
- **原始链接：** https://github.com/yuhanidz2325/aeris-air-quality
- **发布时间：** 2026-06-01

## 城市空气污染的时空复杂性

城市空气质量是一个高度动态变化的系统，其污染模式随时间呈现显著差异。以印尼泗水市为例，不同时段的空气污染特征截然不同：早高峰时段，车辆尾气和温度逆温效应导致 PM2.5 浓度飙升；中午高温强光条件下，臭氧生成反应加速，O3 浓度急剧上升；傍晚至夜间，交通晚高峰叠加夜间逆温，污染物在低空层堆积。

传统的空气质量预测系统往往采用单一模型覆盖全天，忽视了这些时间维度上的特征差异，导致预测精度受限。如何捕捉并建模这些时变规律，成为提升空气质量预测准确性的关键。

## Aeris 项目概述

Aeris 是由泗水电子理工学院 (PENS) 2026 届数据科学专业学生开发的毕业设计项目，专为泗水市打造的智能空气质量监测与预测系统。该系统采用创新的时间分段机器学习策略，针对不同时间段训练专门的预测模型，显著提升了预测精度。

项目团队包括数据与机器学习工程师 Linda Anggara Wati、后端与 DevOps 工程师 Yuhanidz Habibah、以及 UI/UX 设计师与前端开发者 Intan Azzuhra Permadani。三人分工协作，在 5 周内完成了从数据收集到系统部署的全流程开发。

## 核心创新：时间分段建模

Aeris 的核心创新在于将一天划分为三个具有独特污染特征的时间段，并为每个时间段训练专门的预测模型：

**早晨时段 (06:00-11:59)**：对应早高峰通勤和温度逆温现象，PM2.5 浓度通常较高。

**中午时段 (12:00-17:59)**：高温、强紫外线和活跃气流条件下，臭氧生成反应占主导，O3 成为主要污染物。

**傍晚/夜间时段 (18:00-05:59)**：晚高峰交通和夜间逆温导致污染物在低空堆积，多种污染物浓度同步上升。

基于这一洞察，Aeris 为每个污染物参数 (PM2.5、PM10、CO、NO2、O3) 分别训练了三个时段专用模型，总计 15 个预测模型协同工作。系统根据当前时间自动选择对应的模型进行预测，实现了时间感知的精准预报。

## 技术架构

Aeris 采用现代化的分层架构设计：

**数据层**：PostgreSQL 数据库存储城市信息、原始空气质量数据、预测结果、异常检测结果和模型版本信息。

**机器学习层**：PyCaret AutoML 框架自动比较 15 种算法，为每个污染物参数和时段组合选择最优模型；Isolation Forest 并行运行，实现实时异常检测。

**后端 API**：基于 FastAPI 构建的 RESTful API，提供状态查询、历史数据、预测、ISPU 计算、异常检测和模型重训练等 6 个核心端点。

**前端界面**：HTML/CSS/JavaScript 实现的响应式仪表板，集成 Chart.js 实现数据可视化，支持桌面、平板和手机访问。

**调度系统**：APScheduler 负责每小时从 Open-Meteo API 获取最新数据，以及每周自动重训练模型。

## 特征工程与数据 pipeline

Aeris 的数据 pipeline 设计精细，从原始数据中提取了 21 维特征：

**时间特征**：小时、星期、月份、是否周末、时段标签，捕捉周期性规律。

**滞后特征**：各污染物的 1 小时、3 小时、24 小时滞后值，建模时间序列的自相关性。

**滚动统计**：3 小时和 24 小时滚动均值、标准差、最大值，平滑短期波动并捕捉趋势。

**变化率特征**：1 小时差值和百分比变化，检测突发污染事件。

**气象特征**：温度、湿度、风速、风向、降水量，作为外部影响因素。

**ISPU 特征**：基于 KLHK 标准的 ISPU 计算值和等级标签，作为目标变量的参考。

## ISPU 标准与可视化

Aeris 严格遵循印尼环境部 (KLHK) 2020 年第 14 号部长令规定的 ISPU 标准，将空气质量分为六个等级：

- **良好 (0-50)**：绿色标识，无健康风险
- **中等 (51-100)**：蓝色标识，敏感人群开始受影响
- **不健康 (101-200)**：黄色标识，所有人开始出现健康影响
- **极不健康 (201-300)**：红色标识，健康紧急警告
- **危险 (>300)**：黑色标识，全体居民严重受影响

系统仪表板采用对应的颜色编码，直观展示当前空气质量状态，并在 ISPU 达到不健康或危险等级时自动触发警告通知。

## AutoML 与模型选择

Aeris 使用 PyCaret 的 AutoML 能力自动比较 15 种回归算法，包括随机森林、XGBoost、LightGBM、CatBoost、Extra Trees、岭回归、KNN、决策树等。系统为每个污染物参数和时段组合选择表现最佳的模型，并记录其性能指标。

这种自动化的模型选择流程确保了预测性能的最优化，同时 MLflow 集成实现了实验追踪和模型版本管理，支持模型的可追溯性和回滚能力。

## 异常检测机制

与预测模型并行运行的是基于 Isolation Forest 的异常检测模块。该模块不预测未来值，而是判断当前观测值是否异常，识别突发污染事件或传感器故障。

异常检测与预测模型互补：预测回答"3 小时后 PM2.5 会是多少"，异常检测回答"当前的 PM2.5 读数是否正常"。两者结合为空气质量管理提供了全面的数据支持。

## 部署与运维

Aeris 采用 Docker 容器化部署，支持一键启动所有服务。系统设计了自动重训练机制，每周使用最新数据更新模型，确保预测性能不随时间衰减。

对于希望自定义部署的用户，项目提供了详细的本地开发指南，支持手动配置 Python 环境、PostgreSQL 数据库和前端服务器。

## 社会价值与前景

Aeris 的开发团队以 "Udara Bersih, Masa Depan Cerah - Deteksi Dini untuk Langkah Cerdas"（清洁空气，光明未来——早期检测，明智行动）为项目口号，体现了技术服务社会的理念。

该系统不仅适用于泗水市，其时间分段建模思路可推广至其他具有类似污染模式的城市。随着全球对空气质量关注度的提升，这类智能监测系统将发挥越来越重要的作用。

## 结语

Aeris 展示了机器学习在环境科学领域的务实应用。通过时间分段建模、AutoML 自动选型和完整的工程实现，项目团队构建了一个可落地、可扩展、可维护的空气质量监测解决方案。这种将学术研究与工程实践相结合的项目，正是数据科学教育的理想产出。
