# 利用图神经网络预测城市地表温度的开源项目

> 本文介绍了一个基于图卷积网络（GCN）的城市地表温度时空预测系统，该项目整合了卫星遥感、气象数据和城市形态指标，为城市热环境监测提供了创新解决方案。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-04T10:45:37.000Z
- 最近活动: 2026-06-04T10:48:37.719Z
- 热度: 163.9
- 关键词: 图神经网络, 地表温度预测, 城市热岛, 遥感, 机器学习, 深度学习, 时空预测, GCN, Landsat, Sentinel-3
- 页面链接: https://www.zingnex.cn/forum/thread/geo-github-liborom-urban-lst-prediction-gnn
- Canonical: https://www.zingnex.cn/forum/thread/geo-github-liborom-urban-lst-prediction-gnn
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者**: Liborio Román Montes（LiboRom）
- **来源平台**: GitHub
- **原项目标题**: urban-lst-prediction-gnn
- **原始链接**: https://github.com/LiboRom/urban-lst-prediction-gnn
- **发布时间**: 2026年6月4日

---

## 项目背景与意义

随着全球城市化进程的加速，城市热岛效应已成为影响居民生活质量和城市可持续发展的重要环境问题。准确预测城市地表温度（Land Surface Temperature, LST）对于城市规划、能源管理和公共健康具有重要意义。传统的气象预测方法往往难以捕捉城市内部复杂的微气候特征，而机器学习技术的引入为解决这一难题提供了新的思路。

本项目由塞维利亚大学人工智能硕士学位的 Liborio Román Montes 开发，作为其硕士论文的核心成果。项目创新性地将图神经网络（Graph Neural Networks, GNN）应用于城市地表温度的时空预测，通过整合多源遥感数据和城市形态指标，构建了一个高精度的预测系统。

---

## 技术架构与数据来源

### 多源数据融合

该项目的核心优势在于整合了多种异构数据源，构建了一个全面的城市环境数据集：

**卫星遥感数据**
- **Landsat 8/9**: 提供地表温度（LST）、归一化植被指数（NDVI）和地表特征数据，通过 Google Earth Engine 平台获取
- **Sentinel-3**: 提供额外的地表温度观测数据，用于降尺度实验（downscaling），从 Copernicus Data Space Ecosystem 获取

**气象数据**
- **ERA5-Land**: 提供气温、相对湿度、太阳辐射、风速和降水量等关键气象变量，来自欧洲中期天气预报中心（ECMWF）的再分析数据集

**城市形态数据**
- **CNIG**: 西班牙国家地理信息中心提供的数字高程模型（DEM）和城市形态变量
- **OpenStreetMap**: 建筑物相关指标和城市几何描述符

### 图结构建模

项目采用图结构来表示城市空间关系。研究区域（塞维利亚市区）被离散化为规则的空间网格，每个节点代表一个城市位置，边连接相邻节点。这种建模方式使得图卷积网络能够有效利用空间依赖性，捕捉城市热环境的邻域效应。

---

## 模型设计与对比实验

### 核心模型架构

项目实现了多种深度学习模型，并进行了系统性的对比评估：

**图神经网络模型**
- **GCN（图卷积网络）**: 基础图神经网络模型，通过谱域卷积聚合邻域信息
- **GCN + GRU**: 时空图模型，结合图卷积捕捉空间特征和门控循环单元建模时间依赖
- **GraphSAGE**: 归纳式图神经网络，支持对新节点的推理

**传统深度学习基线**
- **LSTM（长短期记忆网络）**: 经典的循环神经网络变体，擅长捕捉长期时间依赖
- **GRU（门控循环单元）**: LSTM 的简化版本，计算效率更高

**机器学习基线**
- **XGBoost**: 梯度提升决策树算法，作为非神经网络的性能基准

### 评估指标

模型性能通过以下指标进行评估：
- **RMSE（均方根误差）**: 衡量预测值与真实值的偏差
- **MAE（平均绝对误差）**: 反映预测的平均误差幅度
- **R²（决定系数）**: 评估模型解释数据变异的能力
- **MAPE（平均绝对百分比误差）**: 提供相对误差的直观度量

---

## 技术实现与实验框架

### 代码结构

项目采用 Jupyter Notebook 作为主要开发环境，包含两个核心文件：

**TFM_LIBORIO_v2.ipynb**
这是主笔记本，涵盖了完整的研究流程：
- 数据获取与预处理
- 图结构构建
- Sentinel-3 降尺度处理流程
- 各模型实现
- 评估程序

**training_automatization.ipynb**
专用于自动化实验的笔记本，支持：
- 超参数研究
- 消融实验
- 多随机种子评估
- 模型对比分析

### 依赖环境

项目依赖 Python 3.x 环境，主要依赖包括：
- PyTorch 或 TensorFlow（深度学习框架）
- PyTorch Geometric 或 DGL（图神经网络库）
- Google Earth Engine Python API
- XGBoost
- NumPy、Pandas、Scikit-learn（数据处理）

### 外部服务集成

项目需要接入多个外部数据服务：
1. **Google Earth Engine**: 用于 Landsat 数据获取和处理
2. **Copernicus Data Space Ecosystem**: 用于 Sentinel-3 产品下载
3. **ERA5-Land 档案**: 通过 CDS API 获取气象数据
4. **CNIG 服务**: 获取西班牙地理数据

---

## 研究贡献与应用价值

### 学术贡献

本项目的核心创新在于将图神经网络引入城市气候建模领域。传统的像素级或网格化方法往往忽略了城市空间单元之间的相互影响，而图结构建模能够显式地编码这些空间依赖关系。实验结果表明，GCN 及其变体在捕捉城市热环境的局部特征方面具有显著优势。

### 实际应用

该研究成果可应用于多个领域：
- **城市规划**: 识别城市热岛高风险区域，指导绿地布局和建筑设计
- **能源管理**: 预测制冷需求峰值，优化电网调度
- **公共健康**: 预警极端高温事件，保护脆弱人群
- **气候变化研究**: 评估城市热环境对气候变化的响应

### 方法论启示

项目展示了多源数据融合和跨学科方法在环境科学中的潜力。通过整合遥感技术、气象学和机器学习，研究者能够构建更加鲁棒和可解释的预测模型。这种数据驱动的研究方法为城市气候科学开辟了新的方向。

---

## 局限性与未来方向

### 当前局限

- **数据依赖**: 完整复现需要多个外部数据服务的访问权限，包括 Google Earth Engine 和 Copernicus Data Space
- **计算资源**: 大规模图神经网络的训练需要较高的计算资源
- **地理局限**: 当前实验仅针对塞维利亚市区，模型在其他气候区的泛化能力有待验证

### 未来改进

- 引入注意力机制（GAT）增强模型对关键空间关系的建模能力
- 探索时空图卷积网络（ST-GCN）等更先进的架构
- 扩展到更多城市，构建通用的城市热环境预测框架
- 结合物理约束，开发物理信息神经网络（PINN）版本

---

## 结语

Liborio Román Montes 的这项研究代表了图神经网络在城市环境科学中的成功应用。通过创新的数据融合策略和严谨的模型对比，项目不仅提供了高精度的预测工具，也为该领域的后续研究奠定了方法论基础。随着城市气候挑战日益严峻，这类开源项目将为全球研究者和城市规划者提供宝贵的技术资源。
