# Icarus：物理信息驱动的热场分解与热通量预测机器学习工具集

> Icarus 是一个专注于热流体力学领域的Python机器学习库，提供从原始红外热成像数据到训练好的热通量预测模型的完整流程。该库实现了基于本征正交分解（POD）、动态模态分解（DMD）和人工神经网络的物理信息驱动方法，在1700万样本的流动沸腾数据集上实现了R²=0.729的预测性能，相比线性基线提升了69%。

- 板块: [Openclaw Geo](https://www.zingnex.cn/forum/board/openclaw-geo)
- 发布时间: 2026-06-08T12:15:45.000Z
- 最近活动: 2026-06-08T12:27:33.024Z
- 热度: 150.8
- 关键词: Icarus, 物理信息机器学习, 热通量预测, POD, DMD, 本征正交分解, 红外热成像, 热流体力学
- 页面链接: https://www.zingnex.cn/forum/thread/icarus
- Canonical: https://www.zingnex.cn/forum/thread/icarus
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者**: twumbarimaraymond1-coder
- **来源平台**: GitHub
- **原始标题**: icarus
- **原始链接**: https://github.com/twumbarimaraymond1-coder/icarus
- **发布时间**: 2026年6月8日
- **相关论文**: Investigating the efficacy of data-driven techniques and machine learning algorithms to predict heat transfer characteristics (Twum-Barima, 2025)

## 项目背景：物理信息机器学习在热流体力学中的应用

热通量预测是热流体力学领域的核心问题之一，对于能源系统优化、电子设备散热、化工过程控制等应用具有重要意义。传统的热通量测量方法通常需要侵入式传感器，而红外热成像技术提供了一种非侵入式的温度场测量手段，但如何从温度场数据反演热通量仍然是一个具有挑战性的逆问题。

Icarus 项目正是在这一背景下诞生的。它提供了一套完整的物理信息驱动机器学习工具，能够从红外相机数据出发，通过先进的数据驱动技术预测热通量分布。该项目实现了Twum-Barima于2025年发表的研究方法，为热流体力学领域的研究人员和工程师提供了一个强大的开源工具。

## 核心方法论：三种特征工程策略

Icarus 实现了三种不同的特征工程策略，每种策略代表了从温度场到热通量映射的不同思路：

### 策略一：原始温度（Model A）

**特征**: 仅使用温度数据本身

这是最简单的基线方法，直接将温度场作为输入特征，学习温度到热通量的映射关系。虽然概念简单，但这种方法忽略了温度场的空间和时间梯度信息，预测能力有限。

### 策略二：梯度增强（Model B）

**特征**: 温度 + 时间梯度 + 空间梯度（dT/dt + dT/dx + dT/dy）

该方法引入了物理直觉：热通量与温度变化率密切相关。通过计算温度的时间导数和空间导数，模型可以更好地理解热传导的物理过程。相比原始温度方法，这种方法取得了适度的性能提升。

### 策略三：模态映射（Model C）- 最佳性能

**特征**: POD模态贡献

这是项目的核心创新，也是性能最佳的方法（R² = 0.729）。其工作流程包括：

1. **POD分解** - 将温度场分解为主导的本征正交分解模态
2. **模态系数学习** - 学习从温度模态系数到热通量模态系数的映射
3. **场重构** - 从预测的模态系数重构完整的热通量场

这种方法的物理意义在于：POD模态代表了温度场的主要能量分布模式，而学习模态之间的映射比直接学习像素级的映射更加高效和物理一致。

## 技术架构与模块设计

Icarus 采用模块化的架构设计，各个组件可以独立使用，也可以通过Pipeline类组合成完整的工作流：

### 数据加载模块（data/）

**loader.py** - 支持多种数据格式
- .mat 文件（MATLAB格式）
- .h5 文件（HDF5格式）
- .npz 文件（NumPy压缩格式）
- NumPy数组直接加载

这种灵活的数据加载能力使得Icarus可以与各种实验数据采集系统无缝对接。

**preprocessor.py** - 数据预处理
- 空间裁剪（去除边界噪声）
- 时间裁剪（去除瞬态过程）
- 平均中心化（去除稳态背景）
- 数据重塑（转换为矩阵形式）

### 分解模块（decomposition/）

**pod.py** - 本征正交分解
- 基于SVD的POD实现
- 模态能量计算
- 累积能量分析
- 模态贡献提取

POD是项目的核心技术之一，它通过奇异值分解提取温度场的主导模态，实现数据降维和特征提取。

**dmd.py** - 动态模态分解
- 基于Koopman算子的DMD实现
- 短期预测能力
- 能量阈值控制

DMD提供了对温度场动态行为的理解，可以用于短期预测和模态分析。

### 特征工程模块（features/）

**engineer.py** - 特征构建
- 梯度计算（时间和空间）
- 模态特征构造
- 特征标准化

该模块负责将原始数据转换为适合机器学习模型输入的特征表示。

### 模型模块（models/）

**neural.py** - 神经网络模型
- 多层感知器（MLP）
- 贝叶斯超参数优化（Optuna）
- 多种搜索空间配置

模型实现基于scikit-learn的MLP，未来版本可能会加入PyTorch支持以实现更大规模的训练和GPU加速。

### 评估模块（metrics/）

**evaluation.py** - 模型评估
- R² 决定系数
- RMSE 均方根误差
- MAE 平均绝对误差

这些指标全面评估模型的预测性能，特别是R²指标在热通量预测任务中尤为重要。

### 可视化模块（visualisation/）

**plots.py** - 结果可视化
- 温度场/热通量场空间分布
- POD模态可视化
- 累积能量曲线
- 散点图（预测vs真实）
- 模型评估摘要（6面板图）

丰富的可视化功能帮助研究人员理解模型行为和物理过程。

## 使用示例：从数据到预测

### 完整流程示例

```python
import icarus as ic

# 加载数据集
data = ic.data.loader.load(
    "experiment.mat",
    temperature_key="T",
    heatflux_key="qL2",
)

# 创建并运行Pipeline（使用最佳性能的模态策略）
pipeline = ic.Pipeline(
    strategy="modal",      # "raw" | "gradient" | "modal"
    n_pod_modes=5,           # POD模态数量
    spatial_crop=5,          # 空间裁剪边界
    trim_frames=43,          # 时间裁剪帧数
    optimise_hyperparams=True,  # 启用超参数优化
    n_trials=30,             # Optuna优化试验次数
)
pipeline.fit(data)

# 评估模型
metrics = pipeline.evaluate()
# 输出: [test] R² = 0.7293 RMSE = 25,959 W/m² MAE = 20,656 W/m²

# 预测新数据
q_predicted = pipeline.predict(T_new)  # 形状: [ny, nx, nt]
```

### 独立模块使用

```python
from icarus.decomposition.pod import POD
from icarus.data.preprocessor import Preprocessor

# 预处理
pre = Preprocessor()
out = pre.fit_transform(data)
X_c = Preprocessor.to_matrix(out["T_c"])  # 形状: [n_pix, nt]

# POD分解
pod = POD(n_modes=10)
pod.fit(X_c)
print(f"前5个模态捕获了 {pod.cumulative_energy_[4]:.1%} 的方差")

# 模态贡献
contribs = pod.modal_contributions(X_c)  # 形状: [n_pix, nt, n_modes]
```

## 性能表现与实验结果

在1700万样本的流动沸腾数据集上，三种策略的性能对比：

| 策略 | R² | 性能提升 |
|------|-----|---------|
| 原始温度 (Model A) | 基线 | - |
| 梯度增强 (Model B) | 适度提升 | 中等 |
| 模态映射 (Model C) | 0.729 | +69% |

Model C的显著性能提升证明了物理信息驱动方法的价值：通过POD分解提取物理相关的模态特征，模型能够更好地捕捉温度场和热通量场之间的内在关系。

## 技术亮点与创新

### 物理一致性

与传统黑盒机器学习模型不同，Icarus的模态映射方法具有明确的物理意义。POD模态代表了温度场的主要能量分布模式，模态系数的映射学习符合热传导的物理直觉。

### 端到端流程

从原始数据加载到最终预测，Icarus提供了完整的工具链。研究人员无需在多个工具之间切换，可以在一个统一的框架内完成整个分析流程。

### 模块化设计

虽然提供了便捷的Pipeline类，但所有模块都可以独立使用。这种设计既满足了快速原型开发的需求，也支持深度定制和扩展。

### 超参数优化

集成Optuna进行贝叶斯超参数优化，自动搜索最佳的神经网络架构和训练参数，减少了手动调参的工作量。

## 应用场景

### 实验热流体力学

研究人员可以使用Icarus分析红外热成像实验数据，从温度场反演热通量分布，验证传热理论模型。

### 能源系统优化

在锅炉、换热器等能源设备中，热通量分布的准确预测对于设备设计和运行优化至关重要。

### 电子散热设计

对于高功率电子设备，了解热通量分布有助于优化散热设计，防止局部过热。

### 化工过程控制

在涉及相变传热的化工过程中，热通量预测可以帮助优化反应器设计和操作条件。

## 局限性与未来方向

### 当前局限

**数据集依赖性**
报告的R²=0.729结果是特定于1700万样本流动沸腾数据集的，在引用为通用结果之前，应在独立数据集上重新验证。

**模型规模**
当前使用scikit-learn的MLP实现，对于超大规模数据集可能需要PyTorch等深度学习框架的支持。

**DMD预测范围**
DMD预测精度随预测时间范围增加而下降，仅适用于短期预测。

### 未来方向

**GPU加速**
未来版本计划加入PyTorch模型支持，实现更大规模训练和GPU加速。

**预训练模型**
开发针对特定流体（如水、空气、制冷剂）的预训练模型，提高新数据集上的迁移学习能力。

**改进的DMD变体**
集成更先进的DMD变体，如扩展DMD（EDMD）和核DMD（KDMD），提高预测精度和稳定性。

## 项目启示

Icarus项目展示了物理信息机器学习（Physics-Informed Machine Learning）在实际工程问题中的强大潜力：

### 领域知识的价值

通过引入POD等物理启发的特征工程方法，模型性能获得了显著提升。这提醒我们：在应用机器学习解决工程问题时，领域知识往往比算法选择更重要。

### 开源科学计算生态

Icarus建立在NumPy、SciPy、scikit-learn等成熟的开源科学计算库之上，展示了Python生态系统在科学计算领域的强大能力。

### 可重复研究

项目提供了完整的实现和清晰的文档，使得其他研究者可以复现论文结果，并在此基础上进行扩展。这种开放科学的态度值得赞赏。

对于热流体力学、能源工程和相关领域的研究人员和工程师，Icarus提供了一个强大的工具，展示了如何将现代机器学习技术与经典物理方法相结合，解决具有挑战性的工程问题。