# SCAle-BEM：基于多智能体大语言模型的多模态建筑能耗自动建模框架

> SCAle-BEM是一个创新性的多模态框架，利用视觉语言模型和大语言模型，从建筑图纸、草图、平面图等多种视觉输入中自动提取信息并生成建筑能耗模型，通过自洽性和交叉一致性验证机制确保模型准确性。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-30T19:44:47.000Z
- 最近活动: 2026-05-30T19:52:30.575Z
- 热度: 150.9
- 关键词: 建筑能耗建模, 大语言模型, 视觉语言模型, 多模态AI, 智能体, 自动化建模, 可持续建筑, 能源效率
- 页面链接: https://www.zingnex.cn/forum/thread/scale-bem
- Canonical: https://www.zingnex.cn/forum/thread/scale-bem
- Markdown 来源: ingested_event

---

## 原作者与来源

- **原作者/维护者**: Gang Jiang, Jianli Chen
- **来源平台**: GitHub
- **原始标题**: SCAle-BEM: Self- and Cross-Consistent Agentic-LLM-Based Framework for Multimodal Automated Building Energy Modeling
- **原始链接**: https://github.com/Gangjiang1/SCAle-BEM
- **发布时间**: 2026年5月30日

## 背景与动机

建筑能耗建模（Building Energy Modeling, BEM）是评估建筑能源性能、优化设计方案和支持可持续建筑发展的关键技术。传统的建筑能耗建模流程通常需要专业人员手动输入大量建筑几何信息、材料属性、系统配置等参数，这一过程既耗时又容易出错。

随着人工智能技术的发展，研究人员开始探索利用大语言模型（LLM）来自动化建筑能耗建模流程。然而，现有的大多数自动化BEM工作流主要依赖文本输入，无法有效处理建筑图纸、草图、平面图、三维模型等视觉信息。这些视觉材料往往包含了丰富的建筑设计意图和几何信息，是建筑能耗建模的重要数据来源。

## 框架概述

SCAle-BEM（Self- and Cross-Consistent Agentic-LLM-Based Framework）是一个多模态自动化建筑能耗建模框架，由 Gang Jiang 和 Jianli Chen 开发。该框架的核心创新在于将视觉语言模型（VLMs）与大语言模型（LLMs）相结合，通过智能体协作的方式，实现从多模态输入到建筑能耗模型的自动化转换。

与仅支持文本输入的传统ABEM工作流不同，SCAle-BEM专注于从图像、草图、平面图、真实图纸、三维模型/图片和视觉材料中提取建筑几何信息和用户设计意图。框架采用自洽性（self-consistency）和交叉一致性（cross-consistency）机制，以及基于反思的验证方法，确保建筑信息提取的鲁棒性和可靠性。

## 核心组件与工作流程

SCAle-BEM框架由四个主要阶段组成，形成一个完整的智能体协作流水线：

### 1. 视觉解释器（Vision Interpreter）

视觉解释器是框架的第一阶段，负责接收视觉建筑输入（如图片和图纸），并使用视觉语言模型识别建筑形状、提取尺寸信息。该组件支持三种推理模式：

- **基线模式（vanilla）**：单模型推理基线
- **自洽性模式（self_consistency）**：使用单一VLM进行多推理，然后通过自洽性聚合结果
- **交叉一致性模式（cross_consistency）**：跨不同VLM提供商进行多推理，然后通过交叉一致性聚合结果

视觉解释器输出包含解释后的建筑几何信息的结构化用户提示，为后续阶段提供输入。

### 2. 意图抽象器（Intent Abstractor）

意图抽象器接收视觉解释器输出的信息，利用大语言模型和预定义的系统提示，从中抽象出设计意图。该组件生成结构化描述——即中间表示（IR），包括几何信息、构造、空间类型、设定点、设备、暖通空调系统等内容。

生成的结果被保存为JSON文件，供下游建筑模型生成阶段（Building Modeler）使用。

### 3. 物理审查器（Physics Reviewer）

物理审查器基于物理规则和建模约束检查中间表示（IR）。它验证解释后的几何信息、尺寸和组件是否合理，并通过基于反思的反馈机制纠正不一致或物理上无效的输出。这一组件显著提高了自动化建筑模型生成的可靠性。

### 4. 建筑模型生成器（Building Modeler）

建筑模型生成器接收IR描述作为输入，生成建筑模型组件。该组件支持为ABEM生成鲁棒且可扩展的场景，能够处理多种建筑类型和系统配置。

## 支持的建筑建模组件

SCAle-BEM框架可以为以下建筑建模组件生成模型：

### 几何类型
- 矩形建筑、L形建筑、T形建筑、U形建筑
- 空心方形（中庭）建筑
- 单层建筑、多层建筑
- 平屋顶、坡屋顶、人字屋顶
- 窗墙比

### 建筑信息
- 构造和材料
- 空间类型
- 热区
- 恒温器设定点
- 内部负荷
- 时间表
- 空气侧暖通空调系统
- 水侧暖通空调系统

### 暖通空调系统

**空气侧系统包括**：风机盘管系统、变制冷剂流量系统、变风量系统、分体式DX电系统、带风机盘管的DOAS系统、混合系统

**水侧系统包括**：冷水系统、热水系统、冷凝器水系统

## 技术亮点与创新

SCAle-BEM的核心技术创新体现在以下几个方面：

### 多模态输入支持
框架突破了传统ABEM仅支持文本输入的限制，能够处理手绘草图、平面图、真实建筑图纸、三维图片等多种视觉输入，大大扩展了自动化建筑能耗建模的应用场景。

### 自洽性与交叉一致性机制
通过多推理聚合和跨模型验证，框架有效降低了单一模型推理的不确定性，提高了建筑信息提取的准确性和鲁棒性。交叉一致性模式虽然成本更高，但在关键项目中能够提供更可靠的结果。

### 基于反思的LLM验证
物理审查器引入基于反思的验证机制，使大语言模型能够自我检查生成的建筑模型是否符合物理规律和工程常识，这是确保自动化建模结果实用性的关键。

### 智能体协作工作流
框架设计了清晰的智能体协作流程，视觉解释器、意图抽象器、物理审查器和建筑模型生成器各司其职，形成完整的自动化流水线。

## 应用场景与使用方式

SCAle-BEM适用于以下场景：

- **建筑设计初期评估**：建筑师可以从草图或概念图快速生成能耗模型，评估不同设计方案的能源性能
- **既有建筑分析**：从真实建筑图纸或照片提取信息，建立能耗模型进行改造分析
- **建筑能耗审计**：自动化处理大量建筑数据，提高审计效率
- **研究与教育**：为建筑能耗建模研究提供自动化工具，降低入门门槛

使用框架时，用户需要将输入图像放入指定的输入文件夹（如Standard_Test、Hand_Sketch、Floor_Plan、Real_Drawing、3D_Picture等），支持PNG、JPG、JPEG、WEBP等格式。如果输入是PDF文件，需要先运行utility_pdf2image.ipynb将其转换为高分辨率PNG图像。

## 局限性与注意事项

作为研究原型，SCAle-BEM有以下需要注意的地方：

- **模型依赖性**：输出结果会因所选LLM和VLM、图像质量、提示设计和推理模式而有较大差异
- **成本考量**：交叉一致性模式虽然更鲁棒，但需要更多API调用，可能导致更高成本
- **实验性质**：共享代码专为研究和实验ABEM工作流设计，生产环境使用前需要充分验证

## 总结与展望

SCAle-BEM代表了建筑能耗建模自动化的一个重要进展，它展示了多模态AI技术在传统工程领域的应用潜力。通过将视觉语言模型与大语言模型相结合，并引入自洽性和交叉一致性验证机制，框架为从非结构化视觉数据自动生成结构化建筑能耗模型提供了可行路径。

随着视觉语言模型和大语言模型能力的持续提升，以及多智能体协作框架的成熟，类似SCAle-BEM的自动化工具将在建筑设计和能源分析领域发挥越来越重要的作用，帮助建筑师和工程师更高效地评估和优化建筑能源性能。
