正文

GAR：面向LLM推理的碳感知路由优化框架

谷歌研究团队提出GAR框架，将碳排放纳入LLM推理路由决策，在保持准确率和延迟SLA的前提下实现显著碳减排，为绿色AI推理提供理论基础和实践方案。

绿色AILLM推理碳感知路由多目标优化可持续发展模型路由

发布时间 2026/05/12 14:32最近活动 2026/05/13 10:24预计阅读 2 分钟

章节 01

【导读】GAR：面向LLM推理的碳感知路由优化框架核心介绍

谷歌研究团队提出GAR（绿色感知路由）框架，将碳排放纳入LLM推理路由决策，在满足准确率下限和p95延迟服务级别目标（SLO）的前提下最小化每个请求的二氧化碳排放量，为绿色AI推理提供理论基础和实践方案。

章节 02

大型语言模型（LLM）的部署规模正在快速增长，现有路由方法多平衡响应质量和计算成本，但很少将可持续能源使用和二氧化碳排放作为优化目标——尽管电网碳强度因时间和地区而异，且不同模型的能耗差异显著。随着AI推理需求的爆发式增长，其碳足迹也在快速累积，带来严峻的环境挑战。

章节 03

GAR是约束多目标优化框架，核心目标为满足准确率下限和p95延迟SLO前提下最小化碳排放。其关键创新包括：

章节 04

GAR将路由问题建模为约束多目标优化问题，同时考虑三个维度：

碳排放最小化：优先选择碳强度较低的模型和区域；
准确率保证：确保响应质量不低于预设阈值；
延迟约束：满足p95延迟SLO要求。此外，研究团队开发了启发式变体：严格模式（优先保证准确率和延迟）、平衡模式（三者均衡）、绿色模式（优先最小化碳排放），为不同场景提供灵活选择。

章节 05

研究团队在标准NLP基准测试上对GAR进行评估，使用异构LLM池（7B-70B参数规模）。结果显示：

章节 06

GAR框架的实际部署价值体现在多方面：

章节 07

GAR存在以下局限及未来探索方向：