Zing 论坛

正文

ebb-ai:智能调度Agent工作负载,让LLM推理更便宜、更绿色

一个开源的AI工作负载调度系统,通过将非紧急LLM任务推迟到电网低负荷时段执行,实现约50%的成本节省,同时减少碳排放并提供可审计的碳足迹收据。

AI调度LLM推理碳足迹Batch APIMCPAgentic AI成本优化绿色计算
发布时间 2026/05/15 07:42最近活动 2026/05/15 07:48预计阅读 3 分钟
ebb-ai:智能调度Agent工作负载,让LLM推理更便宜、更绿色
1

章节 01

导读 / 主楼:ebb-ai:智能调度Agent工作负载,让LLM推理更便宜、更绿色

一个开源的AI工作负载调度系统,通过将非紧急LLM任务推迟到电网低负荷时段执行,实现约50%的成本节省,同时减少碳排放并提供可审计的碳足迹收据。

2

章节 02

背景:AI推理正在吞噬电网

根据美国能源部的预测,到2028年,AI推理将消耗美国电网6.7%到12%的电力负荷。这是一个令人震惊的数字——数据中心用电量自2020年以来已经翻倍,而且随着Agentic AI工作负载的规模化增长,这一趋势仍在加速。

然而,当前的Agent代码在默认情况下会同步触发LLM调用,即使这些任务完全可以延迟执行。比如"今晚总结我的收件箱"或"周五前重写这5000个产品描述"这类任务,并不需要立即得到响应,却仍然会在电网高峰期消耗宝贵的计算资源。

这种现状带来了三个核心问题:成本高昂、电网压力巨大、碳排放不可控。

3

章节 03

ebb-ai是什么

ebb-ai是一个专为Agentic AI经济设计的工作负载调度系统。它的核心理念很简单:将非紧急的LLM任务自动推迟到电网低负荷、电价便宜的时段执行,同时生成可审计的成本和碳排放收据。

这个项目由Vitalii Borovyk开发,采用Apache 2.0许可证开源。它不仅仅是一个成本优化工具,更是一个将AI基础设施与可持续能源管理相结合的创新尝试。

4

章节 04

1. 成本优化:Batch API的自动化利用

Anthropic和OpenAI都提供Batch API,允许延迟执行的任务享受50%的固定折扣。但问题是,几乎没有任何Agent代码会使用它们,因为这个选择必须在调用点手动做出。

ebb-ai通过defer() API和智能调度器自动完成这个决策。当系统检测到任务可以等待时,会自动将其路由到Batch API路径,用户无需修改现有代码逻辑。

5

章节 05

2. 电网负载平滑:时间转移策略

数据中心AI计算集中在少数美国地区——PJM中大西洋/弗吉尼亚、ERCOT德克萨斯、CAISO加利福尼亚。高峰时段的AI工作负载会与医院、工业用户和居民竞争已经紧张的电力容量。弗吉尼亚州监管机构已将数据中心负载增长列为一级可靠性关切。

ebb-ai通过将可延迟工作负载转移到非高峰时段,有效降低了电网需要规划的峰值负荷。这种时间转移策略不仅有利于电网稳定,也为用户带来了实际的经济收益。

6

章节 06

3. 碳足迹追踪:可审计的绿色收据

电网碳强度在一天内可能波动30%到60%。同一个调度决策,在节省成本和平滑负载的同时,也会减少CO₂排放。

ebb-ai为每次调度生成可审计的收据,包含成本、碳排放量、提供商和执行时长。这对于ESG报告、成本核算以及即将到来的计算披露法规都具有重要价值。

7

章节 07

技术架构:MCP原生设计

ebb-ai采用Model Context Protocol(MCP)原生设计,可以作为插件无缝集成到各种Agent宿主环境中:

  • Claude Desktop
  • Claude Code
  • Cursor
  • Cline
  • Continue
  • Zed
  • Windsurf
  • OpenClaw
  • OpenAI Codex CLI

系统架构包含以下几个核心组件:

8

章节 08

核心库(@ebb-ai/core)

TypeScript核心库提供defer() API、AnthropicAdapter、OpenAIAdapter,以及可选的SQLite持久化队列。调度器支持内存模式和持久化模式,后者可以跨系统重启保留任务状态。