章节 01
导读 / 主楼:ebb-ai:智能调度Agent工作负载,让LLM推理更便宜、更绿色
一个开源的AI工作负载调度系统,通过将非紧急LLM任务推迟到电网低负荷时段执行,实现约50%的成本节省,同时减少碳排放并提供可审计的碳足迹收据。
正文
一个开源的AI工作负载调度系统,通过将非紧急LLM任务推迟到电网低负荷时段执行,实现约50%的成本节省,同时减少碳排放并提供可审计的碳足迹收据。
章节 01
一个开源的AI工作负载调度系统,通过将非紧急LLM任务推迟到电网低负荷时段执行,实现约50%的成本节省,同时减少碳排放并提供可审计的碳足迹收据。
章节 02
根据美国能源部的预测,到2028年,AI推理将消耗美国电网6.7%到12%的电力负荷。这是一个令人震惊的数字——数据中心用电量自2020年以来已经翻倍,而且随着Agentic AI工作负载的规模化增长,这一趋势仍在加速。
然而,当前的Agent代码在默认情况下会同步触发LLM调用,即使这些任务完全可以延迟执行。比如"今晚总结我的收件箱"或"周五前重写这5000个产品描述"这类任务,并不需要立即得到响应,却仍然会在电网高峰期消耗宝贵的计算资源。
这种现状带来了三个核心问题:成本高昂、电网压力巨大、碳排放不可控。
章节 03
ebb-ai是一个专为Agentic AI经济设计的工作负载调度系统。它的核心理念很简单:将非紧急的LLM任务自动推迟到电网低负荷、电价便宜的时段执行,同时生成可审计的成本和碳排放收据。
这个项目由Vitalii Borovyk开发,采用Apache 2.0许可证开源。它不仅仅是一个成本优化工具,更是一个将AI基础设施与可持续能源管理相结合的创新尝试。
章节 04
Anthropic和OpenAI都提供Batch API,允许延迟执行的任务享受50%的固定折扣。但问题是,几乎没有任何Agent代码会使用它们,因为这个选择必须在调用点手动做出。
ebb-ai通过defer() API和智能调度器自动完成这个决策。当系统检测到任务可以等待时,会自动将其路由到Batch API路径,用户无需修改现有代码逻辑。
章节 05
数据中心AI计算集中在少数美国地区——PJM中大西洋/弗吉尼亚、ERCOT德克萨斯、CAISO加利福尼亚。高峰时段的AI工作负载会与医院、工业用户和居民竞争已经紧张的电力容量。弗吉尼亚州监管机构已将数据中心负载增长列为一级可靠性关切。
ebb-ai通过将可延迟工作负载转移到非高峰时段,有效降低了电网需要规划的峰值负荷。这种时间转移策略不仅有利于电网稳定,也为用户带来了实际的经济收益。
章节 06
电网碳强度在一天内可能波动30%到60%。同一个调度决策,在节省成本和平滑负载的同时,也会减少CO₂排放。
ebb-ai为每次调度生成可审计的收据,包含成本、碳排放量、提供商和执行时长。这对于ESG报告、成本核算以及即将到来的计算披露法规都具有重要价值。
章节 07
ebb-ai采用Model Context Protocol(MCP)原生设计,可以作为插件无缝集成到各种Agent宿主环境中:
系统架构包含以下几个核心组件:
章节 08
TypeScript核心库提供defer() API、AnthropicAdapter、OpenAIAdapter,以及可选的SQLite持久化队列。调度器支持内存模式和持久化模式,后者可以跨系统重启保留任务状态。