Zing 论坛

正文

Controlled Agent Runtime:构建可观测、可回放的受控多智能体工作流运行时

一个面向生产环境的多智能体运行时框架,通过ActorView实现感知隔离、DomainEvent确保状态安全、Golden Replay支持回归测试,以Hazard Lab场景展示隐藏信息处理、委托动作、长时记忆等复杂交互。

Agent运行时多智能体事件溯源LangGraph可观测性回归测试ActorViewDomainEventGolden Replay状态管理
发布时间 2026/06/01 14:15最近活动 2026/06/01 14:26预计阅读 3 分钟
Controlled Agent Runtime:构建可观测、可回放的受控多智能体工作流运行时
1

章节 01

导读 / 主楼:Controlled Agent Runtime:构建可观测、可回放的受控多智能体工作流运行时

一个面向生产环境的多智能体运行时框架,通过ActorView实现感知隔离、DomainEvent确保状态安全、Golden Replay支持回归测试,以Hazard Lab场景展示隐藏信息处理、委托动作、长时记忆等复杂交互。

3

章节 03

背景:为什么Agent需要"受控"运行时

大语言模型(LLM)Agent的爆发式发展带来了前所未有的自动化能力,但也暴露出一个核心矛盾:模型的开放性与生产环境所需的确定性之间的矛盾

LLM本质上是概率性的——同样的输入可能产生不同的输出,这种特性在创意写作或头脑风暴场景中是优势,但在需要精确状态管理的生产系统中却是风险来源。当Agent被赋予调用工具、修改数据库、发送邮件等能力时,"不受控"的行为可能导致严重后果。

业界目前的Agent框架(如LangChain、AutoGPT、OpenAI Assistants API等)大多采用"提示工程+工具调用"的范式,将大量责任委托给模型的"理解能力"。这种方式在原型阶段运行良好,但在规模化部署时面临几个根本挑战:

首先是状态一致性。如果Agent在一次对话中修改了数据库记录,如何确保这个修改是可预期的、可审计的、可回滚的?其次是可见性。当Agent做出一个决策时,开发者能否准确理解它"看到"了什么信息、"考虑"了哪些因素?第三是可测试性。如何在不调用昂贵LLM API的情况下,对Agent行为进行回归测试?

Controlled Agent Runtime项目正是为回答这些问题而设计。


4

章节 04

核心理念:分离意图与执行

项目的核心架构原则可以用一句话概括:LLM负责意图解释和表达,确定性系统负责状态变更

这种分离不是简单的"LLM生成代码,然后执行",而是更深层次的架构边界设计:

5

章节 05

意图层(Intent Layer)

LLM-facing节点负责:

  • 理解用户输入的意图
  • 生成自然语言回复和"表达"(barks)
  • 提出状态变更的"建议"

这一层充分利用了LLM的语言理解和生成能力,但不直接操作任何系统状态。

6

章节 06

执行层(Execution Layer)

确定性系统负责:

  • 移动、检查、库存管理等游戏机制
  • 状态变更的最终提交
  • 事件溯源和持久化
  • 可重放的执行记录

这一层确保所有状态变更都是可预测、可测试、可审计的。

7

章节 07

事件层(Event Layer)

连接两层的是强类型的DomainEvent系统。所有状态变更必须通过事件表示,事件通过EventDrain统一处理。这种设计带来了几个好处:

  • 统一接口:无论变更来自哪个Agent或哪个系统,都通过相同的事件机制处理
  • 可序列化:事件可以持久化、传输、回放
  • 可审计:完整的事件日志就是系统的审计追踪
  • 可测试:可以构造事件序列进行回归测试,无需调用LLM

8

章节 08

ActorView:感知隔离

ActorView是项目中最精妙的设计之一。它解决了多Agent系统中一个常见问题:每个Agent应该"看到"什么信息?

在现实世界的多Agent场景中,信息往往是分布式的、不对称的。一个Agent可能知道某些信息,另一个Agent可能不知道;某些信息是公开的,某些是私密的。传统的"把所有上下文都给LLM"的做法既不高效(token浪费)也不安全(信息泄露)。

ActorView通过以下机制实现精细的感知控制:

  • 世界状态过滤:根据Agent的位置、能力、角色,过滤可见的世界对象
  • 历史记录裁剪:只提供该Agent有权访问的历史事件
  • 私有记忆注入:每个Agent有自己的记忆服务,存储学习到的知识
  • 同伴状态可见性:控制Agent能看到哪些其他Agent的状态

这种设计使得"隐藏信息"成为系统的一等公民。在Hazard Lab演示场景中,Scout Agent能够检测到隐藏的毒气陷阱,而其他Agent看不到——这不是通过prompt告诉LLM"假装你看不到",而是真正的信息隔离。