正文

Controlled Agent Runtime：构建可观测、可回放的受控多智能体工作流运行时

一个面向生产环境的多智能体运行时框架，通过ActorView实现感知隔离、DomainEvent确保状态安全、Golden Replay支持回归测试，以Hazard Lab场景展示隐藏信息处理、委托动作、长时记忆等复杂交互。

Agent运行时多智能体事件溯源LangGraph可观测性回归测试ActorViewDomainEventGolden Replay状态管理

发布时间 2026/06/01 14:15最近活动 2026/06/01 14:26预计阅读 3 分钟

章节 01

导读 / 主楼：Controlled Agent Runtime：构建可观测、可回放的受控多智能体工作流运行时

章节 02

原作者与来源

原作者/维护者: yukinorin775780
来源平台: GitHub
原始标题: Controlled Agent Sim Runtime
原始链接: https://github.com/yukinorin775780/controlled-agent-runtime-ai-rd
发布时间: 2026年6月

章节 03

背景：为什么Agent需要"受控"运行时

大语言模型（LLM）Agent的爆发式发展带来了前所未有的自动化能力，但也暴露出一个核心矛盾：模型的开放性与生产环境所需的确定性之间的矛盾。

LLM本质上是概率性的——同样的输入可能产生不同的输出，这种特性在创意写作或头脑风暴场景中是优势，但在需要精确状态管理的生产系统中却是风险来源。当Agent被赋予调用工具、修改数据库、发送邮件等能力时，"不受控"的行为可能导致严重后果。

业界目前的Agent框架（如LangChain、AutoGPT、OpenAI Assistants API等）大多采用"提示工程+工具调用"的范式，将大量责任委托给模型的"理解能力"。这种方式在原型阶段运行良好，但在规模化部署时面临几个根本挑战：

首先是状态一致性。如果Agent在一次对话中修改了数据库记录，如何确保这个修改是可预期的、可审计的、可回滚的？其次是可见性。当Agent做出一个决策时，开发者能否准确理解它"看到"了什么信息、"考虑"了哪些因素？第三是可测试性。如何在不调用昂贵LLM API的情况下，对Agent行为进行回归测试？

Controlled Agent Runtime项目正是为回答这些问题而设计。

章节 04

核心理念：分离意图与执行

项目的核心架构原则可以用一句话概括：LLM负责意图解释和表达，确定性系统负责状态变更。

这种分离不是简单的"LLM生成代码，然后执行"，而是更深层次的架构边界设计：

章节 05

意图层（Intent Layer）

LLM-facing节点负责：

理解用户输入的意图
生成自然语言回复和"表达"（barks）
提出状态变更的"建议"

这一层充分利用了LLM的语言理解和生成能力，但不直接操作任何系统状态。

章节 06

执行层（Execution Layer）

确定性系统负责：

移动、检查、库存管理等游戏机制
状态变更的最终提交
事件溯源和持久化
可重放的执行记录

这一层确保所有状态变更都是可预测、可测试、可审计的。

章节 07

事件层（Event Layer）

连接两层的是强类型的DomainEvent系统。所有状态变更必须通过事件表示，事件通过EventDrain统一处理。这种设计带来了几个好处：

统一接口：无论变更来自哪个Agent或哪个系统，都通过相同的事件机制处理
可序列化：事件可以持久化、传输、回放
可审计：完整的事件日志就是系统的审计追踪
可测试：可以构造事件序列进行回归测试，无需调用LLM

章节 08

ActorView：感知隔离

ActorView是项目中最精妙的设计之一。它解决了多Agent系统中一个常见问题：每个Agent应该"看到"什么信息？

在现实世界的多Agent场景中，信息往往是分布式的、不对称的。一个Agent可能知道某些信息，另一个Agent可能不知道；某些信息是公开的，某些是私密的。传统的"把所有上下文都给LLM"的做法既不高效（token浪费）也不安全（信息泄露）。

ActorView通过以下机制实现精细的感知控制：

世界状态过滤：根据Agent的位置、能力、角色，过滤可见的世界对象
历史记录裁剪：只提供该Agent有权访问的历史事件
私有记忆注入：每个Agent有自己的记忆服务，存储学习到的知识
同伴状态可见性：控制Agent能看到哪些其他Agent的状态

这种设计使得"隐藏信息"成为系统的一等公民。在Hazard Lab演示场景中，Scout Agent能够检测到隐藏的毒气陷阱，而其他Agent看不到——这不是通过prompt告诉LLM"假装你看不到"，而是真正的信息隔离。

Controlled Agent Runtime：构建可观测、可回放的受控多智能体工作流运行时

导读 / 主楼：Controlled Agent Runtime：构建可观测、可回放的受控多智能体工作流运行时

原作者与来源

背景：为什么Agent需要"受控"运行时

核心理念：分离意图与执行

意图层（Intent Layer）

执行层（Execution Layer）

事件层（Event Layer）

ActorView：感知隔离

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统