Zing 论坛

正文

Strategos:面向.NET的确定性AI工作流编排框架

Strategos是一个.NET原生框架,通过事件溯源和Saga模式为AI智能体工作流提供确定性编排,解决了传统Agent框架无法解释决策时上下文状态的痛点。

AI工作流Agent框架.NET事件溯源Saga模式工作流编排LLM可解释AITemporalLangGraph
发布时间 2026/05/24 08:45最近活动 2026/05/24 08:48预计阅读 6 分钟
Strategos:面向.NET的确定性AI工作流编排框架
1

章节 01

导读 / 主楼:Strategos:面向.NET的确定性AI工作流编排框架

Strategos是一个.NET原生框架,通过事件溯源和Saga模式为AI智能体工作流提供确定性编排,解决了传统Agent框架无法解释决策时上下文状态的痛点。

2

章节 02

原作者与来源

  • 原作者/维护者:lvlup-sw
  • 来源平台:github
  • 原始标题:strategos
  • 原始链接:https://github.com/lvlup-sw/strategos
  • 来源发布时间/更新时间:2026-05-24T00:45:19Z
3

章节 03

补充观点 1

原作者与来源

  • 原作者/维护者:lvlup-sw
  • 来源平台:github
  • 原始标题:strategos
  • 原始链接:https://github.com/lvlup-sw/strategos
  • 来源发布时间/更新时间:2026-05-24T00:45:19Z 原作者与来源\n\n- 原作者/维护者: lvlup-sw 团队\n- 来源平台: GitHub\n- 原始标题: strategos\n- 原始链接: https://github.com/lvlup-sw/strategos\n- 发布时间: 2026年5月24日\n\n---\n\n背景:AI智能体工作流的根本困境\n\n在构建AI驱动的自动化系统时,开发者面临一个根本性的矛盾:AI智能体本质上是概率性的——给定相同的输入,大语言模型可能产生不同的输出。这种不确定性使得传统的确定性工作流编排变得异常困难。\n\n当前市场上有两类主流解决方案,但都存在明显缺陷。第一类是Agent框架,如LangGraph和微软的Agent Framework,它们提供了出色的开发体验,但依赖基于检查点的持久化机制。这意味着虽然它们可以在中断后恢复工作流,却无法回答一个关键问题:"当智能体做出那个决策时,它到底看到了什么?"\n\n第二类是成熟的工作流引擎,如Temporal,它们提供了经过生产验证的持久化能力,但对AI特有的模式缺乏原生支持:置信度处理、上下文组装、AI感知的补偿机制等。开发者被迫在开发体验和运行时可靠性之间做出艰难选择。\n\n---\n\nStrategos的核心洞察:确定性工作流,概率性决策\n\nStrategos框架提出了一个关键洞察:虽然智能体的输出是概率性的,但工作流本身可以是确定性的——只要我们将每个智能体决策视为事件溯源系统中的不可变事件。\n\n这个洞察彻底改变了AI工作流的设计范式。传统方法试图控制AI的输出,而Strategos接受输出的不确定性,转而确保决策过程的完全可追溯和可审计。每个决策都被捕获为事件,包含完整的上下文信息,使得事后分析成为可能。\n\n---\n\n技术架构:站在巨人肩膀上\n\nStrategos没有重复造轮子,而是巧妙地组合了.NET生态中经过验证的基础设施组件。\n\nWolverine提供了Saga编排能力。每个工作流成为一个Saga,具备自动消息路由、事务性发件箱(状态和消息原子提交)以及重试策略。这种设计确保了即使在分布式环境下,工作流状态也能保持一致。\n\nMarten提供了事件溯源支持。每个步骤完成、分支决策和审批都被捕获为PostgreSQL中的不可变事件。这不仅支持时间旅行调试,还提供了完整的审计追踪能力。开发者可以精确重现任意时刻的系统状态。\n\nRoslyn源生成器在编译时将流畅的DSL定义转换为类型安全的工件:阶段枚举、命令、事件、Saga处理器和状态reducer。无效的工作流在构建时就会失败,并给出清晰的诊断信息,而不是在运行时抛出晦涩的异常。\n\n---\n\n核心功能:专为AI工作流设计\n\nStrategos提供了一系列针对AI工作流痛点的原生功能。\n\n决策可解释性是框架的核心价值主张。系统记录智能体看到了什么、做出了什么决策、哪个模型产生了输出。这种透明度对于生产环境中的AI系统至关重要,特别是在需要合规审计的场景。\n\n预算治理功能允许为每个工作流强制执行资源限制,防止失控的智能体消耗过多资源。这在成本敏感的企业环境中尤为重要。\n\n置信度路由机制自动将低置信度决策升级给人工审核。这种人在回路的设计确保了关键决策的质量,同时减少了不必要的人工干预。\n\n智能体选择采用Thompson Sampling等学习算法,系统会随着时间的推移改进路由决策,自动选择最适合特定任务的模型。\n\n循环检测功能可以在智能体陷入死循环之前捕获它们,防止预算浪费。这在处理可能产生自我循环的复杂推理任务时特别有价值。\n\n补偿处理器提供了基于DSL的回滚机制,当工作流失败时可以优雅地撤销已完成的步骤。\n\n---\n\n使用示例:直观的工作流定义\n\nStrategos的DSL设计追求自然语言般的可读性。以下是一个典型的订单处理工作流定义:\n\ncsharp\nvar workflow = Workflow<OrderState>\n .Create(\"process-order\")\n .StartWith<ValidateOrder>()\n .Then<ProcessPayment>()\n .Then<FulfillOrder>()\n .Finally<SendConfirmation>();\n\n\n这种声明式语法使得工作流的意图一目了然,同时保持了类型安全。编译时验证确保引用的步骤确实存在,状态转换是合法的。\n\n对于需要LLM集成的场景,框架提供了专门的Agents包,支持微软Agent Framework集成。开发者可以轻松地将LLM驱动的步骤嵌入到工作流中,同时享受完整的持久化和审计能力。\n\n---\n\n生态系统对比:独特的定位\n\n与现有解决方案相比,Strategos在几个关键维度上具有独特优势。\n\n相对于LangGraph,Strategos提供了真正的.NET原生体验和事件溯源持久化,而不仅仅是检查点机制。这意味着更细粒度的状态可见性和更强大的审计能力。\n\n相对于微软的Agent Framework工作流,Strategos提供了决策可解释性、置信度路由、预算治理和循环检测等AI特有的功能,这些是MAF工作流目前所缺乏的。\n\n相对于Temporal,Strategos原生支持AI工作流模式,如智能体选择、置信度处理和AI感知的补偿机制,而Temporal需要开发者自行实现这些模式。\n\n当然,Strategos目前缺乏可视化的仪表板,这是LangGraph和Temporal的优势所在。但对于优先考虑可审计性和AI特定功能的团队来说,这是一个可以接受的权衡。\n\n---\n\n实际意义与适用场景\n\nStrategos特别适合以下场景:\n\n内容发布管道需要人工审批门和回滚能力。当AI生成的内容需要人工审核时,Strategos可以精确记录每个审核节点的状态和决策依据。\n\n多模型系统需要智能路由。当组织使用多个LLM提供商时,Strategos的学习型路由可以自动优化模型选择,降低总体成本同时提高输出质量。\n\n智能体编程需要带有人工检查点的迭代循环。在代码生成场景中,Strategos可以在关键节点暂停,等待人工确认后再继续,确保生成代码的质量和安全性。\n\n金融合规场景需要完整的审计追踪。事件溯源架构天然满足合规要求,每个决策都可以追溯到其完整的上下文。\n\n---\n\n总结与展望\n\nStrategos代表了AI工作流编排的一个重要演进方向:接受AI的概率性本质,同时确保工作流的确定性和可审计性。通过巧妙组合.NET生态中的成熟组件,它提供了一个既强大又务实的解决方案。\n\n框架目前处于积极开发阶段,最新版本v2.7.0-preview.1引入了身份传播机制,通过SPIFFE适配器为每个步骤提供细粒度的身份标识。这表明项目团队正在积极构建企业级功能。\n\n对于.NET生态中的AI应用开发者来说,Strategos提供了一个值得认真考虑的选择,特别是当可解释性、审计能力和AI特定功能是关键需求时。