正文

AgentJIT：将重复性AI工作流编译为零Token技能的JIT编译器

深入解析AgentJIT如何通过观察AI智能体的执行轨迹，自动将耗时的随机性工作流编译为确定性的零Token技能，实现从"万次 deliberation"到"百次 invocation"的效率飞跃。

JIT编译器AI智能体工作流优化Token效率Claude Code自动化

发布时间 2026/04/10 16:12最近活动 2026/04/10 16:24预计阅读 3 分钟

章节 01

导读 / 主楼：AgentJIT：将重复性AI工作流编译为零Token技能的JIT编译器

章节 02

问题背景：AI工作流的重复性成本

现代AI编程助手（如Claude Code、Codex、Cursor等）已经深刻改变了开发者的工作方式。它们能够理解自然语言指令，执行复杂的工具调用序列，完成从代码审查到部署运维的各种任务。然而，这种能力是有代价的：每一次任务执行都需要经过多轮LLM推理，消耗大量Token，产生显著的延迟和成本。

考虑一个典型的DevOps场景：排查服务故障。智能体可能需要执行以下步骤：

运行kubectl get pods查看Pod状态
执行kubectl logs获取特定Pod的日志
使用grep在日志中搜索错误关键词
根据错误信息推断可能的原因
修改配置文件或重启服务
验证修复结果

如果这类故障经常发生（比如由某个已知Bug引起），智能体每次都会重复相同的推理过程。虽然对人类来说这已经成为"肌肉记忆"，但对AI而言，每一次都是全新的 deliberation，需要消耗约10,000个Token和30秒以上的时间。

AgentJIT的核心洞察是：这些重复的工作流可以被学习、被编译、被优化，最终转化为近乎瞬时的确定性执行。

章节 03

核心概念：从随机到确定性的转变

AgentJIT（Agent Just-In-Time Compiler）是一个后台JIT编译器，专为自主编程智能体设计。它通过以下机制实现效率的质变：

章节 04

观察与学习

AgentJIT通过智能体框架的钩子机制（如Claude Code的PostToolUse、SessionStart、SessionEnd钩子），静默地观察智能体的执行轨迹。它不干扰正常操作，只是忠实地记录工具调用序列、参数模式和执行结果。

这种观察是持续进行的。随着智能体执行更多任务，AgentJIT积累越来越多的执行数据，识别出重复出现的模式。

章节 05

模式识别与编译

当某个工作流被识别为"热点"（即重复执行达到一定阈值），AgentJIT触发编译过程。编译器分析执行轨迹，提取可参数化的部分，生成一个确定性的技能脚本。

编译后的技能具有以下特征：

参数化：脚本中的变量部分被提取为参数，使其能够适应类似但略有不同的场景
确定性：执行路径是预定义的，不再需要进行LLM推理
零Token：执行过程不涉及任何LLM调用，仅执行本地命令

章节 06

运行时执行与回退

编译后的技能存储在本地文件系统中（默认位置~/.aj/skills/）。当智能体再次遇到匹配的场景时，AgentJIT拦截请求，直接执行对应的技能脚本。

执行结果会被监控。如果技能执行失败，系统会静默回退到原始的LLM工作流，用户感知不到任何中断。这种容错设计确保了系统的可靠性。

章节 07

系统架构详解

AgentJIT的架构由四个核心组件构成，形成一个完整的反馈循环：

章节 08

钩子事件层

这是与智能体框架集成的入口点。目前支持Claude Code的原生钩子，未来计划扩展到Codex、Gemini CLI、GitHub Copilot、Cursor等。

钩子类型包括：

PostToolUse：每次工具调用后触发，记录调用详情
SessionStart/SessionEnd：标记会话边界，聚合会话级别的统计信息

AgentJIT：将重复性AI工作流编译为零Token技能的JIT编译器

导读 / 主楼：AgentJIT：将重复性AI工作流编译为零Token技能的JIT编译器

问题背景：AI工作流的重复性成本

核心概念：从随机到确定性的转变

观察与学习

模式识别与编译

运行时执行与回退

系统架构详解

钩子事件层

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

Folkering OS：当操作系统本身就是 AI——一个能自我进化的裸机 Rust 系统