Zing 论坛

正文

Inner-MCP:通过内部模型代理降低 Codex 上下文消耗的 MCP 服务器

Inner-MCP 是一个创新的 MCP 服务器,它在现有 MCP 工具之上构建代理层,使用内部模型进行规划、推理和工具编排,从而显著减少发送到 Codex 的上下文量,帮助节省 Token 消耗。

MCPCodex模型上下文协议Token优化工具编排AI代理上下文压缩OpenAI
发布时间 2026/06/10 13:40最近活动 2026/06/10 13:55预计阅读 2 分钟
Inner-MCP:通过内部模型代理降低 Codex 上下文消耗的 MCP 服务器
1

章节 01

导读 / 主楼:Inner-MCP:通过内部模型代理降低 Codex 上下文消耗的 MCP 服务器

Inner-MCP 是一个创新的 MCP 服务器,它在现有 MCP 工具之上构建代理层,使用内部模型进行规划、推理和工具编排,从而显著减少发送到 Codex 的上下文量,帮助节省 Token 消耗。

3

章节 03

问题背景:Codex 的上下文瓶颈

随着 AI 编程助手(如 OpenAI Codex)的普及,开发者们越来越依赖这些工具来完成复杂的编程任务。然而,一个普遍存在的痛点是:当需要调用大量工具或处理复杂工作流时,Codex 的上下文窗口会被迅速填满。

Model Context Protocol(MCP)作为连接 AI 助手与外部工具的标准协议,允许 Codex 访问各种数据源和服务。但当 MCP 服务器暴露的工具数量增加时,Codex 需要接收的工具描述、参数模式等元数据也会线性增长,导致:

  1. Token 消耗激增:每次请求都携带大量工具定义
  2. 上下文利用率下降:实际业务逻辑可用的上下文空间被压缩
  3. 响应延迟增加:处理大量工具描述需要时间

4

章节 04

Inner-MCP 的解决思路

Inner-MCP 项目提出了一种优雅的解决方案:在 Codex 和底层 MCP 工具之间引入一个智能代理层。这个代理层对外只暴露一个统一的工具接口,而内部则负责处理所有复杂的规划、推理和工具编排工作。

核心架构设计:

Codex ←→ Inner-MCP Server ←→ 内部模型(规划/推理)
                ↓
         底层 MCP 工具池

这种设计的精妙之处在于:Codex 只需要了解一个工具的定义,而实际的工作流复杂度由内部模型管理。


5

章节 05

内部模型的工作机制

Inner-MCP 的核心是其内部使用的第二个模型。当 Codex 调用 Inner-MCP 暴露的单一工具时,内部模型会接管后续的所有工作:

6

章节 06

1. 意图理解

内部模型首先解析 Codex 传来的请求,理解用户的真实意图和需要完成的任务。

7

章节 07

2. 任务规划

基于理解的目标,内部模型制定执行计划,决定需要调用哪些底层 MCP 工具、以什么顺序调用、以及如何处理工具间的依赖关系。

8

章节 08

3. 工具编排

内部模型执行规划好的步骤,调用相应的 MCP 工具,处理中间结果,并在必要时调整计划。