正文

Inquire：基于MCP的多跳维基百科研究代理与提示词工程实践

Inquire是一个通过模型上下文协议(MCP)实现的多跳维基百科研究代理，展示了从V1草稿到V2生产级提示词的完整迭代流程，包含提示词评估、错误处理和自校验机制。

MCP多跳推理提示词工程AI代理维基百科研究代理提示词评估

发布时间 2026/05/16 07:15最近活动 2026/05/16 07:19预计阅读 3 分钟

章节 01

【主楼/导读】Inquire项目核心概览

Inquire是由Jayant-Guru-Shrivastava开发的开源项目，作为EAG V3课程第五课的作业交付物。它是基于模型上下文协议（MCP）的多跳维基百科研究代理，核心价值在于完整记录了从V1草稿到V2生产级提示词的迭代流程，包含提示词评估、错误处理和自校验机制，为提示词工程提供了可复现的实践范例。

章节 02

项目背景与多跳研究代理定义

项目背景

Inquire是EAG V3课程第五课的作业交付物，由Jayant-Guru-Shrivastava开发，定位为功能完整的多跳推理AI研究代理，同时也是提示词工程迭代的实践范例。

多跳研究代理定义

多跳研究代理指能回答需多步骤信息检索和推理的复杂问题的AI系统。例如，回答“万维网发明者的出生国家的首都是哪里？”时，需执行以下推理链：

搜索“万维网”确认发明者Tim Berners-Lee；
搜索Tim Berners-Lee获取出生地为英国伦敦；
搜索英国确认首都伦敦；
综合信息给出带引证的答案。这种能力可处理传统单轮问答无法应对的复杂查询。

章节 03

技术架构与提示词评估方法

技术架构（MCP集成）

Inquire采用MCP架构分离代理逻辑与工具执行，核心组件包括：

talk2mcp.py（代理客户端）：含V2生产级系统提示词，负责JSON格式工具调用循环，通过final_ok门控确保输出质量；
mcp_server.py（FastMCP服务器）：提供5个Pydantic验证工具（维基百科搜索、摘要获取、算术计算、事实验证等）。架构优势：工具返回结构化{"ok": bool, "error": "..."}响应，提示词教会代理读取错误并重试，提升系统健壮性与可调试性。

提示词资格认证工作流

通过提示词评估助手对候选提示词评分，涵盖9个维度：显式推理、结构化输出、工具分离、对话循环、指令框架、内部自检、推理类型感知、回退机制、整体清晰度。

章节 04

提示词从V1到V2的迭代过程（证据）

V1版本的问题

V1在内部自检和回退机制维度失败：

未要求代理对结论进行合理性检查；
未定义搜索无结果、验证失败等应对策略。

V2版本的改进

内部自检增强：增加“最终答案前的自检”模块，要求确认所有事实来自本次会话维基百科摘要，且关键事实经verify_claim验证为supports="yes"；
错误处理完善：建立完整错误处理表，为搜索无结果、摘要404、验证不通过、计算错误等失败模式定义明确重试策略。

迭代结果

V2在所有8个布尔指标上通过，成为生产级提示词。

章节 05

应用价值与实践启示

应用价值

Inquire为构建可靠多跳研究代理提供实用模板，其提示词工程方法论（结构化评估→针对性改进→迭代验证）可应用于各类复杂AI系统开发。项目提供evaluate_prompt.py脚本，确保评估流程可复现。

实践启示

关键最佳实践：

使用MCP架构分离关注点；
通过结构化错误响应实现健壮错误处理；
引入明确的自检门控确保输出质量。