# Inquire：基于MCP的多跳维基百科研究代理与提示词工程实践

> Inquire是一个通过模型上下文协议(MCP)实现的多跳维基百科研究代理，展示了从V1草稿到V2生产级提示词的完整迭代流程，包含提示词评估、错误处理和自校验机制。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-15T23:15:22.000Z
- 最近活动: 2026-05-15T23:19:27.414Z
- 热度: 130.9
- 关键词: MCP, 多跳推理, 提示词工程, AI代理, 维基百科, 研究代理, 提示词评估
- 页面链接: https://www.zingnex.cn/forum/thread/inquire-mcp
- Canonical: https://www.zingnex.cn/forum/thread/inquire-mcp
- Markdown 来源: ingested_event

---

# Inquire：基于MCP的多跳维基百科研究代理与提示词工程实践\n\n## 项目背景与核心定位\n\nInquire是由Jayant-Guru-Shrivastava开发的开源项目，作为EAG V3课程第五课的作业交付物，展示了如何构建一个能够通过多跳推理回答复杂问题的AI研究代理。该项目的独特之处在于它不仅实现了功能完整的代理系统，更重要的是完整记录了从初版提示词到生产级提示词的迭代过程，为提示词工程提供了可复现的实践范例。\n\n## 什么是多跳研究代理\n\n多跳研究代理（Multi-hop Research Agent）是指能够回答需要多步骤信息检索和推理的复杂问题的AI系统。以Inquire为例，当用户提问"万维网发明者的出生国家的首都是哪里？"时，代理需要执行以下推理链：\n\n1. 首先搜索"万维网"，确认发明者是Tim Berners-Lee\n2. 然后搜索"Tim Berners-Lee"，获取其出生地为伦敦，英国\n3. 最后搜索"英国"，确认首都为伦敦\n4. 综合以上信息给出带引证的答案\n\n这种多跳推理能力使代理能够处理传统单轮问答系统无法应对的复杂查询。\n\n## 技术架构与MCP集成\n\nInquire采用模型上下文协议（MCP）架构，将代理逻辑与工具执行分离。系统由两个核心组件构成：\n\n**talk2mcp.py（代理客户端）**：包含生产级V2系统提示词，负责JSON格式的工具调用循环，并通过final_ok门控确保输出质量。\n\n**mcp_server.py（FastMCP服务器）**：提供5个经过Pydantic验证的工具，包括维基百科搜索、摘要获取、算术计算和事实验证等功能。\n\n这种架构设计的优势在于代理本身不处理异常——每个工具都返回结构化的`{\"ok\": bool, \"error\": \"...\"}`响应，而提示词则教会代理如何读取错误信息并重试。这种错误可见性设计使系统更加健壮和可调试。\n\n## 提示词资格认证工作流\n\nInquire项目的核心交付物是Session-5的提示词资格认证工作流。该流程要求开发者使用提示词评估助手（Prompt Evaluation Assistant）对候选系统提示词进行评分，评估涵盖9个维度：\n\n- **显式推理（explicit_reasoning）**：提示词是否明确要求展示推理过程\n- **结构化输出（structured_output）**：输出格式是否严格定义\n- **工具分离（tool_separation）**：工具调用是否与推理分离\n- **对话循环（conversation_loop）**：是否支持多轮交互\n- **指令框架（instructional_framing）**：指令是否清晰结构化\n- **内部自检（internal_self_checks）**：是否包含自我验证机制\n- **推理类型感知（reasoning_type_awareness）**：是否区分不同推理类型\n- **回退机制（fallbacks）**：是否定义错误处理策略\n- **整体清晰度（overall_clarity）**：整体可读性和完整性\n\n## 从V1到V2的迭代过程\n\n项目的README详细记录了提示词的迭代过程。V1版本在内部自检和回退机制两个维度失败，具体表现为：\n\n1. V1从未要求代理对结论进行合理性检查\n2. V1未描述搜索无结果或验证失败时的应对策略\n\n针对这些失败，V2版本进行了针对性改进：\n\n**内部自检增强**：增加了\"最终答案前的自检\"模块，要求代理在输出最终答案前确认两个关键点：所有事实都来自本次会话获取的维基百科摘要；关键事实已通过verify_claim验证且返回supports=\"yes\"。\n\n**错误处理完善**：建立了完整的错误处理表，为每种失败模式（搜索无结果、摘要获取404、验证不通过、计算表达式错误）定义了明确的重试策略。\n\n经过迭代，V2版本在所有8个布尔指标上均获得通过，成为生产级提示词。\n\n## 实际应用价值与启示\n\nInquire项目为构建可靠的多跳研究代理提供了实用模板。其提示词工程方法论——通过结构化评估、针对性改进、迭代验证——可以应用于各类复杂AI系统的开发。项目还提供了`evaluate_prompt.py`脚本，允许开发者在终端运行相同的评估流程，确保结果的可复现性。\n\n对于希望构建类似系统的开发者，Inquire展示了几个关键最佳实践：使用MCP架构分离关注点、通过结构化错误响应实现健壮的错误处理、以及通过明确的自检门控确保输出质量。
