正文

Estudio PolyMind：基于 LangGraph 的多 LLM 智能编排与 RAG 平台

一个生产级的多 LLM 检索增强生成（RAG）平台，通过 LangGraph 工作流编排多个开源大语言模型，支持本地部署、持久化记忆和工具调用。

LangGraphRAG多LLM编排OllamaChromaDBFastAPI开源AI向量检索Agentic AI

发布时间 2026/06/08 15:13最近活动 2026/06/08 15:20预计阅读 3 分钟

章节 01

导读 / 主楼：Estudio PolyMind：基于 LangGraph 的多 LLM 智能编排与 RAG 平台

一个生产级的多 LLM 检索增强生成（RAG）平台，通过 LangGraph 工作流编排多个开源大语言模型，支持本地部署、持久化记忆和工具调用。

章节 02

原作者与来源

原作者/维护者: Susanta Hazra (Susanta2025-lab)
来源平台: GitHub
原始标题: estudio-polymind-llm-orchestration
原始链接: https://github.com/Susanta2025-lab/estudio-polymind-llm-orchestration
发布时间: 2025年

章节 03

项目概述

Estudio PolyMind 是一个生产级的多 LLM 检索增强生成（RAG）平台，它通过 LangGraph 工作流来编排多个开源大语言模型。该项目展示了现代 AI 工程和 Agentic AI 架构模式的最佳实践，特别适合希望在本地环境中构建企业级 AI 应用的开发者。

与单一模型方案不同，PolyMind 采用智能路由机制，根据查询类型和工作流需求动态选择最适合的模型。这种设计不仅提高了响应质量，还优化了计算资源的利用效率。

章节 04

多 LLM 编排层

平台支持同时接入多个本地部署的开源模型，包括 Mistral、Qwen、Gemma 和 Phi。系统通过 Router Node 分析用户查询的特征，然后由 Model Router 将请求分发到最适合的处理路径。

这种架构的优势在于：

任务适配: 不同模型擅长处理不同类型的任务，如代码生成、推理分析或创意写作
负载均衡: 避免单一模型过载，提高系统整体吞吐量
容错能力: 当某个模型不可用时，可自动切换至备选方案

章节 05

LangGraph 工作流引擎

项目采用 LangGraph 实现基于图的工作流编排，将复杂的 AI 处理流程抽象为可视化的节点网络：

用户查询
    │
    ▼
Router Node（路由节点）
    │
    ▼
Model Router（模型路由器）
    │
┌───┼───┐
│   │   │
▼   ▼   ▼
RAG 直接调用 工具调用
│   │   │
└───┴───┘
    │
    ▼
  响应输出

这种图结构的设计使得工作流具有高度的可扩展性。开发者可以轻松添加新的处理节点，如新的模型接入、自定义工具或特定的后处理逻辑。

章节 06

RAG 检索增强生成

PolyMind 的 RAG 模块实现了完整的文档处理流水线：

章节 07

文档摄取与处理

系统支持 PDF 和纯文本文件的批量摄取。文档首先经过分块处理（Chunking），将长文档分割成语义完整的片段。然后使用 Sentence Transformers 生成向量嵌入，存储到 ChromaDB 向量数据库中。

章节 08

语义检索与源追踪

当用户提出问题时，系统执行以下步骤：

查询向量化: 将用户问题转换为向量表示
相似度搜索: 在 ChromaDB 中查找最相关的文档片段
相关性评分: 对检索结果进行排序和过滤
源追踪: 记录每个回答所引用的原始文档来源

源追踪功能对于企业级应用尤为重要，它确保了 AI 回答的可验证性和透明度，用户可以随时查看答案依据的具体文档位置。

Estudio PolyMind：基于 LangGraph 的多 LLM 智能编排与 RAG 平台

导读 / 主楼：Estudio PolyMind：基于 LangGraph 的多 LLM 智能编排与 RAG 平台

原作者与来源

项目概述

多 LLM 编排层

LangGraph 工作流引擎

RAG 检索增强生成

文档摄取与处理

语义检索与源追踪

继续阅读

Nornir MCP Server：将大语言模型引入网络自动化的企业级桥梁

Bibliothèque Française LLM：为大型语言模型优化的法语公版文献索引系统

Splinter：一款无锁零拷贝的共享内存 KV 与向量存储库，让 LLM 推理告别 socket 与 memcpy 开销

libmlxforge：Apple Silicon 上的嵌入式 MLX LLM 推理引擎