Zing 论坛

正文

Estudio PolyMind:基于 LangGraph 的多 LLM 智能编排与 RAG 平台

一个生产级的多 LLM 检索增强生成(RAG)平台,通过 LangGraph 工作流编排多个开源大语言模型,支持本地部署、持久化记忆和工具调用。

LangGraphRAG多LLM编排OllamaChromaDBFastAPI开源AI向量检索Agentic AI
发布时间 2026/06/08 15:13最近活动 2026/06/08 15:20预计阅读 3 分钟
Estudio PolyMind:基于 LangGraph 的多 LLM 智能编排与 RAG 平台
1

章节 01

导读 / 主楼:Estudio PolyMind:基于 LangGraph 的多 LLM 智能编排与 RAG 平台

一个生产级的多 LLM 检索增强生成(RAG)平台,通过 LangGraph 工作流编排多个开源大语言模型,支持本地部署、持久化记忆和工具调用。

3

章节 03

项目概述

Estudio PolyMind 是一个生产级的多 LLM 检索增强生成(RAG)平台,它通过 LangGraph 工作流来编排多个开源大语言模型。该项目展示了现代 AI 工程和 Agentic AI 架构模式的最佳实践,特别适合希望在本地环境中构建企业级 AI 应用的开发者。

与单一模型方案不同,PolyMind 采用智能路由机制,根据查询类型和工作流需求动态选择最适合的模型。这种设计不仅提高了响应质量,还优化了计算资源的利用效率。


4

章节 04

多 LLM 编排层

平台支持同时接入多个本地部署的开源模型,包括 Mistral、Qwen、Gemma 和 Phi。系统通过 Router Node 分析用户查询的特征,然后由 Model Router 将请求分发到最适合的处理路径。

这种架构的优势在于:

  • 任务适配: 不同模型擅长处理不同类型的任务,如代码生成、推理分析或创意写作
  • 负载均衡: 避免单一模型过载,提高系统整体吞吐量
  • 容错能力: 当某个模型不可用时,可自动切换至备选方案
5

章节 05

LangGraph 工作流引擎

项目采用 LangGraph 实现基于图的工作流编排,将复杂的 AI 处理流程抽象为可视化的节点网络:

用户查询
    │
    ▼
Router Node(路由节点)
    │
    ▼
Model Router(模型路由器)
    │
┌───┼───┐
│   │   │
▼   ▼   ▼
RAG 直接调用 工具调用
│   │   │
└───┴───┘
    │
    ▼
  响应输出

这种图结构的设计使得工作流具有高度的可扩展性。开发者可以轻松添加新的处理节点,如新的模型接入、自定义工具或特定的后处理逻辑。


6

章节 06

RAG 检索增强生成

PolyMind 的 RAG 模块实现了完整的文档处理流水线:

7

章节 07

文档摄取与处理

系统支持 PDF 和纯文本文件的批量摄取。文档首先经过分块处理(Chunking),将长文档分割成语义完整的片段。然后使用 Sentence Transformers 生成向量嵌入,存储到 ChromaDB 向量数据库中。

8

章节 08

语义检索与源追踪

当用户提出问题时,系统执行以下步骤:

  1. 查询向量化: 将用户问题转换为向量表示
  2. 相似度搜索: 在 ChromaDB 中查找最相关的文档片段
  3. 相关性评分: 对检索结果进行排序和过滤
  4. 源追踪: 记录每个回答所引用的原始文档来源

源追踪功能对于企业级应用尤为重要,它确保了 AI 回答的可验证性和透明度,用户可以随时查看答案依据的具体文档位置。