# Estudio PolyMind: A Multi-LLM Intelligent Orchestration and RAG Platform Based on LangGraph

> A production-grade multi-LLM Retrieval-Augmented Generation (RAG) platform that orchestrates multiple open-source large language models via LangGraph workflows, supporting local deployment, persistent memory, and tool calling.

- 板块: [Openclaw Llm](https://www.zingnex.cn/en/forum/board/openclaw-llm)
- 发布时间: 2026-06-08T07:13:46.000Z
- 最近活动: 2026-06-08T07:20:56.643Z
- 热度: 161.9
- 关键词: LangGraph, RAG, 多LLM编排, Ollama, ChromaDB, FastAPI, 开源AI, 向量检索, Agentic AI
- 页面链接: https://www.zingnex.cn/en/forum/thread/estudio-polymind-langgraph-llm-rag
- Canonical: https://www.zingnex.cn/forum/thread/estudio-polymind-langgraph-llm-rag
- Markdown 来源: floors_fallback

---

## 导读 / 主楼：Estudio PolyMind：基于 LangGraph 的多 LLM 智能编排与 RAG 平台

一个生产级的多 LLM 检索增强生成（RAG）平台，通过 LangGraph 工作流编排多个开源大语言模型，支持本地部署、持久化记忆和工具调用。

## 原作者与来源

- **原作者/维护者**: Susanta Hazra (Susanta2025-lab)
- **来源平台**: GitHub
- **原始标题**: estudio-polymind-llm-orchestration
- **原始链接**: https://github.com/Susanta2025-lab/estudio-polymind-llm-orchestration
- **发布时间**: 2025年

---

## 项目概述

Estudio PolyMind 是一个生产级的多 LLM 检索增强生成（RAG）平台，它通过 LangGraph 工作流来编排多个开源大语言模型。该项目展示了现代 AI 工程和 Agentic AI 架构模式的最佳实践，特别适合希望在本地环境中构建企业级 AI 应用的开发者。

与单一模型方案不同，PolyMind 采用智能路由机制，根据查询类型和工作流需求动态选择最适合的模型。这种设计不仅提高了响应质量，还优化了计算资源的利用效率。

---

## 多 LLM 编排层

平台支持同时接入多个本地部署的开源模型，包括 Mistral、Qwen、Gemma 和 Phi。系统通过 Router Node 分析用户查询的特征，然后由 Model Router 将请求分发到最适合的处理路径。

这种架构的优势在于：
- **任务适配**: 不同模型擅长处理不同类型的任务，如代码生成、推理分析或创意写作
- **负载均衡**: 避免单一模型过载，提高系统整体吞吐量
- **容错能力**: 当某个模型不可用时，可自动切换至备选方案

## LangGraph 工作流引擎

项目采用 LangGraph 实现基于图的工作流编排，将复杂的 AI 处理流程抽象为可视化的节点网络：

```
用户查询
    │
    ▼
Router Node（路由节点）
    │
    ▼
Model Router（模型路由器）
    │
┌───┼───┐
│   │   │
▼   ▼   ▼
RAG 直接调用 工具调用
│   │   │
└───┴───┘
    │
    ▼
  响应输出
```

这种图结构的设计使得工作流具有高度的可扩展性。开发者可以轻松添加新的处理节点，如新的模型接入、自定义工具或特定的后处理逻辑。

---

## RAG 检索增强生成

PolyMind 的 RAG 模块实现了完整的文档处理流水线：

## 文档摄取与处理

系统支持 PDF 和纯文本文件的批量摄取。文档首先经过分块处理（Chunking），将长文档分割成语义完整的片段。然后使用 Sentence Transformers 生成向量嵌入，存储到 ChromaDB 向量数据库中。

## 语义检索与源追踪

当用户提出问题时，系统执行以下步骤：
1. **查询向量化**: 将用户问题转换为向量表示
2. **相似度搜索**: 在 ChromaDB 中查找最相关的文档片段
3. **相关性评分**: 对检索结果进行排序和过滤
4. **源追踪**: 记录每个回答所引用的原始文档来源

源追踪功能对于企业级应用尤为重要，它确保了 AI 回答的可验证性和透明度，用户可以随时查看答案依据的具体文档位置。

---
