正文

n8n多智能体意图路由系统：通过模型分级策略实现85%成本削减的生产实践

基于n8n构建的多智能体意图路由系统，通过将查询智能分发到不同成本的LLM模型，在保持90.7%路由准确率的同时实现85.5%的成本削减，并提供了完整的离线评估框架。

n8n多智能体意图路由成本优化GroqGeminiLLM评估

发布时间 2026/05/24 15:11最近活动 2026/05/24 15:22预计阅读 2 分钟

章节 01

n8n多智能体意图路由系统核心价值：85%成本削减与90.7%路由准确率的生产实践

基于n8n构建的多智能体意图路由系统，通过模型分级策略实现智能分发查询到不同成本LLM，在保持90.7%路由准确率的同时削减85.5%成本，并提供完整离线评估框架。项目由MatruPrasad09维护，源码见GitHub（https://github.com/MatruPrasad09/n8n-multi-agent-intent-router），发布于2026年5月24日。

章节 02

LLM生产部署的核心矛盾：成本与质量的平衡挑战

在LLM应用生产中，如何在保证响应质量的前提下控制推理成本是永恒矛盾。本项目针对此问题，提出基于n8n的多智能体意图路由方案，通过智能分发查询到不同成本模型，解决平衡难题。

章节 03

三层路由架构与置信度阈值设计

系统采用三层路由架构：入口层（Webhook接收请求）→路由层（Groq Llama3.3 70B意图分类）→执行层（分发到三路径智能体）。三路径设计：PathA（支持类，Gemini2.5 Flash，占比41.9%）、PathB（技术类，Groq Llama3.3 70B，占比43%）、PathC（回退/未知，Groq Llama3.3 70B，占比15.1%）。置信度阈值设为0.75，是利用率与安全性的最优平衡（0.75时99%查询进入专用智能体，提高到0.85则降至83%）。

章节 04

成本与质量评估结果

成本节省：86次查询中，系统成本$0.0246 vs全量GPT-4o的$0.1701，节省85.5%；日1万次查询时，年度节省超$6000。质量指标：路由准确率90.7%（支持类F1=0.92，技术类F1=0.90，未知类F1=0.90）；对抗性查询抑制率81.3%；平均响应延迟<1秒。LLM评判：GPT-OSS 120B作为标准，相关性通过率81.8%，角色一致性61%（技术智能体需优化）。

章节 05

技术实现关键点

JSON一致性：三层策略（API级JSON约束→正则提取→默认未知路径），优先API层面强制语法。延迟优化：路由层开销P50=342ms，用户同步响应，日志/评估异步。n8n选择：POC阶段利用其可视化调试、Webhook处理优势；生产环境建议迁移到Temporal或FastAPI+asyncio以处理高并发和幂等性。

章节 06

生产强化路线图与数据隐私策略

V2规划：幂等性（Redis去重）、超时预算、熔断机制、流式响应、编排层迁移、角色调优（技术智能体一致性到85%+）、对抗性强化（抑制率到95%+）。数据隐私：生产需PII脱敏（Microsoft Presidio/AWS Comprehend）、查询哈希（SHA-256）、分层日志保留（原始日志24-48h，指标90天）。

章节 07