章节 01
n8n多智能体意图路由系统核心价值:85%成本削减与90.7%路由准确率的生产实践
基于n8n构建的多智能体意图路由系统,通过模型分级策略实现智能分发查询到不同成本LLM,在保持90.7%路由准确率的同时削减85.5%成本,并提供完整离线评估框架。项目由MatruPrasad09维护,源码见GitHub(https://github.com/MatruPrasad09/n8n-multi-agent-intent-router),发布于2026年5月24日。
正文
基于n8n构建的多智能体意图路由系统,通过将查询智能分发到不同成本的LLM模型,在保持90.7%路由准确率的同时实现85.5%的成本削减,并提供了完整的离线评估框架。
章节 01
基于n8n构建的多智能体意图路由系统,通过模型分级策略实现智能分发查询到不同成本LLM,在保持90.7%路由准确率的同时削减85.5%成本,并提供完整离线评估框架。项目由MatruPrasad09维护,源码见GitHub(https://github.com/MatruPrasad09/n8n-multi-agent-intent-router),发布于2026年5月24日。
章节 02
在LLM应用生产中,如何在保证响应质量的前提下控制推理成本是永恒矛盾。本项目针对此问题,提出基于n8n的多智能体意图路由方案,通过智能分发查询到不同成本模型,解决平衡难题。
章节 03
系统采用三层路由架构:入口层(Webhook接收请求)→路由层(Groq Llama3.3 70B意图分类)→执行层(分发到三路径智能体)。三路径设计:PathA(支持类,Gemini2.5 Flash,占比41.9%)、PathB(技术类,Groq Llama3.3 70B,占比43%)、PathC(回退/未知,Groq Llama3.3 70B,占比15.1%)。置信度阈值设为0.75,是利用率与安全性的最优平衡(0.75时99%查询进入专用智能体,提高到0.85则降至83%)。
章节 04
成本节省:86次查询中,系统成本$0.0246 vs全量GPT-4o的$0.1701,节省85.5%;日1万次查询时,年度节省超$6000。质量指标:路由准确率90.7%(支持类F1=0.92,技术类F1=0.90,未知类F1=0.90);对抗性查询抑制率81.3%;平均响应延迟<1秒。LLM评判:GPT-OSS 120B作为标准,相关性通过率81.8%,角色一致性61%(技术智能体需优化)。
章节 05
JSON一致性:三层策略(API级JSON约束→正则提取→默认未知路径),优先API层面强制语法。延迟优化:路由层开销P50=342ms,用户同步响应,日志/评估异步。n8n选择:POC阶段利用其可视化调试、Webhook处理优势;生产环境建议迁移到Temporal或FastAPI+asyncio以处理高并发和幂等性。
章节 06
V2规划:幂等性(Redis去重)、超时预算、熔断机制、流式响应、编排层迁移、角色调优(技术智能体一致性到85%+)、对抗性强化(抑制率到95%+)。数据隐私:生产需PII脱敏(Microsoft Presidio/AWS Comprehend)、查询哈希(SHA-256)、分层日志保留(原始日志24-48h,指标90天)。
章节 07
n8n多智能体意图路由系统证明:并非所有查询都需最强模型。通过意图分类与模型分级,实现高质量下的显著成本削减。项目提供完整评估框架与局限性分析,适合需优化LLM应用成本的团队参考。