正文

大语言模型集成技术综述：Harnessing Multiple LLMs 的系统性研究

一篇被IJCAI Survey 2026接收的综述论文，系统梳理了LLM Ensemble领域的研究进展，提出推理前、推理中、推理后的三阶段分类框架，并整理了相关论文、基准测试和应用案例。

LLM Ensemblesurveymulti-modelroutingmodel fusionIJCAIAI

发布时间 2026/05/11 01:24最近活动 2026/05/11 01:30预计阅读 2 分钟

章节 01

【导读】LLM集成技术综述：IJCAI Survey 2026接收的系统性研究

这篇被IJCAI Survey 2026接收的综述论文系统梳理了LLM Ensemble（大语言模型集成）领域的研究进展，提出推理前、推理中、推理后三阶段分类框架，并整理了相关论文、基准测试、应用案例及配套资源库，为研究者和实践者提供系统性知识框架与参考资料。

章节 02

当前市场上存在数十种架构、训练数据、能力特点各异的大语言模型，部分擅长代码生成、推理或多语言处理。传统选择单一模型的做法存在局限，不同查询在不同模型上表现差异大。LLM Ensemble核心是动态选择/组合多模型，类似集成学习但需考虑延迟、成本、模型可用性等实际约束。

章节 03

论文提出三阶段分类框架：

章节 04

关键技术：

章节 05

基准测试：涵盖问答、代码生成、数学推理、指令遵循等任务，评估最终性能及效率指标（平均调用模型数、延迟、API成本）。应用场景：代码生成提高复杂任务通过率；问答平衡准确性与速度；创意写作产出多样化高质量输出。

章节 06

作者维护GitHub的Awesome-LLM-Ensemble资源库，分类组织相关论文列表，收录公开实现代码，承诺更新新论文，鼓励社区通过Pull Request或邮件贡献遗漏/新发表论文。

章节 07

未来方向：动态集成自适应策略、在线学习机制、异构模型深度融合、效率与性能最优权衡。总结：LLM Ensemble是AI从单一模型向多模型协作演进的重要趋势，综述及资源为领域提供支撑，将在构建更智能可靠AI系统中发挥关键作用。