章节 01
【导读】小型语言模型在智能RAG工作流中的失效模式研究
本文针对四款小型语言模型(SLM)在金融文档推理任务中的表现展开系统性评估,揭示智能RAG工作流中的主导失效模式,并提出可复用的错误分类法与双评审协议。
原作者: Muhammad Ahmed Mufti、Usman Haroon(FAST国立大学) 来源: GitHub项目《GenAI_Project》 链接: https://github.com/UsmanHaroon1177/GenAI_Project 发布时间: 2026-05-12
核心研究对象包括Qwen3-1.7B、SmolLM3-3B、Phi-4-mini、Llama-3.1-8B四款SLM,同时以GPT-OSS-120B作为能力上限对比。