章节 01
【导读】Neuro-RIT:神经元级精准调控提升RAG鲁棒性,抑制噪声干扰
Neuro-RIT针对检索增强生成(RAG)系统对检索质量高度敏感、易受噪声干扰的核心问题,基于LLM神经元稀疏性特性,通过归因分析挖掘区分相关/无关上下文的神经元,采用功能性关闭噪声相关神经元+两阶段指令微调策略,在多个知识密集型QA基准上持续超越基线方法,实现RAG系统鲁棒性显著提升。
正文
Neuro-RIT通过基于归因的神经元挖掘,区分处理相关/无关上下文的神经元,采用两阶段指令微调策略,在多个QA基准上 consistently 超越基线方法。
章节 01
Neuro-RIT针对检索增强生成(RAG)系统对检索质量高度敏感、易受噪声干扰的核心问题,基于LLM神经元稀疏性特性,通过归因分析挖掘区分相关/无关上下文的神经元,采用功能性关闭噪声相关神经元+两阶段指令微调策略,在多个知识密集型QA基准上持续超越基线方法,实现RAG系统鲁棒性显著提升。
章节 02
RAG架构依赖外部检索减少幻觉,但检索噪声会大幅降低模型性能,且LLM难以有效区分相关/无关信息。现有鲁棒性提升方法多在层或模块级别更新参数(如添加特殊token、设计注意力机制、对抗训练),粒度粗,效率低且易干扰模型其他任务能力。
章节 03
LLM前馈网络存在神经元级稀疏性,每次前向传播仅少量神经元激活。这意味着不同功能由不同神经元子集负责,特定任务依赖少量参数,精准调控比全局更新更有效。Neuro-RIT正是基于这一洞察,聚焦神经元级精准干预。
章节 04
通过积分梯度等归因分析方法,计算神经元对相关/无关文档的贡献度,识别相关神经元(正向贡献)和无关神经元(噪声激活且负贡献)。
训练时对无关神经元输出强制置零或抑制,直接关闭噪声相关神经通路。
章节 05
在Natural Questions、TriviaQA、HotpotQA等多个QA基准测试,对比标准RAG、对抗训练等方法:
章节 06
章节 07
章节 08