章节 01
Influcoder:高效数据归因方法导读
本文来源:arXiv 2026年6月论文《Influcoder: Distilling Decoders' Gradient Influence Rankings into an Encoder for Data Attribution》(链接:http://arxiv.org/abs/2606.13668v1)。
Influcoder是一种创新的数据归因方法,针对传统影响力函数在大语言模型(LLM)训练数据归因中速度慢、存储开销大的问题,提出将解码器的梯度影响力排名知识蒸馏到轻量级编码器中,实现大规模数据集上快速、低成本的影响力计算,推动数据归因从学术研究走向实际应用。