章节 01
导读 / 主楼:OLMo-Detect:多阶段大语言模型数据污染检测基准
首个覆盖预训练、中训练和后训练三阶段的LLM逐字记忆检测基准,包含9个领域、多尺寸模型评估和12种检测方法对比。
正文
首个覆盖预训练、中训练和后训练三阶段的LLM逐字记忆检测基准,包含9个领域、多尺寸模型评估和12种检测方法对比。
章节 01
首个覆盖预训练、中训练和后训练三阶段的LLM逐字记忆检测基准,包含9个领域、多尺寸模型评估和12种检测方法对比。
章节 02
章节 03
大语言模型(LLM)的"数据污染"或"数据泄露"问题一直是评估领域的核心难题。当训练数据与测试数据存在重叠时,模型可能并非真正"理解"问题,而只是"背诵"了记忆中的答案。这种现象在学术基准测试、代码生成评估等场景中尤为严重。
然而,现有的污染检测研究存在几个关键局限:
OLMo-Detect正是为解决这些问题而设计的全面基准测试套件。
章节 04
OLMo-Detect基于OLMo 2训练流程构建,覆盖了现代LLM训练的所有三个阶段:
包含四个核心数据源:
章节 05
基准提供两种数据分割方式:
Matched(对齐版): 污染数据与未污染数据在三个维度上显式对齐——文本质量、时间范围和词汇相似度。这种设计确保了检测方法评估的公平性,排除了数据分布差异带来的干扰。
Shifted(偏移版): 污染数据采样时未与未污染数据进行分布对齐,用于测试检测方法在分布偏移场景下的鲁棒性。
章节 06
OLMo-Detect实现了12种污染检测方法,涵盖多个技术路线:
章节 07
章节 08