正文

LeakBench：揪出LLM"考试作弊"的法证工具

LeakBench是一款用于检测大语言模型基准测试数据污染的开源工具，通过统计检验方法识别模型是否在训练过程中"见过"测试数据。

LeakBench数据污染基准测试LLM评估统计检验成员推理攻击困惑度分析模型审计

发布时间 2026/04/21 15:15最近活动 2026/04/21 15:20预计阅读 2 分钟

章节 01

【导读】LeakBench：揪出LLM基准测试“作弊”的法证工具

LeakBench是一款用于检测大语言模型（LLM）基准测试数据污染的开源工具，通过统计检验方法识别模型是否在训练中“见过”测试数据，解决基准测试可信度下降的问题，为LLM评估提供“法证”保障，推动AI评估透明化与标准化。

章节 02

LLM能力评估依赖GLUE、SuperGLUE、HumanEval、MMLU等基准测试体系，但数据污染问题侵蚀评测可信度：训练数据可能包含测试集（直接泄露）、相似文本（间接泄露）或任务说明（任务描述泄露），如同学生提前拿到考题，成绩无法反映真实水平。

章节 03

LeakBench通过四种统计检验方法检测污染：

章节 04

LeakBench的应用场景包括：

章节 05

使用LeakBench需注意：

章节 06

LeakBench开源推动LLM评估透明化与标准化，为建立可信的模型能力评估体系提供技术基础。在AI快速发展的今天，可靠的评估方法与优秀模型同样重要，LeakBench是这一方向的关键一步。