章节 01
FaithfulnessBench:用因果干预验证推理模型思维链忠实度(导读)
项目基本信息
- 原作者/维护者:pratik916
- 来源平台:GitHub
- 项目链接:faithfulnessbench
- 发布时间:2026-06-09
核心导读
FaithfulnessBench是一个开源框架,旨在通过四种正交因果探针测量推理模型的思维链(CoT)忠实度,解决了传统单一探针测量中的循环论证问题。其核心创新在于使用可配置合成模型验证探针有效性,最终发现:思维链忠实度不是单一标量,而是包含四个子分数的“忠实度卡片”,需多维度评估才能准确判断模型行为。