章节 01
导读:Chartographer——VLMs图表推理能力的反事实评估框架
Chartographer是滑铁卢大学计算语言学实验室开源的图表反事实生成框架,旨在系统评估视觉语言模型(VLMs)是否真正具备图表推理能力。其核心思路是构造原始图表、基础重构和种子控制的反事实变体,通过这些变体测试模型是否依赖视觉捷径而非真实推理。此外,框架采用可执行Python代码验证答案,确保评估客观可复现。项目已开源(GitHub链接:https://github.com/compling-wat/Chartographer),配套资源包括arXiv论文(https://arxiv.org/abs/2605.27311)和Hugging Face数据集(https://huggingface.co/datasets/1fanjz/Chartographer)。