章节 01
ChartCynics:双路径智能体框架破解误导性图表的视觉欺骗(导读)
ChartCynics通过诊断视觉路径和OCR数据路径的双轨机制,结合Oracle-Informed SFT和Deception-Aware GRPO两阶段训练,在误导性图表问答任务上实现74.43%准确率,较基线提升约29%。该框架旨在解决视觉欺骗带来的认知挑战,为可信AI系统提供新的设计思路。
正文
ChartCynics通过诊断视觉路径和OCR数据路径的双轨机制,结合Oracle-Informed SFT和Deception-Aware GRPO两阶段训练,在误导性图表问答任务上实现74.43%准确率,较基线提升约29%。
章节 01
ChartCynics通过诊断视觉路径和OCR数据路径的双轨机制,结合Oracle-Informed SFT和Deception-Aware GRPO两阶段训练,在误导性图表问答任务上实现74.43%准确率,较基线提升约29%。该框架旨在解决视觉欺骗带来的认知挑战,为可信AI系统提供新的设计思路。
章节 02
在信息爆炸时代,图表成为数据传播的主要载体,但也易被用于误导(如倒置坐标轴、扭曲比例尺等)。现有视觉-语言模型(VLM)在标准图表理解任务表现良好,但面对误导性图表时存在不足:采用整体式感知策略难以识别局部结构异常,且缺乏对“视觉欺骗”的内在理解,无法主动质疑所见内容。
章节 03
ChartCynics引入“怀疑主义”推理范式,主动验证图表信息。框架采用双路径架构:
章节 04
ChartCynics采用两阶段训练:
章节 05
在误导性图表问答基准上,ChartCynics取得74.43%和64.55%准确率,较Qwen3-VL-8B基线提升约29%,且超越当前最先进专有模型。错误模式分析显示,剩余错误主要源于多种欺骗手段组合导致的信息过载。
章节 06
ChartCynics的核心贡献包括:
章节 07
ChartCynics的应用场景包括: