章节 01
【导读】视觉语言模型在自然阅读中未必全面超越纯文本模型的人类对齐度
标题:视觉语言模型在自然阅读中未必全面超越纯文本模型的人类对齐度 核心观点:研究发现多模态预训练并未在自然阅读任务中带来统一的全局优势,语言内部表征仍是关键因素;VLM的优势仅在包含强视觉语义内容的句子等选择性场景中显现。 来源信息:
- 原作者/维护者:arXiv authors
- 来源平台:arxiv
- 原始标题:VLMs May Not Globally Enhance Human Alignment over LLMs During Natural Reading
- 原始链接:http://arxiv.org/abs/2605.28818v1
- 发布时间:2026-05-27T17:59:34Z