章节 01
【导读】LSE-MTP:解决MTP结构性幻觉,构建一致世界模型
大型语言模型(LLMs)的内部世界模型一致性是AI领域核心争论。传统多令牌预测(MTP)虽能学习结构化表示,但存在结构性幻觉问题(离散令牌监督导致潜在空间捷径,违反环境约束)。本研究提出潜在语义增强多令牌预测(LSE-MTP)方法,通过锚定真实隐藏状态轨迹,弥合离散令牌与连续状态表示的差距,有效解决结构性幻觉,提升世界模型的一致性与鲁棒性。
正文
研究提出 LSE-MTP 方法,通过将预测锚定到真实隐藏状态轨迹,解决标准多令牌预测中的结构性幻觉问题,有效弥合离散令牌与连续状态表示之间的差距。
章节 01
大型语言模型(LLMs)的内部世界模型一致性是AI领域核心争论。传统多令牌预测(MTP)虽能学习结构化表示,但存在结构性幻觉问题(离散令牌监督导致潜在空间捷径,违反环境约束)。本研究提出潜在语义增强多令牌预测(LSE-MTP)方法,通过锚定真实隐藏状态轨迹,弥合离散令牌与连续状态表示的差距,有效解决结构性幻觉,提升世界模型的一致性与鲁棒性。
章节 02
学术界对LLMs是否具备真正世界模型存在分歧:一方认为是统计模式匹配器,仅学词语相关性;另一方认为形成内部模型可推理世界状态。争论核心在于内部表示是否捕捉世界结构,还是仅记表面规律。
传统下一令牌预测(NTP)聚焦单步准确性,难捕捉长程结构;多令牌预测(MTP)同时预测多个未来令牌,鼓励学习结构化表示,通过梯度耦合诱导表示收缩性,促进内部信念收敛。
章节 03
MTP的梯度归纳偏置带来表示收缩性,使相似输入映射到相似潜在表示,利于结构化学习。但标准MTP存在结构性幻觉:离散令牌监督鼓励潜在空间捷径,违反真实世界约束(如物理规律),导致分布外数据下脆弱性。
章节 04
LSE-MTP核心是将预测锚定到真实隐藏状态轨迹,采用双重监督:既预测未来令牌,也预测对应真实世界状态(如物理位置、速度)。此机制防止违反约束的潜在表示,弥合离散令牌与连续状态差距,提供额外训练信号增强鲁棒性。
章节 05
研究在两类任务验证LSE-MTP:
章节 06
LSE-MTP实现表示对齐,潜在表示更符合真实世界语义结构,增强可解释性与泛化能力;同时提升鲁棒性,面对分布外数据或扰动时性能更稳定,解决标准MTP的脆弱性问题。
章节 07
LSE-MTP是构建可信世界模型的重要一步,强调监督信号需兼顾任务性能与真实结构,为训练真正理解世界的AI提供新思路。