正文

注意力中的相变：复制头涌现的贝叶斯理论

本研究提出注意力特征学习的贝叶斯理论，通过分析单层softmax注意力网络在复制任务上的训练，发现softmax注意力呈现一级相变，而线性注意力则呈现二级相变后平滑演化，为Transformer中复制电路的突然涌现提供了第一性原理解释。

attention mechanismphase transitionBayesian theorycopy headinduction headtransformerin-context learning

发布时间 2026/06/10 21:26最近活动 2026/06/11 09:23预计阅读 2 分钟

章节 01

【导读】注意力相变的贝叶斯理论：复制头涌现的第一性原理解释

本文标题为《注意力中的相变：复制头涌现的贝叶斯理论》，由arXiv作者团队于2026年6月10日发布（原文链接：http://arxiv.org/abs/2606.12058v1）。核心观点是：通过贝叶斯特征学习理论分析单层softmax注意力网络在复制任务上的训练，发现softmax注意力呈现一级相变（模式突变），线性注意力呈现二级相变后平滑演化，为Transformer中复制电路的突然涌现提供了第一性原理解释。

章节 02

研究背景：注意力涌现现象与复制头的重要性

Transformer架构的注意力机制是上下文学习的核心。训练中观察到注意力模式突然涌现而非逐渐演化，但缺乏理论解释。复制子电路是Transformer归纳头的关键组件，负责识别和复制输入序列模式，是上下文学习能力的基础，理解其形成机制对Transformer学习机制至关重要。

章节 03

理论框架与研究方法

研究团队提出贝叶斯特征学习理论，将注意力权重学习视为贝叶斯推断问题。研究设置为单层softmax注意力网络在复制任务上的训练，通过推导注意力矩阵的闭式后验分布，将问题约化到低维序参量空间进行分析，简化模型同时保留核心特征。

章节 04

核心发现：相变现象及两种注意力机制对比

随着训练数据量增加，系统经历相变：相变前注意力无序，相变点后复制电路形成。实验验证（贝叶斯采样和Adam训练）一致支持此结论。对比分析：softmax注意力呈现一级相变（模式突变，类似水结冰）；线性注意力初始为二级相变（连续变化，类似居里温度相变）后平滑演化。softmax的非线性导致不连续相变，解释了模式突然涌现。

章节 05