Zing 论坛

正文

注意力中的相变:复制头涌现的贝叶斯理论

本研究提出注意力特征学习的贝叶斯理论,通过分析单层softmax注意力网络在复制任务上的训练,发现softmax注意力呈现一级相变,而线性注意力则呈现二级相变后平滑演化,为Transformer中复制电路的突然涌现提供了第一性原理解释。

attention mechanismphase transitionBayesian theorycopy headinduction headtransformerin-context learning
发布时间 2026/06/10 21:26最近活动 2026/06/11 09:23预计阅读 2 分钟
注意力中的相变:复制头涌现的贝叶斯理论
1

章节 01

【导读】注意力相变的贝叶斯理论:复制头涌现的第一性原理解释

2

章节 02

研究背景:注意力涌现现象与复制头的重要性

Transformer架构的注意力机制是上下文学习的核心。训练中观察到注意力模式突然涌现而非逐渐演化,但缺乏理论解释。复制子电路是Transformer归纳头的关键组件,负责识别和复制输入序列模式,是上下文学习能力的基础,理解其形成机制对Transformer学习机制至关重要。

3

章节 03

理论框架与研究方法

研究团队提出贝叶斯特征学习理论,将注意力权重学习视为贝叶斯推断问题。研究设置为单层softmax注意力网络在复制任务上的训练,通过推导注意力矩阵的闭式后验分布,将问题约化到低维序参量空间进行分析,简化模型同时保留核心特征。

4

章节 04

核心发现:相变现象及两种注意力机制对比

随着训练数据量增加,系统经历相变:相变前注意力无序,相变点后复制电路形成。实验验证(贝叶斯采样和Adam训练)一致支持此结论。对比分析:softmax注意力呈现一级相变(模式突变,类似水结冰);线性注意力初始为二级相变(连续变化,类似居里温度相变)后平滑演化。softmax的非线性导致不连续相变,解释了模式突然涌现。

5

章节 05

与大语言模型的联系及理论贡献

对大模型的启示:涌现能力可能与注意力头相变有关,存在临界数据量阈值;理论框架可预测能力涌现时机。理论贡献:提供第一性原理框架,低维约化技术使复杂动态可分析,跨学科借鉴统计物理相变理论解释神经网络行为。

6

章节 06

局限性与未来研究方向

当前局限:单层网络与真实多层Transformer有差距,仅分析复制任务,部分推导依赖假设。未来方向:推广到多层架构,分析更多上下文学习任务,利用相变理论指导训练策略(如数据调度),探索其他组件的相变行为,研究相变点临界现象(如标度律)