章节 01
【导读】上下文持续学习理论:揭示Transformer任务干扰与遗忘机制
原作者与来源
- 原作者/维护者:arXiv作者团队
- 来源平台:arXiv
- 原始标题:Understanding Generalization and Forgetting in In-Context Continual Learning
- 原始链接:http://arxiv.org/abs/2605.28705v1
- 来源发布时间/更新时间:2026-05-27
核心观点
本文提出首个上下文持续学习理论框架,通过线性注意力分析揭示标准注意力机制因均匀聚合历史上下文导致任务间干扰,提出偏差-方差-干扰误差分解,解释顺序敏感性和长提示性能退化现象。