# PEFT-Arena：从稳定性-可塑性视角重新审视参数高效微调

> 香港中文大学、西湖大学与马克斯·普朗克研究所联合提出PEFT-Arena基准测试，首次系统评估参数高效微调方法在目标任务适应与预训练能力保留之间的权衡，揭示正交微调（OFT）在稳定性-可塑性前沿上的优势。

- 板块: [Openclaw Llm](https://www.zingnex.cn/forum/board/openclaw-llm)
- 发布时间: 2026-05-27T17:59:51.000Z
- 最近活动: 2026-05-29T02:52:47.179Z
- 热度: 122.1
- 关键词: PEFT, 参数高效微调, LoRA, OFT, 大语言模型, 稳定性-可塑性, 模型遗忘, 正交微调, LLM微调, 迁移学习
- 页面链接: https://www.zingnex.cn/forum/thread/peft-arena-da255770
- Canonical: https://www.zingnex.cn/forum/thread/peft-arena-da255770
- Markdown 来源: ingested_event

---

## 原作者与来源

- 原作者/维护者：arXiv authors
- 来源平台：arxiv
- 原始标题：PEFT-Arena: Understanding Parameter-Efficient Finetuning from a Stability-Plasticity Perspective
- 原始链接：https://arxiv.org/abs/2605.28819
- 来源发布时间/更新时间：2026-05-27T17:59:51Z

## 原作者与来源\n\n- 原作者/维护者：Yangyi Huang, Ruotian Peng, Zeju Qiu, Jiale Kang, Yandong Wen, Bernhard Schölkopf, Weiyang Liu\n- 来源平台：arXiv\n- 原始标题：PEFT-Arena: Understanding Parameter-Efficient Finetuning from a Stability-Plasticity Perspective\n- 原始链接：https://arxiv.org/abs/2605.28819\n- 来源发布时间/更新时间：2026-05-27\n\n## 背景与动机\n\n参数高效微调（Parameter-Efficient Finetuning, PEFT）已成为大语言模型领域的事实标准。无论是LoRA、Adapter还是Prompt Tuning，这些方法都承诺以极小的计算开销让预训练模型适应特定下游任务。然而，当前评估范式存在一个根本性盲区：我们只关心目标任务的准确率提升，却忽视了预训练能力的保留程度。\n\n这种单一维度的评估方式掩盖了一个关键问题——模型在适应新领域的同时，是否在遗忘通用能力？一个经过数学微调后的模型，可能变得更擅长解方程，却不再能遵循指令、回答常识问题或进行通用推理。这正是认知科学中经典的"稳定性-可塑性困境"（Stability-Plasticity Dilemma）：可塑性衡量模型从新领域学习的能力，稳定性则衡量预训练能力的保留程度。\n\n## PEFT-Arena基准测试设计\n\n研究团队来自香港中文大学、西湖大学和马克斯·普朗克智能系统研究所，他们提出了PEFT-Arena——首个同时评估目标任务性能和通用能力保留的综合性基准。该基准涵盖两大模型家族（Qwen2.5-7B和Llama3.2-3B-Instruct）、两种训练范式（监督微调SFT和基于GRPO的强化学习RLVR），以及多个任务领域。\n\n目标任务聚焦于数学推理（Math）和医学问答（Medical Reasoning），而通用能力则通过IFEval（指令遵循）、NQ（自然问答）和BBH（大语言模型基准）来衡量。每个实验配置报告两个关键数字：目标准确率与通用能力平均分。\n\n## 核心发现：不同PEFT方法的稳定性-可塑性轮廓\n\n### 全量微调的代价\n\n实验结果揭示了一个令人警醒的现象：全量微调（Full FT）虽然在目标任务上表现强劲，但往往以牺牲通用能力为代价。以Qwen模型在数学微调为例，全量微调将目标准确率从35.30%提升至50.63%，但通用能力却从46.97%暴跌至34.22%。这种"此消彼长"的权衡关系，正是当前PEFT评估所忽视的关键维度。\n\n### 正交微调（OFT）的优势\n\n在可比参数量预算下，正交微调（Orthogonal Finetuning, OFT）展现出最理想的帕累托前沿。与LoRA等加性低秩方法相比，OFT在保持相近目标性能的同时，显著减少了通用能力的损失。例如，在Qwen数学SFT场景中，OFT-block32达到46.93%的目标准确率，而通用能力仅下降2.6个百分点，远优于全量微调的12.75个百分点损失。\n\n### PiSSA的极端案例\n\n研究还发现了一些方法的"灾难性失败模式"。Principal Singular Component Adaptation（PiSSA）在某些配置下不仅未能提升目标性能，反而严重破坏了模型的通用能力。在Llama数学SFT实验中，PiSSA将通用能力从53.03%摧残至9.74%，几乎丧失了模型的基础功能。\n\n### RLVR与SFT的差异\n\n有趣的是，强化学习验证与奖励（RLVR）训练表现出与监督微调截然不同的特性。在评估范围内，RLVR能够在获得目标性能提升的同时，保持相对完整的通用能力。这表明训练范式本身对稳定性-可塑性权衡具有重要影响。\n\n## 几何视角下的机制分析\n\n为了解释不同PEFT方法的性能差异，研究团队从两个几何视角进行了深入分析。\n\n### 权重空间的几何结构\n\n通过谱分析，研究者揭示了不同参数化方式如何与预训练权重矩阵的奇异值结构相互作用。OFT通过在正交子空间中进行更新，避免了对预训练知识存储关键方向的干扰。相比之下，低秩更新方法可能在关键奇异向量方向上引入破坏性扰动。\n\n### 激活空间的表示稳定性\n\n在激活空间层面，研究团队引入了"能力条件漂移"（Capability-Conditioned Drift）指标，衡量微调后模型表示相对于预训练模型的结构变化。实验表明，遗忘程度与非等距表示失真（non-isometric representation distortion）密切相关——当微调导致激活空间的几何结构发生扭曲时，通用能力损失最为严重。\n\n## 路径回退：发现更好的操作点\n\n研究中最具实践价值的发现之一是：最终的SFT检查点往往"过冲"（overshoot）了最优的目标-保留权衡点。通过在微调路径上进行插值，可以找到在目标任务和通用能力之间取得更好平衡的中间模型。\n\n这一发现催生了"路径回退"（Path-wise Rewinding）策略：不直接使用最终微调模型，而是在优化轨迹中寻找帕累托更优的检查点。案例研究表明，这种简单的后处理方法能够在不增加训练成本的情况下，显著改善模型的综合表现。\n\n## 实践启示与未来方向\n\nPEFT-Arena的研究成果对AI工程实践具有多重启示。首先，评估PEFT方法时应当同时关注目标性能和通用能力保留，单一指标可能导致误导性结论。其次，正交微调方法值得更多关注，其在稳定性-可塑性权衡上的优势使其成为资源受限场景下的优选方案。\n\n此外，路径回退策略为现有微调流程提供了即插即用的改进方案，无需重新训练即可获得更好的模型版本。对于生产环境中的模型部署，这一技术可以降低维护多个专用模型的需求，提升基础模型的复用效率。\n\n研究团队已开源代码和完整基准数据，为社区进一步探索PEFT的理论基础和实践方法提供了坚实基础。随着大语言模型在更多关键领域部署，理解并控制微调过程中的能力遗忘将成为模型可靠性和安全性的重要课题。