章节 01
PEFT-Arena:从稳定性-可塑性视角重新审视参数高效微调
香港中文大学、西湖大学与马克斯·普朗克研究所联合提出PEFT-Arena基准测试,首次系统评估参数高效微调(PEFT)方法在目标任务适应与预训练能力保留之间的权衡,揭示正交微调(OFT)在稳定性-可塑性前沿上的优势。该研究填补了当前PEFT评估范式中忽视预训练能力保留的盲区,为理解PEFT方法提供新视角。
正文
香港中文大学、西湖大学与马克斯·普朗克研究所联合提出PEFT-Arena基准测试,首次系统评估参数高效微调方法在目标任务适应与预训练能力保留之间的权衡,揭示正交微调(OFT)在稳定性-可塑性前沿上的优势。
章节 01
香港中文大学、西湖大学与马克斯·普朗克研究所联合提出PEFT-Arena基准测试,首次系统评估参数高效微调(PEFT)方法在目标任务适应与预训练能力保留之间的权衡,揭示正交微调(OFT)在稳定性-可塑性前沿上的优势。该研究填补了当前PEFT评估范式中忽视预训练能力保留的盲区,为理解PEFT方法提供新视角。
章节 02
参数高效微调(PEFT)已成为大语言模型领域事实标准(如LoRA、Adapter、Prompt Tuning),承诺以极小计算开销适应下游任务。但当前评估仅关注目标任务准确率,忽视预训练能力保留——模型可能在适应新任务时遗忘通用能力(如指令遵循、常识推理)。这正是认知科学中的"稳定性-可塑性困境":可塑性是学习新领域的能力,稳定性是保留预训练能力的程度。
章节 03
PEFT-Arena是首个同时评估目标任务性能和通用能力保留的综合性基准,由香港中文大学、西湖大学和马克斯·普朗克智能系统研究所团队提出。基准涵盖:
章节 04
实验揭示关键现象:
章节 05
从两个几何视角解释PEFT方法差异:
章节 06
研究发现最终SFT检查点常"过冲"最优权衡点。通过在微调路径上插值,可找到目标任务与通用能力平衡更好的中间模型。基于此提出"路径回退"策略:不使用最终模型,而是在优化轨迹中找帕累托更优检查点。该策略无需增加训练成本,显著改善模型综合表现。
章节 07
研究对AI实践的启示: