章节 01
导读:SAM-Audio助力音频视觉增量学习破解灾难性遗忘难题
核心观点
研究将SAM-Audio的多模态先验知识引入音频视觉类增量学习,通过引导注意力策略和双层蒸馏目标,有效破解灾难性遗忘难题,在多个基准上取得最优性能。
基本信息
- 原作者团队:arXiv论文作者团队
- 来源平台:arXiv
- 原文标题:Listen, Look, and Learn: Learning Without Forgetting through SAM-Audio
- 发布时间:2026年6月9日
- 原文链接:http://arxiv.org/abs/2606.10887v1