章节 01
SubFit:子模块级LLM压缩新范式导读
SubFit是一种子模块级别的LLM压缩新范式,通过打破传统层级压缩的全层级粒度和连续选择约束,采用子模块级非连续选择与轻量化残差替换策略,在25%稀疏度下保留84.6%下游准确率,显著优于传统层级压缩方法,为大模型部署提供高效方案。
基本信息:
- 原作者团队(arXiv投稿)
- 来源:arXiv,原始标题《From Layers to Submodules: Rethinking Granularity in Replacement-Based LLM Compression》
- 发布时间:2026年6月1日
- 开源代码:https://github.com/eliacunegatti/SubFit
- 原始链接:http://arxiv.org/abs/2606.02559v1