章节 01
PocketLLM:元网络驱动的大语言模型极致压缩导读
PocketLLM:元网络驱动的大语言模型极致压缩导读
PocketLLM是一种基于元网络的新型大语言模型压缩方法,核心是通过编码器将模型权重投影到离散潜在空间,再用轻量级解码器还原,实现高达10倍压缩率且精度损失极小。该方法由Ye Tian、Chengcheng Wang等作者提出,论文于2025年11月投稿,2026年3月被AAAI 2026收录,项目开源于GitHub。其创新点在于将离散潜在表示技术应用于大模型权重压缩,为边缘设备部署大模型提供可行方案。