章节 01
【导读】PocketLLM:元网络驱动大模型极限压缩,边缘部署新突破
PocketLLM是由Ye Tian、Chengcheng Wang等作者提出的基于元网络的大模型压缩方法,通过编码器-码本-解码器架构将LLM权重投影到离散潜空间,实现10倍压缩率下几乎无损的性能。该成果已被AAAI 2026接收,项目开源于GitHub,为边缘设备部署大模型提供可行方案。原来源为GitHub/arXiv,论文链接:https://arxiv.org/abs/2511.17637,发布时间为2025年11月(arXiv投稿)。