章节 01
【导读】SKIM:自适应多分辨率程序性知识压缩框架核心介绍
本文介绍SKIM,一种针对LLM程序性技能的自适应多分辨率软token压缩框架,可将技能文本压缩至原长度的30%-60%,同时保持任务性能优于现有压缩方法。SKIM专为程序性知识设计,解决LLM上下文膨胀问题,提升推理效率。原作者为bebr2,来源arXiv,发布时间2026-06-10,开源代码见GitHub:https://github.com/bebr2/SKIM。
正文
本文介绍SKIM,一种针对LLM程序性技能(procedural skills)的自适应多分辨率软token压缩框架,可将技能文本压缩至原长度的30%-60%,同时保持任务性能优于现有压缩方法。
章节 01
本文介绍SKIM,一种针对LLM程序性技能的自适应多分辨率软token压缩框架,可将技能文本压缩至原长度的30%-60%,同时保持任务性能优于现有压缩方法。SKIM专为程序性知识设计,解决LLM上下文膨胀问题,提升推理效率。原作者为bebr2,来源arXiv,发布时间2026-06-10,开源代码见GitHub:https://github.com/bebr2/SKIM。
章节 02
大型语言模型(LLM)正演变为智能代理,需加载多技能导致上下文膨胀,增加预填充成本和推理延迟。现有压缩方法针对事实性知识,无法保留程序性知识的逻辑依赖、工具协议、条件分支等结构信息,易破坏技能执行所需的关键依赖关系。
章节 03
SKIM提出有效技能压缩的三个核心要求:1.保留逻辑依赖:确保压缩后仍能维持工作流和工具协议的逻辑关系;2.支持轻量级离线压缩:适应社区技能快速迭代,无需昂贵重新训练;3.适应不同复杂度:根据技能复杂度(步骤、嵌套、分支等)自适应调整压缩率。
章节 04
SKIM是自适应多分辨率软token压缩框架:1.软token机制:将文本转为连续向量表示,信息密度高、可微分优化、保留语义结构;2.自适应多分辨率策略:通过复杂度评估选择压缩分辨率,动态生成不同数量软token;3.离线流程:技能解析→依赖图构建→软token生成→质量验证。
章节 05
SKIM压缩率达30%-60%(依技能复杂度),任务性能优于未压缩原始技能及现有方法。优势包括:更好保留程序性知识、更高压缩效率、更低计算开销。推理效率提升显著:预填充时间减少、内存占用降低、端到端延迟改善。
章节 06
SKIM适用于:1.智能代理平台(如GPTs、Claude Artifacts):降低技能加载开销,支持多技能同时加载;2.企业知识库:高效集成标准操作流程、故障排查指南等;3.社区技能生态:轻量级离线压缩适配快速迭代的开源技能库。
章节 07
当前局限:领域适应性(需针对医疗/法律等垂直领域调优)、可解释性(软token不如自然语言易调试)、跨模型兼容性(绑定特定架构)。未来方向:多模态技能压缩、运行时动态自适应压缩率、联邦压缩保护隐私。
章节 08