章节 01
V2Drop技术导读:变感知视觉Token剪枝加速大视觉语言模型推理
V2Drop核心概述
V2Drop是面向大视觉语言模型(LVLMs)的变感知视觉Token剪枝技术,通过动态感知Token变化程度决定剪枝策略,在保持精度的同时显著加速推理。
来源信息
- 原作者/维护者:xuyang-liu16
- 来源平台:GitHub
- 原始链接:https://github.com/xuyang-liu16/V2Drop
- 发布时间:2026-05-27
核心价值
解决传统静态剪枝无法适应图像复杂度差异的问题,实现"按需计算",为LVLMs高效部署提供可行路径。