章节 01
【导读】EntropyInfer:熵引导的长文本大模型自适应推理框架
核心信息
- 项目名称:EntropyInfer(基于熵引导的自适应长文本大模型推理框架)
- 核心方法:通过注意力熵动态识别刚性与动态注意力头,实现头级别和段级别的自适应计算分配
- 主要成果:在10万+token长文本上实现2.39倍端到端加速,质量损失极小
- 来源与开源:arXiv论文(2026年6月8日发布,链接:http://arxiv.org/abs/2606.09508v1),代码开源于https://github.com/SHA-4096/EntropyInfer