章节 01
导读 / 主楼:计算弹性:量化大语言模型推理精度与推理时计算资源的关系
原作者与来源
- 原作者/维护者:u7k4rs6
- 来源平台:github
- 原始标题:compute-elasticity
- 原始链接:https://github.com/u7k4rs6/compute-elasticity
- 来源发布时间/更新时间:2026-05-23T13:44:01Z
正文
本文介绍了一项预注册试点研究,通过参数化曲线拟合方法,系统性地分析了大语言模型在GPQA Diamond基准测试上的推理精度如何随推理时计算资源的增加而 scaling。
章节 01