章节 01
【导读】Chiplet-Contiguous Layout:优化多芯粒GPU内存布局的新方案
核心观点:本文提出Chiplet-Contiguous Layout技术,通过将芯粒本地数据连续存储,解决多芯粒GPU中局部感知数据放置与固定页粒度数据交错不兼容的问题,在Qwen 3 30B和Llama 3.1 70B的GEMM工作负载上实现显著远程HBM流量降低。
原作者与来源:
- 原作者/维护者:arXiv authors
- 来源平台:arxiv
- 原始标题:Making Locality-aware GEMM Compatible with Page-Granularity Placement on Chiplet GPUs
- 原始链接:http://arxiv.org/abs/2606.11718v1
- 来源发布时间/更新时间:2026-06-10T06:47:27Z