章节 01
DeepSparkInference项目导读
DeepSparkInference项目导读
DeepSparkInference是DeepSpark开源社区核心项目,提供216个在国产天数智芯GPU上运行的推理模型示例,涵盖CV、NLP、语音合成及大语言模型等领域,支持vLLM、TGI、LMDeploy等主流推理框架,为国产AI芯片生态建设提供重要支撑。
正文
DeepSparkInference是DeepSpark开源社区的核心项目,提供216个在国产天数智芯GPU上运行的推理模型示例,涵盖CV、NLP、语音合成及大语言模型等多个领域,支持vLLM、TGI、LMDeploy等主流推理框架,为国产AI芯片生态建设提供重要支撑。
章节 01
DeepSparkInference是DeepSpark开源社区核心项目,提供216个在国产天数智芯GPU上运行的推理模型示例,涵盖CV、NLP、语音合成及大语言模型等领域,支持vLLM、TGI、LMDeploy等主流推理框架,为国产AI芯片生态建设提供重要支撑。
章节 02
人工智能发展中,模型推理硬件支撑是关键制约因素。长期以来高端AI芯片市场被国外垄断,国产GPU在软件生态和模型支持上存在短板。DeepSparkInference于2024年3月开源,旨在填补空白,提供丰富模型推理示例与完整工具链,为国产AI芯片生态注入动力。
章节 03
项目围绕天数智芯两款推理引擎展开:
章节 04
216个模型按领域分类:
章节 05
章节 06
项目是国产GPU从"能用"到"好用"的里程碑,为AI开发者提供评估窗口,为企业提供算力自主可控选择,推动国产AI产业进步。