章节 01
【导读】腾讯混元Hy3-preview开源:295B MoE架构的高性价比推理与Agent模型
腾讯混元团队于2026年4月23日正式开源Hy3-preview模型,该模型采用295B总参数、21B激活参数的MoE架构,在STEM推理、代码生成和Agent任务上表现优异,同时保持出色的成本效益。模型支持256K长上下文窗口,提供多种部署方式并已在多平台开源,为高性价比推理方案提供新选择。
正文
腾讯混元团队开源Hy3-preview模型,采用295B总参数、21B激活参数的MoE架构,在STEM推理、代码生成和Agent任务上表现优异,同时保持出色的成本效益。
章节 01
腾讯混元团队于2026年4月23日正式开源Hy3-preview模型,该模型采用295B总参数、21B激活参数的MoE架构,在STEM推理、代码生成和Agent任务上表现优异,同时保持出色的成本效益。模型支持256K长上下文窗口,提供多种部署方式并已在多平台开源,为高性价比推理方案提供新选择。
章节 02
Hy3-preview是腾讯混元团队迄今发布的最强模型,采用混合专家架构(MoE):总参数量2950亿,每次推理仅激活210亿参数;配备38亿参数的MTP层,支持256K上下文窗口,词汇表规模120832;专家路由设计为192个专家中选择8个计算,稀疏激活大幅降低推理成本。
章节 03
Hy3-preview在STEM领域表现突出:在FrontierScience-Olympiad、IMOAnswerBench等高难度基准测试成绩优异;在2026年清华丘成桐数学博资考、2025年CHSBO竞赛中取得出色成绩;数学推理基准MATH准确率达76.28%,GSM8K小学数学问题准确率95.37%,这得益于团队重建强化学习训练基础设施并扩大训练任务规模。
章节 04
为评估真实场景能力,团队构建CL-bench和CL-bench-Life评测基准。Hy3-preview的256K上下文窗口可处理整本书籍、长篇技术文档等,无需分段避免信息丢失;在上下文学习和指令遵循方面均取得显著提升。
章节 05
Hy3-preview在代码生成和Agent领域进步显著:在SWE-bench Verified、Terminal-Bench 2.0等代码Agent基准竞争力强;BrowseComp、WideSearch等搜索Agent表现不俗;ClawEval、WildClawBench复杂Agent场景高分,Agent能力实用化;内部评测(Hy3-backend、Hy-Vibe Bench等)也展现强劲竞争力。
章节 06
Hy3-preview支持vLLM和SGLang部署,提供OpenAI兼容API;推理模式包括no_think(默认,简单问答)、low(轻度思考链)、high(深度思考链,复杂推理);推荐生成参数为temperature=0.9、top_p=1.0,支持BF16精度,可在主流框架高效运行。
章节 07
Hy3-preview模型权重已在Hugging Face、ModelScope等平台同步开源,含Instruct和Base预训练模型;核心创新是14倍参数稀疏度(295B总参数仅激活21B),保持与Kimi-K2(1043B)、DeepSeek-V3(671B)相当性能但激活参数仅1/3到1/2,为大模型普惠化提供新路径。