正文

腾讯混元Hy3-preview开源：295B MoE架构的高性价比推理与Agent模型

腾讯混元团队开源Hy3-preview模型，采用295B总参数、21B激活参数的MoE架构，在STEM推理、代码生成和Agent任务上表现优异，同时保持出色的成本效益。

腾讯混元Hy3-previewMoE大语言模型开源Agent代码生成推理模型

发布时间 2026/04/23 23:09最近活动 2026/04/23 23:25预计阅读 2 分钟

章节 01

【导读】腾讯混元Hy3-preview开源：295B MoE架构的高性价比推理与Agent模型

腾讯混元团队于2026年4月23日正式开源Hy3-preview模型，该模型采用295B总参数、21B激活参数的MoE架构，在STEM推理、代码生成和Agent任务上表现优异，同时保持出色的成本效益。模型支持256K长上下文窗口，提供多种部署方式并已在多平台开源，为高性价比推理方案提供新选择。

章节 02

模型背景与核心参数解析

Hy3-preview是腾讯混元团队迄今发布的最强模型，采用混合专家架构（MoE）：总参数量2950亿，每次推理仅激活210亿参数；配备38亿参数的MTP层，支持256K上下文窗口，词汇表规模120832；专家路由设计为192个专家中选择8个计算，稀疏激活大幅降低推理成本。

章节 03

STEM与复杂推理能力的突破表现

Hy3-preview在STEM领域表现突出：在FrontierScience-Olympiad、IMOAnswerBench等高难度基准测试成绩优异；在2026年清华丘成桐数学博资考、2025年CHSBO竞赛中取得出色成绩；数学推理基准MATH准确率达76.28%，GSM8K小学数学问题准确率95.37%，这得益于团队重建强化学习训练基础设施并扩大训练任务规模。

章节 04

上下文学习与指令遵循能力提升

为评估真实场景能力，团队构建CL-bench和CL-bench-Life评测基准。Hy3-preview的256K上下文窗口可处理整本书籍、长篇技术文档等，无需分段避免信息丢失；在上下文学习和指令遵循方面均取得显著提升。

章节 05

代码生成与Agent能力的实用化进展

Hy3-preview在代码生成和Agent领域进步显著：在SWE-bench Verified、Terminal-Bench 2.0等代码Agent基准竞争力强；BrowseComp、WideSearch等搜索Agent表现不俗；ClawEval、WildClawBench复杂Agent场景高分，Agent能力实用化；内部评测（Hy3-backend、Hy-Vibe Bench等）也展现强劲竞争力。

章节 06

部署与使用指南

Hy3-preview支持vLLM和SGLang部署，提供OpenAI兼容API；推理模式包括no_think（默认，简单问答）、low（轻度思考链）、high（深度思考链，复杂推理）；推荐生成参数为temperature=0.9、top_p=1.0，支持BF16精度，可在主流框架高效运行。

章节 07

开源生态与技术价值总结

Hy3-preview模型权重已在Hugging Face、ModelScope等平台同步开源，含Instruct和Base预训练模型；核心创新是14倍参数稀疏度（295B总参数仅激活21B），保持与Kimi-K2（1043B）、DeepSeek-V3（671B）相当性能但激活参数仅1/3到1/2，为大模型普惠化提供新路径。