‌腾讯混元2.0大模型发布 推理能力与效率领跑业界

‌腾讯混元2.0大模型发布 推理能力与效率领跑业界

近日,腾讯正式推出自研大模型混元2.0Tencent HY2.0),同时宣布DeepSeek V3.2逐步接入腾讯生态。两大模型已在元宝、ima等腾讯AI原生应用中率先上线,腾讯云同步开放API及平台服务,标志着腾讯在AI技术领域的又一次重大突破。

混元2.0采用混合专家(MoE)架构,总参数量高达406B(激活参数32B),支持256K超长上下文窗口,其推理能力和效率均达到业界领先水平。与上一版本Hunyuan-T1-20250822相比,HY2.0Think在预训练数据和强化学习策略上实现显著改进,数学、科学、代码、指令遵循等复杂推理场景的综合表现稳居国内第一梯队,泛化性大幅提升。

在数学科学知识推理方面,HY2.0Think通过高质量数据的Large Rollout强化学习,在国际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等权威测试中取得一流成绩。同时,模型在Humanitys Last Exam(HLE)和ARC AGI等任务中展现出卓越的知识水平和泛化能力。

指令遵循与长文多轮能力上,HY2.0Think通过重要性采样修正解决了训练与推理不一致问题,实现长窗口RL的高效稳定训练。结合多样化可验证的任务沙盒及基于打分准则的强化学习,该模型在Multi Challenge等任务中的效果显著提升。此外,腾讯通过规模化可验证环境及高质量合成数据,增强了模型在Agentic Coding和复杂工具调用场景的落地能力,在SWE-bench Verified及Tau2-Bench等智能体任务中实现性能跃升。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/740459.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论