‌阿里通义千问开源全新推理模型Qwen3-30B-A3B 多项评测超越国际竞品

‌阿里通义千问开源全新推理模型Qwen3-30B-A3B 多项评测超越国际竞品

阿里云旗下通义千问今日正式推出新一代开源推理模型Qwen3-30B-A3B-Thinking-2507,该模型在数学推理、代码生成等核心能力上实现突破,并在多项基准测试中超越Gemini 2.5-Flash等国际主流模型‌。相较于4月发布的Qwen3-30-A3B版本,新模型在AIME25数学评测中获得85分高分,代码能力测试LiveCodeBench v6得分达66分,知识水平评测(GPQA、MMLU-Pro)亦显著提升‌。

值得注意的是,新模型在写作创作、Agent任务执行及多语言交互等通用场景表现突出,其原生支持的上下文长度扩展至256K tokens,并可进一步适配1M tokens的超长文本处理需求‌。官方特别强调,针对复杂推理任务建议增加”思考预算”参数配置,以充分释放模型潜力‌。目前该模型已同步开源至魔搭社区和HuggingFace平台,并集成至Qwen Chat产品线,轻量化设计使其可部署于消费级硬件环境‌。

此次升级标志着国产大模型在推理效能上的重要突破。测试数据显示,新模型在同等参数规模下,性能已逼近部分百亿级模型,为开发者提供了更高性价比的AI工具选择‌。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/730153.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论