
阿里云旗下通义千问今日正式推出新一代开源推理模型Qwen3-30B-A3B-Thinking-2507,该模型在数学推理、代码生成等核心能力上实现突破,并在多项基准测试中超越Gemini 2.5-Flash等国际主流模型。相较于4月发布的Qwen3-30-A3B版本,新模型在AIME25数学评测中获得85分高分,代码能力测试LiveCodeBench v6得分达66分,知识水平评测(GPQA、MMLU-Pro)亦显著提升。
值得注意的是,新模型在写作创作、Agent任务执行及多语言交互等通用场景表现突出,其原生支持的上下文长度扩展至256K tokens,并可进一步适配1M tokens的超长文本处理需求。官方特别强调,针对复杂推理任务建议增加”思考预算”参数配置,以充分释放模型潜力。目前该模型已同步开源至魔搭社区和HuggingFace平台,并集成至Qwen Chat产品线,轻量化设计使其可部署于消费级硬件环境。
此次升级标志着国产大模型在推理效能上的重要突破。测试数据显示,新模型在同等参数规模下,性能已逼近部分百亿级模型,为开发者提供了更高性价比的AI工具选择。
原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/730153.html