阿里发布低推理成本编程AI模型Qwen3-Coder-Next 赋能本地开发与智能体

阿里发布低推理成本编程AI模型Qwen3-Coder-Next 赋能本地开发与智能体

阿里巴巴旗下千问团队近日正式推出专为编码代理与本地开发打造的开放权重语言模型Qwen3-Coder-Next。该模型基于其基础架构构建,采用了创新的混合注意力与专家混合模型(MoE)设计,旨在通过强化训练大幅降低实际应用中的推理成本,同时获得强大的编程与智能体执行能力。

与单纯扩大参数规模的传统路径不同,该模型的核心突破在于“扩展智能体训练信号”。研发团队利用大规模可验证的编程任务和可执行环境对其进行训练,使模型能够直接基于代码执行的成功或失败反馈进行学习。这套训练体系包含了持续预训练、监督微调、领域专家专项训练及能力蒸馏等多个关键阶段,特别强调提升模型在长程推理、工具调用及任务失败后自我修正等方面的能力,这些均是现实世界中编程智能体可靠工作的基石。

根据官方发布的基准测试结果,在SWE-Bench、TerminalBench 2.0等主流编程智能体评测中,该模型展现出显著竞争力。值得注意的是,尽管其激活参数量仅为30亿,但其在部分基准上的表现可与激活参数量高出10至20倍的其他开源模型相匹敌,实现了效率与性能之间更优的平衡。这为在本地或低成本环境中部署高效的AI编程助手提供了新的可能。

团队表示,未来工作将聚焦于进一步提升模型的复杂推理与决策能力,拓展其支持的任务范围,并通过实际应用反馈进行快速迭代。该模型的推出,标志着AI编程工具正朝着更高效、更实用、更易于部署的方向演进。

原创文章,作者:好奇宝宝,如若转载,请注明出处:https://www.kejixun.co/article/744787.html

好奇宝宝的头像好奇宝宝认证作者

相关推荐

发表回复

登录后才能评论