阿里巴巴推出新一代AI模型Qwen3.6-Max-Preview,编程能力大幅提升

阿里巴巴推出新一代AI模型Qwen3.6-Max-Preview,编程能力大幅提升

阿里巴巴近日正式发布Qwen系列新一代旗舰模型——Qwen3.6-Max-Preview。作为该系列的早期预览版,用户现已可在QwenStudio中与其进行交互对话,并通过阿里云百炼API以“qwen3.6-max-preview”名称调用。相比前一代Qwen3.6-Plus,新模型在智能体编程、世界知识和指令遵循等多个维度均实现了显著提升。

据阿里巴巴介绍,Qwen3.6-Max-Preview在六项主要编程基准测试中斩获最高分,涵盖SWE-benchPro、Terminal-Bench2.0、SkillsBench、QwenClawBench、QwenWebBench及SciCode。具体来看,其智能体编程能力进步尤为突出:SkillsBench分数提升9.9分,SciCode提升10.8分,NL2Repo和Terminal-Bench2.0则分别提高5.0分和3.8分。这些成绩标志着该模型在编程能力上迈出了重要一步。

此外,Qwen3.6-Max-Preview在世界知识掌握方面也有明显增强,SuperGPQA分数提升2.3分,QwenChineseBench提高5.3分。指令遵循能力同样表现出色,ToolcallFormatIFBench分数上升2.8分。综合这些提升,新模型已成为智能编程领域的重要创新。

尽管当前为预览版本,阿里巴巴表示该模型仍在积极开发中,后续版本将持续优化,力争带来更强大的功能和性能提升。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/750488.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论