阿里千问开源Qwen3.6-35B-A3B:30亿激活参数实现顶尖智能体编程,超越前代

4月17日,据报道,继Qwen3.6-Plus发布之后,阿里千问大模型宣布开源Qwen3.6-35B-A3B——一个稀疏但能力出色的混合专家模型,总参数量为350亿,激活参数仅30亿。官方称,该模型不但轻量高效,而且在智能体编程方面表现卓越,大幅超越前代模型Qwen3.5-35B-A3B,并可与Qwen3.5-27B和Gemma4-31B等稠密模型一较高下。

阿里千问开源Qwen3.6-35B-A3B:30亿激活参数实现顶尖智能体编程,超越前代

仅凭30亿激活参数,Qwen3.6-35B-A3B在多项关键编程基准上超越了270亿参数的稠密模型Qwen3.5-27B,并在智能体编程和推理任务上大幅超越其直接前代Qwen3.5-35B-A3B。这一成绩证明了稀疏MoE架构在保持高效推理的同时,能够实现与数倍于其激活规模的稠密模型相当的性能。

Qwen3.6原生支持多模态,Qwen3.6-35B-A3B以仅约30亿激活参数,展现出远超其体量的感知与多模态推理能力。在大多数视觉语言基准上,它的表现已与Claude Sonnet 4.5持平,甚至在部分任务上实现超越。其在空间智能上的优势尤为突出——在RefCOCO、ODInW13等视觉定位基准上取得了领先成绩。

该模型依然支持多模态思考与非思考模式,是当前最具通用性的开源模型之一。Qwen3.6-35B-A3B已在Qwen Studio上线,并以开源权重的形式向社区发布。用户可从Hugging Face和ModelScope下载模型权重,或通过阿里云百炼以qwen3.6-flash的名称调用API。

该模型可以无缝集成到流行的第三方编程助手中,包括OpenClaw、Claude Code和Qwen Code,从而简化开发流程,实现高效且具备上下文感知能力的编码体验。API方面,本次发布支持preserve_thinking功能,可在消息中保留所有前序轮次的思维内容,推荐用于智能体任务。

Qwen3.6-35B-A3B表明,稀疏MoE模型可以实现卓越的智能体编程和推理能力。作为完全开源的模型权重,它为该规模下的模型能力树立了新的标杆。官方表示,未来将继续扩展Qwen3.6开源家族,并不断拓展高效开源模型所能实现的边界。

原创文章,作者:野游栗,如若转载,请注明出处:https://www.kejixun.co/article/750233.html

野游栗的头像野游栗认证作者

相关推荐

发表回复

登录后才能评论