‌阿里通义千问发布新模型Qwen3-30B-A3B,AI能力逼近GPT-4o

‌阿里通义千问发布新模型Qwen3-30B-A3B,AI能力逼近GPT-4o

今日,阿里云旗下AI大模型通义千问在X平台宣布,正式推出Qwen3-30B-A3B的非思考模式更新版本——Qwen3-30B-A3B-Instruct-2507。新模型在指令理解、逻辑推理、文本生成、数学计算、科学知识及编程能力等方面实现显著提升,官方称其性能已接近GPT-4o和通义千问更高参数的235B版本,进一步缩小了国产大模型与国际顶尖水平的差距。

官方技术文档显示,该模型整体参数规模达305亿,但实际激活参数仅33亿,通过创新的稀疏化架构设计,在保持高效计算的同时优化了推理能力。其48层网络结构、128个专家模块及8个激活专家的配置,使其原生支持长达26万tokens的超长上下文处理,在多轮对话和复杂任务中表现更为稳定。值得注意的是,新版本移除了原思考模式中的<think></think>标签输出,用户无需手动关闭该功能即可获得更简洁直接的响应,大幅提升了交互流畅性。

通义千问团队强调,此次升级不仅增强了模型在数理逻辑、代码生成等硬核任务中的表现,还针对多语言长尾知识进行了专项优化,使其在开放式问答和个性化任务中更贴合用户需求。随着Qwen3-30B-A3B的迭代,国产大模型在实用性与易用性上的突破,或将为AI技术在教育、科研及企业服务等领域的落地提供更强支撑。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/730042.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论