
阿里云今日正式发布通义千问Qwen3旗舰版的最新升级,全新推出的Qwen3-235B-A22B-Instruct-2507-FP8模型采用非思考模式设计,在多项关键指标上实现突破性进展。据悉,研发团队经过与社区深入探讨后,决定放弃混合思考模式,转而采用Instruct和Thinking模型分别训练的策略,以获得更优的模型性能。
技术规格显示,这款2350亿参数的大模型展现出惊人的能力提升。在GQPA知识测评、AIME25数学测试、LiveCodeBench编程评估等多项基准测试中,其表现不仅超越Kimi-K2、DeepSeek-V3等国内顶尖开源模型,更领先于Claude-Opus4-Non-thinking等国际闭源产品。特别值得一提的是,模型上下文长度已扩展至262144个token,长文本理解能力获得质的飞跃。
此次升级还着重优化了多语言长尾知识覆盖能力,使模型在专业性任务中表现更为精准。同时,通过改进用户偏好对齐机制,模型在开放式任务中的生成质量显著提升。研发团队透露,这些改进使得Qwen3在逻辑推理、文本理解、编程辅助等场景下的实用性大幅增强,为开发者提供了更强大的AI工具选择。随着国内大模型竞争进入白热化阶段,阿里云此次重磅升级无疑将为行业格局带来新的变数。
原创文章,作者:李小白,如若转载,请注明出处:https://www.kejixun.co/article/729276.html