‌通义千问发布Qwen3-4B-2507双模型:手机端AI性能再突破

‌通义千问发布Qwen3-4B-2507双模型:手机端AI性能再突破

近日,阿里通义千问正式推出Qwen3-4B-Instruct-2507Qwen3-4B-Thinking-2507两款新模型,以轻量化设计实现性能跃升,进一步推动端侧AI部署的普及。官方强调,小型语言模型(SLM)对Agentic AI发展至关重要,此次“2507”版本通过优化架构,使4B参数模型在手机等设备上运行更流畅,同时保持强悍能力。

在非推理领域,Qwen3-4B-Instruct-2507展现出全能特性。其上下文理解扩展至256K,支持长文本处理,通用能力超越同规模闭源模型GPT-4.1-nano,接近Qwen3-30B-A3B水平。该模型擅长快速响应指令,适用于内容生成、工具调用等场景,被定位为高效的“执行专家”。

而在推理能力上,Qwen3-4B-Thinking-2507实现显著突破。以4B参数量在数学测评AIME25中斩获81.3分,表现媲美中等规模模型Qwen3-30B-Thinking。官方形容其为严谨的“学术专家”,能通过分步推理深入解决复杂问题,可靠性大幅提升。

此次双模型发布延续了通义千问对端侧AI的深耕。此前,该系列已推出多款开源模型,如Qwen3-30B-A3B-Thinking-2507,通过扩展上下文至256K、强化数学与代码能力,进一步缩小了轻量化模型与大型模型的差距。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/730663.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论