传闻阿里Qwen3模型将于4月发布,直面DeepSeek挑战冲击”最强AI”宝座

传闻阿里Qwen3模型将于4月发布,直面DeepSeek挑战冲击"最强AI"宝座

据媒体披露,阿里云计划于2025年4月第二周正式发布新一代大模型Qwen3,这将成为该集团上半年最重磅的AI技术产品。内部文件显示,在2024年Qwen2.5版本发布后,研发团队已启动Qwen3项目,但2025年初深度求索(DeepSeek)推出的爆款模型R1,促使团队调整了技术对标方向。

知情人士透露,阿里云基础模型团队原先主要对标OpenAI的o1系列,但随着DeepSeek-R1的强势崛起,现形成”双线对标”战略。研发日志显示,2024年12月团队首次将DeepSeek-R1纳入竞品分析体系,并在语义理解模块进行针对性优化。

值得注意的是,阿里内部将”模型影响力”作为核心考核指标。管理层明确提出要建立”行业最强模型”的认知标签,为此开源生态建设成为关键战场。官方数据显示,基于Qwen开源模型衍生的细分模型总量已突破10万个,覆盖医疗、金融等18个垂直领域。

开发者社区数据监测显示,Qwen系列在GitHub的周均下载量维持在5万次以上,其中东南亚开发者贡献率同比提升47%。阿里云智能事业群总裁张建锋在内部会议中强调,2025年将持续扩大开源优势,计划在Qwen3发布同期开放模型训练框架。

技术路线图显示,Qwen3将重点突破多模态推理能力,其测试版在权威评测MMLU中部分子项得分已超越GPT-4 Turbo。据悉,阿里云正在组建百人规模的开发者关系团队,计划通过黑客松大赛选拔优质衍生项目给予算力支持。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/713449.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论