‌阿里发布Qwen3-Omni-Flash全模态大模型 支持119种语言交互与自定义AI人设

‌阿里发布Qwen3-Omni-Flash全模态大模型 支持119种语言交互与自定义AI人设

近日,阿里Qwen团队推出新一代原生全模态大模型Qwen3-Omni-Flash-2025-12-01,该模型在Qwen3-Omni基础上实现全面升级,支持文本、图像、音视频的无缝输入与实时流式输出。新模型通过同步生成高质量文本和自然语音,显著提升了多模态交互体验,彻底解决了此前语音生成中语速拖沓、机械呆板的问题,其语音自然度已逼近真人水平。

此次升级的核心亮点是系统提示(System Prompt)控制能力的突破。用户可自由设定“甜妹”“御姐”或“日系”等AI人设风格,并精准调节口语化表达偏好及回复长度。此外,模型的多语言能力全面增强,支持119种文本语言交互、19种语音识别语言及10种语音合成语言,确保跨场景响应一致性。在性能表现上,Qwen3-Omni-Flash在逻辑推理(ZebraLogic)、代码生成(LiveCodeBench-v6)和多学科视觉问答(MMMU)等任务中分别提升5.6、9.3和4.7分,展现出更强的视觉内容理解与逻辑分析能力。

阿里团队表示,新模型致力于实现“声形意合,令出智随”的交互体验,其技术突破将为教育、娱乐、客服等领域提供更智能的解决方案。随着多模态AI竞争加剧,Qwen3-Omni-Flash的推出进一步巩固了阿里在全球AI生态中的技术领先地位。

原创文章,作者:小丸子,如若转载,请注明出处:https://www.kejixun.co/article/740755.html

小丸子的头像小丸子认证作者

相关推荐

发表回复

登录后才能评论