阿里通义千问发布Qwen3-TTS语音合成AI模型 支持49种音色与多方言

阿里通义千问发布Qwen3-TTS语音合成AI模型 支持49种音色与多方言

近日,阿里通义千问正式推出新一代语音合成AI模型Qwen3-TTS,该模型通过Qwen API开放访问,在音色多样性、多语种支持及拟人化表现上实现显著突破。

Qwen3-TTS提供超过49种音色选择,覆盖不同性别、年龄与角色设定,从撒娇搞怪的”茉兔”到严厉的”墨讲师”,再到智慧老者”沧明子”,满足多样化应用场景需求。此外,其多语种能力支持中文、英文、德语、日语等10种主流语言,在MiniMax TTS多语言测试集上,词错误率(WER)表现优于MiniMax、ElevenLabs及GPT-4o-Audio-Preview。方言支持同样亮眼,涵盖闽南语、粤语、四川话等9种方言,精准还原地方口音特色。

在自然度方面,Qwen3-TTS通过自适应调节语速与韵律,大幅提升拟人化水平,官方称其表现”逼近真人”。这一升级将推动语音合成技术在智能客服、有声内容创作等领域的应用体验迈向新高度。

原创文章,作者:李森,如若转载,请注明出处:https://www.kejixun.co/article/740709.html

李森李森管理团队

相关推荐

发表回复

登录后才能评论