‌通义千问推出Qwen3-ASR-Flash语音识别模型：歌声识别错误率低于8%

好奇宝宝 • 2025年9月9日 11:30:00 • AI

在全球语音识别技术快速发展的背景下，通义千问今日正式发布其最新语音识别模型Qwen3-ASR-Flash。该模型基于Qwen3基座模型，经过海量多模态数据及数千万小时自动语音识别（ASR）数据训练，旨在为用户提供高精度、高鲁棒性的语音识别解决方案。

Qwen3-ASR-Flash的核心特性包括领先的识别准确率和出色的歌声识别能力。在多个中英文及多语种基准测试中，该模型表现优异，尤其在歌唱识别方面，实测错误率低于8%。这意味着无论是清唱还是伴随背景音乐的整歌，Qwen3-ASR-Flash都能有效识别并转录，为音乐爱好者提供了极大便利。

另一个显著特点是其定制化识别能力。用户可以以任意格式提供文本上下文，模型能够智能识别并匹配命名实体和关键术语，输出个性化的识别结果。这一功能使Qwen3-ASR-Flash在处理复杂语境时更具灵活性和适应性，满足不同场景下的专业需求。

此外，该模型支持多达11种语言及多种方言和口音，包括普通话、四川话、粤语等主要方言，以及英式、美式英语、法语、德语、俄语、意大利语、西班牙语、日语、韩语和阿拉伯语等。广泛的语种支持使其能够满足全球不同地域和语言使用者的需求，实现精准转录。

Qwen3-ASR-Flash还具备强大的鲁棒性，在长难句、语言切换和复杂声学环境中保持高准确率，有效过滤静音和背景噪声，确保用户获得最佳体验。目前，用户可通过ModelScope、HuggingFace和阿里云百炼API等平台体验该模型。

原创文章，作者：好奇宝宝，如若转载，请注明出处：https://www.kejixun.co/article/733301.html

好奇宝宝认证作者

0 0

AI

Qwen3.7系列预览版上线，阿里云峰会即将正式发布

近日，阿里通义千问两款最新大模型——Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview已率先登陆Qwen Chat及Arena AI（原LMArena…

AI
2026年5月19日
AI

阿里巴巴通义千问发布Qwen-Image-Layered 颠覆图像编辑规则

阿里巴巴通义千问团队近日发布革命性模型Qwen-Image-Layered，首次实现将普通照片自动分解为多个可独立编辑的RGBA图层，彻底打破AI图像编辑“整体重绘”的局限。用户无…

AI
2025年12月22日
AI

阿里通义千问发布Qwen3-TTS语音合成AI模型支持49种音色与多方言

近日，阿里通义千问正式推出新一代语音合成AI模型Qwen3-TTS，该模型通过Qwen API开放访问，在音色多样性、多语种支持及拟人化表现上实现显著突破。 Qwen3-TTS提供…

李森
2025年12月11日
AI

阿里通义千问发布Qwen Code v0.3.0 全面升级开发者AI编程体验

阿里通义千问正式推出Qwen Code命令行AI工具的最新版本v0.3.0，该版本专为Qwen3-Coder模型优化，通过增强代码理解、自动化任务和智能辅助功能，显著提升开发者效率…

柠萌
2025年12月10日
AI

‌阿里千问APP推出免费学习大模型Qwen3-Learning 拍题答疑与作业批改功能全面升级

阿里旗下千问APP正式上线基于Qwen3训练的学习大模型Qwen3-Learning，该模型专为学习场景设计，提供‌拍题答疑‌和‌作业批改‌两大核心服务，且全部免费、无使用次数限制…

AI
2025年12月5日
AI

‌阿里巴巴通义千问团队斩获NeurIPS 2025最佳论文奖，中国AI研究再登国际顶会

全球人工智能顶级会议NeurIPS 2025于昨晚公布获奖名单，阿里巴巴通义千问团队凭借论文《Attention Gating Makes Better Foundation Mo…

柠萌
2025年11月30日
AI

阿里通义千问能力最强语言模型，Qwen3-Max 已在官网上线深度思考功能

11月2日，阿里通义千问最新旗舰模型 Qwen3-Max 已在官网上线“深度思考”模式，该功能通过增强推理链分析与多步骤问题拆解能力，显著提升复杂任务处理效率。阿里云于 9 月 2…

happy
2025年11月3日
AI

‌阿里云开源Qwen3-Next大模型架构 80B参数版本实现十倍推理效率提升

阿里云通义团队今日正式发布下一代基础模型架构Qwen3-Next，并开源基于该架构的Qwen3-Next-80B-A3B系列模型（含Instruct与Thinking版本）。这一创…

AI
2025年9月12日
AI

‌通义千问推出Qwen-Image-Edit：精准编辑图片文字，实现语义与外观双重控制

今日，通义千问正式发布Qwen-Image-Edit，这是其20B规模的Qwen-Image模型的升级版本，首次将强大的文本渲染能力延伸至图像编辑领域。用户只需通过Qwen Cha…

李小白
2025年8月19日
AI

‌通义千问全面升级：Qwen3性能提升3倍，AI图像生成进入秒级时代

近日，阿里云旗下通义千问迎来重磅升级，Qwen3系列模型能力大幅提升，长文本处理性能提升高达3倍。此次升级不仅拓展了Qwen3的上下文至100万tokens，还引入了双块注意力（D…

AI
2025年8月16日
AI

‌通义千问发布Qwen3-4B-2507双模型：手机端AI性能再突破

近日，阿里通义千问正式推出Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507两款新模型，以轻量化设计实现性能跃升，进一步推动端侧AI部署的普…

AI
2025年8月7日
AI

‌阿里通义千问开源20B图像生成模型中文文本渲染能力突破

阿里通义千问团队宣布开源其首个图像生成基础模型Qwen-Image，这款20B参数的MMDiT模型在复杂文本渲染和精准图像编辑领域取得重大突破。该模型不仅能生成宫崎骏动漫风格等多样…

小丸子
2025年8月5日
产品

阿里通义千问发布 Qwen3-Coder-Flash 模型

8 月 1 日，阿里通义千问 Qwen 昨日（7 月 31 日）发布公告，宣布推出 Qwen3-Coder-Flash（全称 Qwen3-Coder-30B-A3B-Instruc…

AI
2025年8月1日
AI

‌阿里通义千问开源全新推理模型Qwen3-30B-A3B 多项评测超越国际竞品

阿里云旗下通义千问今日正式推出新一代开源推理模型Qwen3-30B-A3B-Thinking-2507，该模型在数学推理、代码生成等核心能力上实现突破，并在多项基准测试中超越Gem…

AI
2025年7月31日
AI

‌阿里通义千问发布新模型Qwen3-30B-A3B，AI能力逼近GPT-4o

今日，阿里云旗下AI大模型通义千问在X平台宣布，正式推出Qwen3-30B-A3B的非思考模式更新版本——Qwen3-30B-A3B-Instruct-2507。新模型在指令理解、…

AI
2025年7月30日
AI

‌阿里发布Qwen-MT翻译大模型支持92种语言互译

阿里云近日正式推出基于Qwen3架构的Qwen-MT机器翻译模型，该模型支持多达92种语言的互译，覆盖全球95%以上人口的语言交流需求。通过超大规模多语言数据训练和强化学习技术优化…

柠萌
2025年7月25日
产品

通义千问发布Qwen3-Coder代码模型性能媲美Claude Sonnet4

7月23日，阿里通义千问今日发布 Qwen3-Coder，宣称这是迄今为止最具代理能力的代码模型。据悉，Qwen3-Coder 拥有多个尺寸，其中最强大的版本是Qwen3-Co…

科技观察者
2025年7月23日
AI

阿里云通义千问Qwen3升级性能全面超越行业标杆

阿里云今日正式发布通义千问Qwen3旗舰版的最新升级，全新推出的Qwen3-235B-A22B-Instruct-2507-FP8模型采用非思考模式设计，在多项关键指标上实现突破性…

李小白
2025年7月22日
AI

DeepSeek-V3 vs Qwen3-235B-A22B：MoE架构巅峰对决

随着混合专家（MoE）架构成为大模型发展的核心技术范式，DeepSeek-V3与Qwen3-235B-A22B的差异化设计路径正深刻重塑产业格局。至于DeepSeek-V3与Qwe…

聆听
2025年7月21日
AI

阿里巴巴发布适配苹果 MLX 架构的 Qwen3 升级版

阿里巴巴推出旗舰AI模型Qwen3新版本，与苹果MLX架构兼容，有望在中国大陆上线，支持119种语言和方言，具备专家混合和混合推理能力。苹果智能未在中国大陆上线。

科技观察者
2025年6月17日

发表回复

登录后才能评论

‌通义千问推出Qwen3-ASR-Flash语音识别模型：歌声识别错误率低于8%

相关推荐

发表回复