‌Stable Audio2.5发布：AI音频生成迈入多段创作时代| 科技讯

‌Stable Audio2.5发布：AI音频生成迈入多段创作时代

李小白 • 2025年9月11日 13:46:00 • AI

Stability AI近日推出其最新音频生成模型Stable Audio2.5，标志着专业音效制作效率的又一次飞跃。该模型通过创新的多段音乐生成能力，可完整创作包含引子、发展和尾声的复杂作品，仅需几秒即可生成长达三分钟的高质量曲目。在Nvidia H100GPU上，其处理时间更缩短至两秒内，为创意团队提供了前所未有的高效工具。

这一突破性性能源于Stability AI自主研发的ARC（对抗相对-对比）训练方法。该技术不仅使模型能精准响应”振奋人心”等情感提示，还能理解”丰富的合成器声”等专业音乐风格描述。今年五月推出的移动端紧凑版本同样基于ARC技术，可在智能手机上7秒内生成11秒立体声音频，展现了强大的跨平台适配能力。

功能方面，Stable Audio2.5新增的音频修补技术允许用户上传无版权音频文件，由AI智能扩展或完善现有录音。结合文字提示生成音乐的功能，该模型已成为从广告配乐到品牌音效的全能创作助手。值得注意的是，所有训练数据均经过严格授权，配合先进的版权识别系统，确保商业应用的安全性。

目前，Stability AI已与WPP集团旗下音效机构Amp达成战略合作，通过WPP Open平台为全球客户提供定制化音频解决方案。自2024年4月发布Stable Audio2以来，该公司持续拓展商业生态，今年3月获得WPP集团投资，同时应对Meta等巨头的竞争压力。

原创文章，作者：李小白，如若转载，请注明出处：https://www.kejixun.co/article/733526.html