‌Stable Audio2.5发布:AI音频生成迈入多段创作时代

‌Stable Audio2.5发布:AI音频生成迈入多段创作时代

Stability AI近日推出其最新音频生成模型Stable Audio2.5,标志着专业音效制作效率的又一次飞跃。该模型通过创新的多段音乐生成能力,可完整创作包含引子、发展和尾声的复杂作品,仅需几秒即可生成长达三分钟的高质量曲目。在Nvidia H100GPU上,其处理时间更缩短至两秒内,为创意团队提供了前所未有的高效工具。

这一突破性性能源于Stability AI自主研发的ARC(对抗相对-对比)训练方法。该技术不仅使模型能精准响应”振奋人心”等情感提示,还能理解”丰富的合成器声”等专业音乐风格描述。今年五月推出的移动端紧凑版本同样基于ARC技术,可在智能手机上7秒内生成11秒立体声音频,展现了强大的跨平台适配能力。

功能方面,Stable Audio2.5新增的音频修补技术允许用户上传无版权音频文件,由AI智能扩展或完善现有录音。结合文字提示生成音乐的功能,该模型已成为从广告配乐到品牌音效的全能创作助手。值得注意的是,所有训练数据均经过严格授权,配合先进的版权识别系统,确保商业应用的安全性。

目前,Stability AI已与WPP集团旗下音效机构Amp达成战略合作,通过WPP Open平台为全球客户提供定制化音频解决方案。自2024年4月发布Stable Audio2以来,该公司持续拓展商业生态,今年3月获得WPP集团投资,同时应对Meta等巨头的竞争压力。

原创文章,作者:李小白,如若转载,请注明出处:https://www.kejixun.co/article/733526.html

李小白的头像李小白认证作者

相关推荐

发表回复

登录后才能评论