‌英伟达开源Audio2Face模型:游戏与影视角色动画迎来革命性突破

‌英伟达开源Audio2Face模型:游戏与影视角色动画迎来革命性突破

英伟达近日宣布开源其生成式AI面部动画模型Audio2Face,该技术通过分析音频中的音素、语调等声学特征,能够实时驱动虚拟角色的面部动作,生成精确的口型同步和自然的情感表情。这一创新不仅包含核心算法,还提供完整的软件开发工具包(SDK)和训练框架,旨在加速游戏和3D应用中智能虚拟角色的开发流程。

Audio2Face支持两种运行模式:针对预录制音频的离线渲染,以及动态AI角色的实时流式处理,满足不同场景的需求。为方便开发者使用,英伟达开源了多个关键组件,包括Audio2Face SDK、Autodesk Maya插件和Unreal Engine 5.5+插件,同时开放回归模型与扩散模型,允许开发者通过微调适配特定应用。目前,该技术已被多家游戏公司采用,例如Survios在《异形:侠盗入侵进化版》中集成Audio2Face,大幅简化了口型同步流程;Farm51工作室则在《切尔诺贝利人2:禁区》中利用该技术生成细腻面部动画,其创新总监Wojciech Pazdur称其为“革命性突破”。

英伟达的这一举措为开发者提供了更强大的创作工具,未来游戏和影视作品中的虚拟角色表现将更加真实生动。随着技术持续迭代,AI驱动的角色动画有望成为行业新标准。

原创文章,作者:小丸子,如若转载,请注明出处:https://www.kejixun.co/article/734750.html

小丸子的头像小丸子认证作者

相关推荐

发表回复

登录后才能评论