
近日,谷歌正式为Gemini人工智能助手上线基于Veo 3模型的图像转视频功能,用户只需上传静态照片并添加文本描述,即可生成带音效的8秒动态短视频。该功能现已面向AI Ultra和AI Pro订阅用户开放,首阶段登陆Gemini网页版,移动端应用将于本周内全面推送。
操作流程极为简洁:用户点击提示栏的”工具”选择”视频”入口,上传照片后通过文本指令描述动态效果,例如”海浪拍打礁石”或”人物转头微笑”。创新性在于支持三层音频同步——可添加背景音乐(如雨声)、环境增强音效(如树叶沙沙声)甚至人物对白,系统通过Veo 3独有的波形匹配技术确保口型与语音精准同步。最终输出720p分辨率、16:9横屏的MP4格式视频,并自动添加可见AI水印及隐藏式数字标识。
此次升级标志着谷歌在AI视频赛道的关键突破。Veo 3模型采用帧间运动预测算法,大幅提升生成画面的物理真实感,使Gemini具备与OpenAI、Runway等对手同台竞技的影视创作能力。值得关注的是,该功能直接集成在Gemini交互界面,相较此前需通过独立工具Flow操作的模式,显著降低了创作门槛。
原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.co/article/727672.html