谷歌发布全能模型Gemini Omni:一句话就能让AI修改视频

谷歌发布全能模型Gemini Omni:一句话就能让AI修改视频

在今日开幕的2026谷歌I/O开发者大会上,谷歌正式推出了Gemini Omni全能模型。Google DeepMind负责人、诺贝尔奖得主哈萨比斯(Demis Hassabis)表示,这是Gemini家族迄今为止能力最为全面的版本。

“Omni”意为“全能”,该模型在处理文字、图像、视频、音频等多模态信息时展现出前所未有的流畅与深度。Gemini Omni的最大亮点是“可从任意输入生成任意输出”,用户只需一句话,就能让AI修改视频中的角色、背景甚至整体风格,实现真正的对话式编辑。谷歌同时宣布了该家族的首款模型Gemini Omni Flash,即日起在Gemini App、Google Flow和YouTube Shorts中可用,未来还将开放API服务。

分析人士认为,这一模型的发布将极大降低视频创作与编辑的门槛,让人工智能从“理解”世界走向“生成和改造”世界,为创意工作者和普通用户带来颠覆性的交互体验。

原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.co/article/752885.html

Google的头像Google认证作者

相关推荐

发表回复

登录后才能评论