谷歌Gemini上线AI视频生成功能：静态照片秒变8秒有声短片

Google • 2025年7月11日 16:32:00 • AI

近日，谷歌正式为Gemini人工智能助手上线基于Veo 3模型的图像转视频功能，用户只需上传静态照片并添加文本描述，即可生成带音效的8秒动态短视频。该功能现已面向AI Ultra和AI Pro订阅用户开放，首阶段登陆Gemini网页版，移动端应用将于本周内全面推送。

操作流程极为简洁：用户点击提示栏的”工具”选择”视频”入口，上传照片后通过文本指令描述动态效果，例如”海浪拍打礁石”或”人物转头微笑”。创新性在于支持三层音频同步——可添加背景音乐（如雨声）、环境增强音效（如树叶沙沙声）甚至人物对白，系统通过Veo 3独有的波形匹配技术确保口型与语音精准同步。最终输出720p分辨率、16:9横屏的MP4格式视频，并自动添加可见AI水印及隐藏式数字标识。

此次升级标志着谷歌在AI视频赛道的关键突破。Veo 3模型采用帧间运动预测算法，大幅提升生成画面的物理真实感，使Gemini具备与OpenAI、Runway等对手同台竞技的影视创作能力。值得关注的是，该功能直接集成在Gemini交互界面，相较此前需通过独立工具Flow操作的模式，显著降低了创作门槛。

原创文章，作者：Google，如若转载，请注明出处：https://www.kejixun.co/article/727672.html

Gemini Veo 3 人工智能谷歌

Google认证作者

0 0

新闻

谷歌推送Android 17正式版深度集成AI模型迎战苹果

谷歌于当地时间周二正式推送了Android 17正式版，同时发布智能手表操作系统Wear OS 7，新版系统率先搭载于Pixel系列设备并同步上线专属功能更新包，新增对音乐生成模型…

Android
1天前
AI

美政府下令下架AI模型，Anthropic紧急赴华盛顿谈判

多名知情人士向POLITICO网站透露，人工智能初创企业Anthropic的员工于当地时间周一与特朗普政府高级官员举行面对面会谈，试图解除一项迫使其最新模型“Fable 5”下架的…

柠萌
2天前
新闻

马斯克再遇挫：美法官驳回xAI指控OpenAI窃取商业机密诉讼

据路透社报道，美国联邦法官于当地时间周一驳回了埃隆·马斯克旗下人工智能企业xAI针对竞争对手OpenAI提起的诉讼。xAI指控OpenAI窃取其聊天机器人Grok相关的商业机密，但…

李小白
2天前
AI

美出口管制致Anthropic停供顶尖AI模型，欧盟评估影响并强调不应歧视

据路透社报道，欧盟委员会当地时间上周日表示，正在评估美国一项出口管制指令带来的实际影响。该指令针对人工智能企业Anthropic，欧委会同时强调相关措施不应构成对合作伙伴的歧视。此…

NEWS
3天前
AI

高盛研报：市场低估AI需求，资本支出将远超预期

知名投行高盛近日发布行业研报指出，当前市场普遍低估了人工智能领域的发展需求，超大规模数据中心运营商的AI相关资本支出将大幅超出行业预期。数据显示，华尔街目前预估2027年相关资本支…

秋秋
3天前
新闻

谷歌CEO皮查伊斯坦福毕业演讲避谈AI，鼓励毕业生“选择乐观”

当地时间周日，谷歌首席执行官桑达尔·皮查伊在斯坦福大学毕业典礼上发表演讲。与近期其他科技领袖的毕业致辞不同，皮查伊对人工智能几乎只字未提，而是转而鼓励毕业生“选择乐观”。这一回避…

Google
3天前
新闻

Android安全负责人辞职，控诉谷歌“丧失道德底线”

据Business Insider周四报道，谷歌Android平台安全负责人、高级工程师René Mayrhofer已从公司离职。他在一封落款5月18日的内部告别信中直言，谷歌管理…

Android
4天前
产品

谷歌推出DiffusionGemma：本地AI推理速度提升4倍，开源文本扩散模型

谷歌今日发布公告，宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型（如GPT、Gemini）逐个生成token的方式不同，扩…

Google
2026年6月11日
AI

谷歌AI Plus订阅大幅降价：月费降至4.99美元，云存储翻倍至400GB

近日，谷歌对其Google AI Plus订阅服务进行了重大调整，通过直接降低门槛和提升配置，进一步增强了该服务的市场竞争力。根据最新方案，订阅价格从原来的每月7.99美元下调至4…

柠萌
2026年6月10日
AI

谷歌NotebookLM重大升级：内置代码运行与图表生成，向AI研究助理进化

6月9日，谷歌正式为旗下AI研究与笔记工具NotebookLM推送重大升级。该工具底层模型已原生切换至Gemini 3.5，并深度接入智能体Antigravity，标志着Noteb…

Google
2026年6月10日
AI

谷歌 Gemini 语音助理曝漏洞，黑客利用特殊构造通知信息为 AI“下毒”

6月8日，安全公司 SafeBreach 披露，谷歌 Gemini 存在一种新型安全漏洞。黑客可通过 WhatsApp、短信等渠道发送特殊构造的通知信息，并将恶意指令隐藏在其他语言…

happy
2026年6月8日
AI

国家安全部发布AI中转站风险提示：用户隐私泄露与数据倒卖问题频发

国家安全部今日发布安全提示指出，随着人工智能应用需求迅猛增长，批量提供海内外大模型访问服务的“AI中转站”在国内迅速走红，但当前市场鱼龙混杂，部分站点运营资质缺失、安全防护薄弱，用…

若安丶
2026年6月8日
新闻

谷歌云服务部门再掀裁员潮，安全团队也未能幸免

据媒体援引知情人士消息，谷歌在过去两周内对其云服务部门进行了新一轮裁员，波及多个团队，其中包括负责追踪全球黑客活动和分析网络攻击事件的GTIG威胁情报小组。消息人士称，该小组已于周…

Google
2026年6月5日
AI

谷歌发布最强开放模型Gemma4，端侧部署实现重大突破

Google DeepMind日前正式发布了有史以来最强大的开放模型Gemma4。虽然该模型参数规模维持在约300亿左右，但“单位参数的智能密度”实现大幅飞跃，在多项核心任务上的性…

net
2026年6月4日
AI

谷歌推出AI应用Dreambeans：整合个人数据生成生活灵感

谷歌实验产品团队Google Labs近日发布了一款名为Dreambeans（梦豆）的人工智能应用，同时登陆苹果iOS与安卓平台。该应用能够调取用户各项谷歌服务中的数据，由AI配图…

Google
2026年6月4日
新闻

谷歌扩大 Quick Share 与 AirDrop 互传适配范围，覆盖更多安卓机型

6月3日，谷歌宣布，可让安卓与苹果手机用户通过隔空投送（AirDrop）互传文件的“快速共享（Quick Share）”功能，现已适配更多设备。以下安卓机型现已支持 Quick …

Google
2026年6月3日
商业

Anthropic秘密递交IPO申请估值近1万亿美元

开发Claude人工智能产品的人工智能实验室Anthropic于当地时间周一宣布，已秘密向美国证券交易委员会递交首次公开募股（IPO）申请。这家估值接近1万亿美元（约合6.77万亿…

商业头条
2026年6月2日
AI

全球首次人形机器人点球大战将亮相MWC上海，8支顶尖战队同台竞技

GSMA今日正式宣布，由该协会主办，联合AI百人会、中国人工智能产业发展联盟及新华网共同组织的“人形机器人点球大战”，将于2026年6月24日至25日作为MWC上海的主题赛事重磅登…

校草
2026年6月1日
AI

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

5月27日，谷歌 DeepMind 最新推出 AlphaProof Nexus，结合大语言模型（LLM）生成证明与 Lean 形式化验证，在 353 个开放的 Erdős 问题中自…

Google
2026年5月27日
新闻

黄仁勋批部分CEO：将裁员归咎于AI“太敷衍”

英伟达CEO黄仁勋近日对部分企业高管将裁员归咎于人工智能的做法提出批评，直言这种说法“太敷衍”。他在接受新加坡亚洲新闻台采访时表示：“AI才刚刚兴起，怎么可能就已经在导致失业了？”…

泡沫大盗
2026年5月26日

发表回复

登录后才能评论

谷歌Gemini上线AI视频生成功能：静态照片秒变8秒有声短片

相关推荐

发表回复