谷歌推出DiffusionGemma：本地AI推理速度提升4倍，开源文本扩散模型

Google • 3小时前 • 产品

谷歌今日发布公告，宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型（如GPT、Gemini）逐个生成token的方式不同，扩散模型通过从噪声中逐步去噪并行处理所有token，在本地低带宽计算环境下具有显著的推理速度优势。据介绍，DiffusionGemma的本地推理速度相比自回归模型提升了4倍。

该模型采用Apache 2.0许可证开源，用户可从Hugging Face下载模型权重。在性能表现上，DiffusionGemma的采样速度达到1479 tokens/秒，生成效率显著提升。代码生成方面，HumanEval达到89.6%，与Gemini 2.0 Flash-Lite互有胜负；数学能力表现亮眼，AIME 2025取得23.3%，超越对比模型的20.0%。不过模型在科学推理GPQA Diamond上仅为40.4%，明显低于对比模型的56.5%。

英伟达官方博文指出，该模型能充分发挥GPU的Tensor Core并行计算能力，在单块H100 GPU上达到每秒1000个token的生成速度，在DGX Station上可达每秒2000个token。谷歌表示，DiffusionGemma还支持迭代优化，能在生成过程中主动纠正错误，输出更加稳定一致。

原创文章，作者：Google，如若转载，请注明出处：https://www.kejixun.co/article/754762.html

DiffusionGemma 谷歌

Google认证作者

0 0

AI

谷歌AI Plus订阅大幅降价：月费降至4.99美元，云存储翻倍至400GB

近日，谷歌对其Google AI Plus订阅服务进行了重大调整，通过直接降低门槛和提升配置，进一步增强了该服务的市场竞争力。根据最新方案，订阅价格从原来的每月7.99美元下调至4…

柠萌
1天前
AI

谷歌NotebookLM重大升级：内置代码运行与图表生成，向AI研究助理进化

6月9日，谷歌正式为旗下AI研究与笔记工具NotebookLM推送重大升级。该工具底层模型已原生切换至Gemini 3.5，并深度接入智能体Antigravity，标志着Noteb…

Google
1天前
AI

谷歌 Gemini 语音助理曝漏洞，黑客利用特殊构造通知信息为 AI“下毒”

6月8日，安全公司 SafeBreach 披露，谷歌 Gemini 存在一种新型安全漏洞。黑客可通过 WhatsApp、短信等渠道发送特殊构造的通知信息，并将恶意指令隐藏在其他语言…

happy
3天前
新闻

谷歌云服务部门再掀裁员潮，安全团队也未能幸免

据媒体援引知情人士消息，谷歌在过去两周内对其云服务部门进行了新一轮裁员，波及多个团队，其中包括负责追踪全球黑客活动和分析网络攻击事件的GTIG威胁情报小组。消息人士称，该小组已于周…

Google
6天前
AI

谷歌发布最强开放模型Gemma4，端侧部署实现重大突破

Google DeepMind日前正式发布了有史以来最强大的开放模型Gemma4。虽然该模型参数规模维持在约300亿左右，但“单位参数的智能密度”实现大幅飞跃，在多项核心任务上的性…

net
2026年6月4日
AI

谷歌推出AI应用Dreambeans：整合个人数据生成生活灵感

谷歌实验产品团队Google Labs近日发布了一款名为Dreambeans（梦豆）的人工智能应用，同时登陆苹果iOS与安卓平台。该应用能够调取用户各项谷歌服务中的数据，由AI配图…

Google
2026年6月4日
新闻

谷歌扩大 Quick Share 与 AirDrop 互传适配范围，覆盖更多安卓机型

6月3日，谷歌宣布，可让安卓与苹果手机用户通过隔空投送（AirDrop）互传文件的“快速共享（Quick Share）”功能，现已适配更多设备。以下安卓机型现已支持 Quick …

Google
2026年6月3日
AI

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

5月27日，谷歌 DeepMind 最新推出 AlphaProof Nexus，结合大语言模型（LLM）生成证明与 Lean 形式化验证，在 353 个开放的 Erdős 问题中自…

Google
2026年5月27日
新闻

欧盟拟对谷歌处以近10亿欧元罚款，创DMA罚单纪录

据路透社援引德国《商报》报道，欧盟委员会正计划在一项反垄断调查中对谷歌处以接近10亿欧元（约合79.11亿元人民币）的罚款。这将是欧盟自《数字市场法案》生效以来开出的最大罚单，预计…

Google
2026年5月26日
新闻

新加坡与谷歌和OpenAI签署AI合作协议加速区域枢纽建设

新加坡近期与全球知名科技公司谷歌和OpenAI签署了重要的人工智能合作协议，旨在提升该国在全球AI领域的地位，并加速在公共服务、医疗、教育及企业等领域的应用。这一系列合作协议是在新…

泡沫大盗
2026年5月21日
AI

YouTube发布AI进化蓝图：对话式搜索与Deepfake防护全面升级

在2026年谷歌I/O开发者大会上，YouTube对外展示了一套深度集成的AI进化方案。面对生成式AI浪潮，YouTube并未选择激进的“AI原生内容”替代路径，而是通过将Gemi…

AI
2026年5月21日
AI

谷歌街景结合Genie：用真实场景生成可互动3D世界

在今日的2026谷歌I/O开发者大会上，谷歌宣布将谷歌街景（Street View）服务与Project Genie的世界生成能力相结合，进一步扩展这套通用世界模型的能力。 Gen…

好奇宝宝
2026年5月20日
AI

谷歌发布Gemini Spark个人智能体：一句话让AI干多份活

在今日举行的2026谷歌I/O开发者大会上，谷歌正式发布了Gemini Spark个人AI智能体。这款智能体能够听从用户一句话指令，同时处理多项任务，并且24小时实时在线。它运行在…

AI
2026年5月20日
AI

谷歌发布Gemini 3.5 Flash：输出速度4倍于GPT-5.5

在今日举行的2026谷歌I/O开发者大会上，谷歌CEO桑达尔·皮查伊（Sundar Pichai）正式宣布推出Gemini 3.5 Flash模型。该模型在许多基准测试中的表现均优…

小丸子
2026年5月20日
AI

谷歌发布全能模型Gemini Omni：一句话就能让AI修改视频

在今日开幕的2026谷歌I/O开发者大会上，谷歌正式推出了Gemini Omni全能模型。Google DeepMind负责人、诺贝尔奖得主哈萨比斯（Demis Hassabis）…

Google
2026年5月20日
AI

谷歌Gemini神秘智能体Spark曝光：可清理邮件、控制浏览器

本周早些时候，谷歌公布了Gemini即将上线的新界面与自动化功能。而最新泄露信息显示，Gemini还将迎来一次真正接近“智能体”方向的重要升级——一个名为“Spark”的始终在线助…

Google
2026年5月16日
新闻

谷歌升级Android Auto：地图引入沉浸式3D导航，停车可看60fps全高清视频

在2026年Android Show I/O Edition活动中，谷歌公布了Android Auto的多项重要更新，核心方向是让车联系统更贴合不同车型的屏幕，同时也更接近日常手机…

Android
2026年5月13日
AI

谷歌发布Gemini Intelligence：安卓AI助手将能主动填表并操控浏览器

在2026年谷歌I/O大会，谷歌正式推出Gemini Intelligence系统性方案，全面升级安卓智能助手生态。与传统的“问答助手”不同，谷歌希望借此让Gemini转型为更主动…

Google
2026年5月13日
AI

谷歌发布 Snapseed 4.0 安卓版修图软件，新增相机与胶片滤镜

5月9日，谷歌现已在 Play 商店发布 Snapseed 4.0 修图软件，为安卓用户带来 Snapseed Camera 相机，让用户能使用胶片滤镜拍照。本次更新包括：重新设…

校草
2026年5月9日
AI

谷歌为Gemma 4推出多Token预测技术，AI推理速度提升3倍

据外媒报道，近日，谷歌正式发布了针对Gemma 4系列模型的多Token预测起草器，这项技术突破通过推测解码架构，在不牺牲输出质量和逻辑能力的前提下，将模型的推理速度最高提升了3倍…

Google
2026年5月8日

发表回复

登录后才能评论

谷歌推出DiffusionGemma：本地AI推理速度提升4倍，开源文本扩散模型

相关推荐

发表回复