
谷歌今日发布公告,宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型(如GPT、Gemini)逐个生成token的方式不同,扩散模型通过从噪声中逐步去噪并行处理所有token,在本地低带宽计算环境下具有显著的推理速度优势。据介绍,DiffusionGemma的本地推理速度相比自回归模型提升了4倍。
该模型采用Apache 2.0许可证开源,用户可从Hugging Face下载模型权重。在性能表现上,DiffusionGemma的采样速度达到1479 tokens/秒,生成效率显著提升。代码生成方面,HumanEval达到89.6%,与Gemini 2.0 Flash-Lite互有胜负;数学能力表现亮眼,AIME 2025取得23.3%,超越对比模型的20.0%。不过模型在科学推理GPQA Diamond上仅为40.4%,明显低于对比模型的56.5%。
英伟达官方博文指出,该模型能充分发挥GPU的Tensor Core并行计算能力,在单块H100 GPU上达到每秒1000个token的生成速度,在DGX Station上可达每秒2000个token。谷歌表示,DiffusionGemma还支持迭代优化,能在生成过程中主动纠正错误,输出更加稳定一致。
原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.co/article/754762.html