谷歌发布最强开放模型Gemma4，端侧部署实现重大突破

net • 2小时前 • AI

Google DeepMind日前正式发布了有史以来最强大的开放模型Gemma4。虽然该模型参数规模维持在约300亿左右，但“单位参数的智能密度”实现大幅飞跃，在多项核心任务上的性能已可媲美一年半前的顶尖闭源大模型。

Gemma4最引人注目的技术创新是引入了全新的“E2B”参数卸载架构。传统Transformer中庞大的嵌入层会占用大量显存，而新架构在每一层中加入嵌入表，利用查找表机制替代繁重的全矩阵乘法计算。以一款50亿参数的模型为例，在E2B架构下，实际需加载到GPU显存中的“有效参数”仅为20亿，其余30亿可卸载到CPU甚至磁盘。这意味着模型仅需2GB显存便能实现极速推理，彻底突破了移动端、智能手机和树莓派等端侧设备的部署瓶颈。

目前，Gemma4已与Android Studio深度集成，开发者可在本地离线环境下安全调用AI编写Android代码，满足数据隐私和离线办公的刚性需求。该模型还承袭了Gemini3的研究成果，支持140种语言和语音识别，能够分析30至60秒的短视频。Google DeepMind预判，未来1到2年内，智能手机将能直接在本地流畅运行相当于Gemini3 Pro级别性能的强悍模型，届时绝大多数智能体代理任务将无需依赖云端算力，为消费级应用带来颠覆性变革。

原创文章，作者：net，如若转载，请注明出处：https://www.kejixun.co/article/754210.html

Gemma4 谷歌

net认证作者

0 0

AI

谷歌推出AI应用Dreambeans：整合个人数据生成生活灵感

谷歌实验产品团队Google Labs近日发布了一款名为Dreambeans（梦豆）的人工智能应用，同时登陆苹果iOS与安卓平台。该应用能够调取用户各项谷歌服务中的数据，由AI配图…

Google
6小时前
新闻

谷歌扩大 Quick Share 与 AirDrop 互传适配范围，覆盖更多安卓机型

6月3日，谷歌宣布，可让安卓与苹果手机用户通过隔空投送（AirDrop）互传文件的“快速共享（Quick Share）”功能，现已适配更多设备。以下安卓机型现已支持 Quick …

Google
1天前
AI

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

5月27日，谷歌 DeepMind 最新推出 AlphaProof Nexus，结合大语言模型（LLM）生成证明与 Lean 形式化验证，在 353 个开放的 Erdős 问题中自…

Google
2026年5月27日
新闻

欧盟拟对谷歌处以近10亿欧元罚款，创DMA罚单纪录

据路透社援引德国《商报》报道，欧盟委员会正计划在一项反垄断调查中对谷歌处以接近10亿欧元（约合79.11亿元人民币）的罚款。这将是欧盟自《数字市场法案》生效以来开出的最大罚单，预计…

Google
2026年5月26日
新闻

新加坡与谷歌和OpenAI签署AI合作协议加速区域枢纽建设

新加坡近期与全球知名科技公司谷歌和OpenAI签署了重要的人工智能合作协议，旨在提升该国在全球AI领域的地位，并加速在公共服务、医疗、教育及企业等领域的应用。这一系列合作协议是在新…

泡沫大盗
2026年5月21日
AI

YouTube发布AI进化蓝图：对话式搜索与Deepfake防护全面升级

在2026年谷歌I/O开发者大会上，YouTube对外展示了一套深度集成的AI进化方案。面对生成式AI浪潮，YouTube并未选择激进的“AI原生内容”替代路径，而是通过将Gemi…

AI
2026年5月21日
AI

谷歌街景结合Genie：用真实场景生成可互动3D世界

在今日的2026谷歌I/O开发者大会上，谷歌宣布将谷歌街景（Street View）服务与Project Genie的世界生成能力相结合，进一步扩展这套通用世界模型的能力。 Gen…

好奇宝宝
2026年5月20日
AI

谷歌发布Gemini Spark个人智能体：一句话让AI干多份活

在今日举行的2026谷歌I/O开发者大会上，谷歌正式发布了Gemini Spark个人AI智能体。这款智能体能够听从用户一句话指令，同时处理多项任务，并且24小时实时在线。它运行在…

AI
2026年5月20日
AI

谷歌发布Gemini 3.5 Flash：输出速度4倍于GPT-5.5

在今日举行的2026谷歌I/O开发者大会上，谷歌CEO桑达尔·皮查伊（Sundar Pichai）正式宣布推出Gemini 3.5 Flash模型。该模型在许多基准测试中的表现均优…

小丸子
2026年5月20日
AI

谷歌发布全能模型Gemini Omni：一句话就能让AI修改视频

在今日开幕的2026谷歌I/O开发者大会上，谷歌正式推出了Gemini Omni全能模型。Google DeepMind负责人、诺贝尔奖得主哈萨比斯（Demis Hassabis）…

Google
2026年5月20日
AI

谷歌Gemini神秘智能体Spark曝光：可清理邮件、控制浏览器

本周早些时候，谷歌公布了Gemini即将上线的新界面与自动化功能。而最新泄露信息显示，Gemini还将迎来一次真正接近“智能体”方向的重要升级——一个名为“Spark”的始终在线助…

Google
2026年5月16日
新闻

谷歌升级Android Auto：地图引入沉浸式3D导航，停车可看60fps全高清视频

在2026年Android Show I/O Edition活动中，谷歌公布了Android Auto的多项重要更新，核心方向是让车联系统更贴合不同车型的屏幕，同时也更接近日常手机…

Android
2026年5月13日
AI

谷歌发布Gemini Intelligence：安卓AI助手将能主动填表并操控浏览器

在2026年谷歌I/O大会，谷歌正式推出Gemini Intelligence系统性方案，全面升级安卓智能助手生态。与传统的“问答助手”不同，谷歌希望借此让Gemini转型为更主动…

Google
2026年5月13日
AI

谷歌发布 Snapseed 4.0 安卓版修图软件，新增相机与胶片滤镜

5月9日，谷歌现已在 Play 商店发布 Snapseed 4.0 修图软件，为安卓用户带来 Snapseed Camera 相机，让用户能使用胶片滤镜拍照。本次更新包括：重新设…

校草
2026年5月9日
AI

谷歌为Gemma 4推出多Token预测技术，AI推理速度提升3倍

据外媒报道，近日，谷歌正式发布了针对Gemma 4系列模型的多Token预测起草器，这项技术突破通过推测解码架构，在不牺牲输出质量和逻辑能力的前提下，将模型的推理速度最高提升了3倍…

Google
2026年5月8日
新闻

谷歌停运 Project Mariner，跨网页自动化技术整合至 AI Mode

5 月 7 日，据报道谷歌于 5 月 4 日挂出横幅公告，宣布停运实验性网页自动化项目 Project Mariner。该项目技术并未废弃，已整合至 Gemini Agent 和 …

Google
2026年5月7日
AI

Anthropic承诺向谷歌支付2000亿美元，AI算力军备竞赛引发市场质疑

据最新消息，人工智能初创巨头Anthropic已承诺在未来五年内向谷歌支付总计2000亿美元的巨额资金，用于采购云服务及自研芯片算力。这一数字揭示了当前AI行业极高的算力门槛——业…

happy
2026年5月7日
新闻

美政府与微软、谷歌、xAI达成协议：前沿AI模型发布前须接受安全审查

据路透社报道，微软、谷歌及埃隆·马斯克创办的xAI已与美国政府达成一项新协议，将在新一代人工智能模型正式公开发布前，提前向美方开放模型权限，以便开展国家安全风险审查。美国商务部人工…

李小白
2026年5月6日
商业

谷歌母公司Alphabet市值直逼5万亿美元，有望超越英伟达重登全球第一

谷歌母公司Alphabet的市值正悄然逼近5万亿美元大关，有望超越当前人工智能领域的领头羊英伟达，重新成为全球市值最高的公司。在本周四股价大涨10%之后，Alphabet的一年涨幅…

商业头条
2026年5月4日
AI

谷歌、亚马逊、微软和Meta今年计划投入7250亿美元加码AI

当地时间4月30日，英国《金融时报》汇总的科技巨头一季度财报显示，谷歌、亚马逊、微软和Meta计划在2026年合计投入7250亿美元资本支出，较去年创纪录的4100亿美元大幅增长7…

野游栗
2026年5月3日

发表回复

登录后才能评论

谷歌发布最强开放模型Gemma4，端侧部署实现重大突破

相关推荐

发表回复