谷歌升级Gemini 3 Deep Think模型专注科研推理达奥赛金牌水平

聆听 • 2026年2月13日 12:21:00 • AI

谷歌当地时间2月12日宣布对Gemini 3 Deep Think进行重大升级，推出专为科学、研究与工程场景打造的“推理模式”。此次升级由谷歌开发人员与各领域科学家、研究人员共同合作完成，旨在应对真实科研环境中边界模糊、数据杂乱且未必存在唯一解的复杂问题。

新版Deep Think的可用范围显著扩大。即日起，该模式在Gemini应用中向Google AI Ultra订阅用户开放，同时谷歌首次通过Gemini API以“早期访问计划”形式向部分研究人员、工程师及企业提供，并已开放申请入口招募意向用户。这标志着Deep Think正从实验性功能迈向实际应用。

在推理能力方面，新版Deep Think在多类高难度基准测试中表现亮眼。在不使用外部工具的情况下，该模型在终极人类考试（Humanity’s Last Exam）上取得48.4%的成绩，在ARC-AGI-2测试中获得84.6%，并经ARC Prize Foundation验证。编程领域，其在Codeforces竞赛基准中拿下3455的Elo评分。数学方面，Deep Think更是在2025年国际数学奥林匹克（IMO 2025）上达到金牌水平。

除数学与编程外，谷歌强调新版模型在科学领域同样实力不俗。Deep Think在2025年国际物理奥林匹克与国际化学奥林匹克的笔试部分均取得金牌级结果，同时在理论物理相关的CMT-Benchmark上获得50.5%的得分。

谷歌表示，Deep Think的升级不仅为追求基准成绩，更致力于推动真实的工程与科研应用。目前，该模型已可帮助研究人员解读复杂数据，协助工程师通过代码对物理系统进行建模。未来，谷歌将持续把Deep Think开放到更多实践场景中，让这一“会思考”的推理工具真正触及最需要它的开发者与科学家。

原创文章，作者：聆听，如若转载，请注明出处：https://www.kejixun.co/article/745414.html

聆听认证作者

0 0

产品

谷歌推出DiffusionGemma：本地AI推理速度提升4倍，开源文本扩散模型

谷歌今日发布公告，宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型（如GPT、Gemini）逐个生成token的方式不同，扩…

Google
2天前
AI

谷歌AI Plus订阅大幅降价：月费降至4.99美元，云存储翻倍至400GB

近日，谷歌对其Google AI Plus订阅服务进行了重大调整，通过直接降低门槛和提升配置，进一步增强了该服务的市场竞争力。根据最新方案，订阅价格从原来的每月7.99美元下调至4…

柠萌
3天前
AI

谷歌NotebookLM重大升级：内置代码运行与图表生成，向AI研究助理进化

6月9日，谷歌正式为旗下AI研究与笔记工具NotebookLM推送重大升级。该工具底层模型已原生切换至Gemini 3.5，并深度接入智能体Antigravity，标志着Noteb…

Google
3天前
AI

谷歌 Gemini 语音助理曝漏洞，黑客利用特殊构造通知信息为 AI“下毒”

6月8日，安全公司 SafeBreach 披露，谷歌 Gemini 存在一种新型安全漏洞。黑客可通过 WhatsApp、短信等渠道发送特殊构造的通知信息，并将恶意指令隐藏在其他语言…

happy
5天前
新闻

谷歌云服务部门再掀裁员潮，安全团队也未能幸免

据媒体援引知情人士消息，谷歌在过去两周内对其云服务部门进行了新一轮裁员，波及多个团队，其中包括负责追踪全球黑客活动和分析网络攻击事件的GTIG威胁情报小组。消息人士称，该小组已于周…

Google
2026年6月5日
AI

谷歌发布最强开放模型Gemma4，端侧部署实现重大突破

Google DeepMind日前正式发布了有史以来最强大的开放模型Gemma4。虽然该模型参数规模维持在约300亿左右，但“单位参数的智能密度”实现大幅飞跃，在多项核心任务上的性…

net
2026年6月4日
AI

谷歌推出AI应用Dreambeans：整合个人数据生成生活灵感

谷歌实验产品团队Google Labs近日发布了一款名为Dreambeans（梦豆）的人工智能应用，同时登陆苹果iOS与安卓平台。该应用能够调取用户各项谷歌服务中的数据，由AI配图…

Google
2026年6月4日
新闻

谷歌扩大 Quick Share 与 AirDrop 互传适配范围，覆盖更多安卓机型

6月3日，谷歌宣布，可让安卓与苹果手机用户通过隔空投送（AirDrop）互传文件的“快速共享（Quick Share）”功能，现已适配更多设备。以下安卓机型现已支持 Quick …

Google
2026年6月3日
AI

谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题

5月27日，谷歌 DeepMind 最新推出 AlphaProof Nexus，结合大语言模型（LLM）生成证明与 Lean 形式化验证，在 353 个开放的 Erdős 问题中自…

Google
2026年5月27日
新闻

欧盟拟对谷歌处以近10亿欧元罚款，创DMA罚单纪录

据路透社援引德国《商报》报道，欧盟委员会正计划在一项反垄断调查中对谷歌处以接近10亿欧元（约合79.11亿元人民币）的罚款。这将是欧盟自《数字市场法案》生效以来开出的最大罚单，预计…

Google
2026年5月26日
新闻

新加坡与谷歌和OpenAI签署AI合作协议加速区域枢纽建设

新加坡近期与全球知名科技公司谷歌和OpenAI签署了重要的人工智能合作协议，旨在提升该国在全球AI领域的地位，并加速在公共服务、医疗、教育及企业等领域的应用。这一系列合作协议是在新…

泡沫大盗
2026年5月21日
AI

YouTube发布AI进化蓝图：对话式搜索与Deepfake防护全面升级

在2026年谷歌I/O开发者大会上，YouTube对外展示了一套深度集成的AI进化方案。面对生成式AI浪潮，YouTube并未选择激进的“AI原生内容”替代路径，而是通过将Gemi…

AI
2026年5月21日
AI

谷歌街景结合Genie：用真实场景生成可互动3D世界

在今日的2026谷歌I/O开发者大会上，谷歌宣布将谷歌街景（Street View）服务与Project Genie的世界生成能力相结合，进一步扩展这套通用世界模型的能力。 Gen…

好奇宝宝
2026年5月20日
AI

谷歌发布Gemini Spark个人智能体：一句话让AI干多份活

在今日举行的2026谷歌I/O开发者大会上，谷歌正式发布了Gemini Spark个人AI智能体。这款智能体能够听从用户一句话指令，同时处理多项任务，并且24小时实时在线。它运行在…

AI
2026年5月20日
AI

谷歌发布Gemini 3.5 Flash：输出速度4倍于GPT-5.5

在今日举行的2026谷歌I/O开发者大会上，谷歌CEO桑达尔·皮查伊（Sundar Pichai）正式宣布推出Gemini 3.5 Flash模型。该模型在许多基准测试中的表现均优…

小丸子
2026年5月20日
AI

谷歌发布全能模型Gemini Omni：一句话就能让AI修改视频

在今日开幕的2026谷歌I/O开发者大会上，谷歌正式推出了Gemini Omni全能模型。Google DeepMind负责人、诺贝尔奖得主哈萨比斯（Demis Hassabis）…

Google
2026年5月20日
AI

谷歌Gemini神秘智能体Spark曝光：可清理邮件、控制浏览器

本周早些时候，谷歌公布了Gemini即将上线的新界面与自动化功能。而最新泄露信息显示，Gemini还将迎来一次真正接近“智能体”方向的重要升级——一个名为“Spark”的始终在线助…

Google
2026年5月16日
新闻

谷歌升级Android Auto：地图引入沉浸式3D导航，停车可看60fps全高清视频

在2026年Android Show I/O Edition活动中，谷歌公布了Android Auto的多项重要更新，核心方向是让车联系统更贴合不同车型的屏幕，同时也更接近日常手机…

Android
2026年5月13日
AI

谷歌发布Gemini Intelligence：安卓AI助手将能主动填表并操控浏览器

在2026年谷歌I/O大会，谷歌正式推出Gemini Intelligence系统性方案，全面升级安卓智能助手生态。与传统的“问答助手”不同，谷歌希望借此让Gemini转型为更主动…

Google
2026年5月13日
AI

谷歌发布 Snapseed 4.0 安卓版修图软件，新增相机与胶片滤镜

5月9日，谷歌现已在 Play 商店发布 Snapseed 4.0 修图软件，为安卓用户带来 Snapseed Camera 相机，让用户能使用胶片滤镜拍照。本次更新包括：重新设…

校草
2026年5月9日