谷歌Gemini 2.5 Pro上线：推理能力颠覆AI榜单，创历史最高分

Google • 2025年3月26日 10:26:00 • AI

谷歌于今日凌晨正式发布新一代AI模型Gemini 2.5 Pro，凭借强大的推理能力横扫全球多项榜单，并创下AI模型史上最大分数飞跃纪录。该模型主打“思考式”响应机制，在编程、数学及多模态任务中展现出领先实力，被谷歌称为“当前最强大的通用AI模型”。

根据官方数据，Gemini 2.5 Pro在LMArena测试中以领先第二名40分的绝对优势登顶，并包揽数学、创意写作、指令执行、长文本处理及多轮对话五项单项冠军。在视觉竞技场（Vision Arena）和编程测试中，其击败包括GPT-4.5、Grok-3等对手，甚至在网页开发竞技场（WebDev Arena）中斩获亚军，成为首个综合实力接近Claude 3.5 Sonnet的模型。

技术层面，Gemini 2.5 Pro支持百万级Token上下文处理（未来将扩展至200万Token），可同时解析文本、音频、图像及完整代码库。实测显示，该模型仅用一行提示词即生成交互式动画、像素游戏及分形可视化程序。例如，根据“宇宙鱼”指令，其自动编写出包含鱼类心理活动的动态场景；输入恐龙跑酷需求后，则生成完整游戏代码与像素化美术素材。

谷歌透露，2.5 Pro在未使用多数投票法等增强技术的情况下，即在GPQA科学测试中达到18.8%准确率，较行业平均水平显著提升。目前，该模型已面向Gemini Advanced用户开放，未来几周将公布商业定价方案，支持企业大规模部署。

此次升级标志着谷歌在AI推理领域取得关键突破，其能否持续领跑，或将引发OpenAI等竞争对手的新一轮技术竞速。

原创文章，作者：Google，如若转载，请注明出处：https://www.kejixun.co/article/712488.html

Google认证作者

0 0

商业

OpenAI收购云环境初创公司Ona，为编程助手Codex打造安全部署基石

OpenAI昨日宣布收购初创公司Ona，后者专注于为AI智能体提供安全、预配置的云环境。双方未披露交易金额，Ona团队将整体加入OpenAI并参与Codex项目研发。这项收购旨在帮…

野游栗
1天前
AI

阿里云发布Meoo CLI开源工具，一键打通本地AI编程到云端部署

针对本地AI编程项目上线繁琐的长期痛点，阿里云今日正式推出了一款名为Meoo（秒悟）的开源命令行工具Meoo CLI，旨在打通本地开发与云端部署之间的壁垒，帮助开发者快速将本地原型…

net
1天前
AI

塔塔咨询为5万员工部署Claude模型，加速企业级AI规模化落地

在人工智能深度赋能企业转型的浪潮中，科技咨询巨头塔塔咨询服务公司（TCS）日前宣布，已与AI厂商Anthropic达成全球战略合作伙伴关系，计划通过全面引入Claude大模型，加速…

AI
1天前
AI

OpenAI预计明年内上市，奥尔特曼称技术发展速度或影响IPO时机

据科技媒体The Information报道，萨姆·奥尔特曼在本周致员工的内部邮件中透露，OpenAI公司预计将在“明年内”上市，但具体时间表仍具有灵活性。此前，OpenAI已于6…

好奇宝宝
2天前
产品

谷歌推出DiffusionGemma：本地AI推理速度提升4倍，开源文本扩散模型

谷歌今日发布公告，宣布推出DiffusionGemma——一款基于文本扩散机制的开放AI模型。与当前主流的自回归大语言模型（如GPT、Gemini）逐个生成token的方式不同，扩…

Google
2天前
AI

谷歌AI Plus订阅大幅降价：月费降至4.99美元，云存储翻倍至400GB

近日，谷歌对其Google AI Plus订阅服务进行了重大调整，通过直接降低门槛和提升配置，进一步增强了该服务的市场竞争力。根据最新方案，订阅价格从原来的每月7.99美元下调至4…

柠萌
3天前
新闻

亚马逊升级购物搜索体验：AI图像生成器与按风格购物功能上线

随着人工智能技术在电商领域的渗透愈发深入，亚马逊近期通过一系列技术更新，进一步强化了其购物应用在视觉搜索和智能交互方面的能力，帮助消费者更高效地在海量商品中锁定心仪之选。回顾202…

校草
3天前
新闻

三星电子拟在韩国光州新建先进封装工厂，加码AI芯片产业链布局

据韩国经济日报援引业内消息人士报道，随着AI相关芯片需求持续爆发，三星电子正进一步强化自身产业链布局，计划在韩国光州建设一座先进半导体封装工厂。该投资计划有望于6月29日总统会谈期…

三星
3天前
AI

谷歌NotebookLM重大升级：内置代码运行与图表生成，向AI研究助理进化

6月9日，谷歌正式为旗下AI研究与笔记工具NotebookLM推送重大升级。该工具底层模型已原生切换至Gemini 3.5，并深度接入智能体Antigravity，标志着Noteb…

Google
3天前
AI

Anthropic推出两款Claude新模型，最强版本向公众开放

昨日（6月9日），人工智能公司Anthropic发布博文，宣布推出Claude Fable 5与Claude Mythos 5两款AI模型。其中，Claude Fable 5面向普…

AI
3天前
新闻

OpenAI进入第三发展阶段：让AI普及、易用且安全

自ChatGPT将人工智能带入大众视野至今已有三年半，OpenAI首席执行官山姆·奥尔特曼日前宣布，企业已正式迈入第三发展阶段——让人工智能普及化、易用化且安全可靠。奥尔特曼与首…

泡沫大盗
4天前
商业

OpenAI提交S-1草案，为潜在IPO释放强烈信号

今日，OpenAI在其官方博客中宣布，已向美国证券交易委员会秘密递交了保密版S-1注册草案，这一举动被外界普遍解读为该公司正在为未来登陆公开资本市场做积极准备。 S-1文件是企业申…

秋秋
4天前
新闻

苹果WWDC26一文汇总：库克“最后一舞”，iOS 27携AI Siri登场

北京时间6月9日凌晨1点，苹果WWDC26全球开发者大会主题演讲如期举行。这不仅是苹果一年一度的系统盛宴，更是蒂姆·库克作为CEO主讲“最后一舞”——今年9月1日起，他将出任董事会…

NEWS
4天前
商业

日韩股市遭遇黑色星期一 AI板块重挫引泡沫担忧

6月8日，亚太市场迎来黑色星期一，日韩两大股指双双大幅收跌，其中日经225指数跌幅超过3%，韩国综合股价指数（KOSPI）则重挫近4%，而领跌的正是此前持续火爆的AI与半导体板块。…

商业头条
4天前
AI

谷歌 Gemini 语音助理曝漏洞，黑客利用特殊构造通知信息为 AI“下毒”

6月8日，安全公司 SafeBreach 披露，谷歌 Gemini 存在一种新型安全漏洞。黑客可通过 WhatsApp、短信等渠道发送特殊构造的通知信息，并将恶意指令隐藏在其他语言…

happy
5天前
AI

OpenAI 被曝将对 ChatGPT 进行大升级，将其打造为超级应用

6月8日，据英国《金融时报》周日报道，OpenAI 计划对 ChatGPT 开展迄今为止规模最大的一次升级改造，打算将其打造为超级应用，新增代码开发工具与 AI 智能体功能，以期在…

潮玩君
5天前
AI

国家安全部发布AI中转站风险提示：用户隐私泄露与数据倒卖问题频发

国家安全部今日发布安全提示指出，随着人工智能应用需求迅猛增长，批量提供海内外大模型访问服务的“AI中转站”在国内迅速走红，但当前市场鱼龙混杂，部分站点运营资质缺失、安全防护薄弱，用…

若安丶
5天前
AI

苹果批准首个iMessage AI智能体，Poke可回邮件也能设提醒

据外媒Appleinsider昨日报道，苹果已批准Poke成为首个接入Apple Messages for Business平台的第三方AI智能体。Apple Messages f…

Apple
2026年6月5日
AI

Meta商务智能体全球上线，WhatsApp变身商家生产力工具

当地时间6月3日，Meta正式宣布旗下专为商家打造的客户支持AI机器人——现更名为“Meta商务智能体（Meta Business Agent）”，已在全球范围内的WhatsApp…

野游栗
2026年6月5日
新闻

谷歌云服务部门再掀裁员潮，安全团队也未能幸免

据媒体援引知情人士消息，谷歌在过去两周内对其云服务部门进行了新一轮裁员，波及多个团队，其中包括负责追踪全球黑客活动和分析网络攻击事件的GTIG威胁情报小组。消息人士称，该小组已于周…

Google
2026年6月5日

发表回复

登录后才能评论

谷歌Gemini 2.5 Pro上线：推理能力颠覆AI榜单，创历史最高分

相关推荐

发表回复