
谷歌于今日凌晨正式发布新一代AI模型Gemini 2.5 Pro,凭借强大的推理能力横扫全球多项榜单,并创下AI模型史上最大分数飞跃纪录。该模型主打“思考式”响应机制,在编程、数学及多模态任务中展现出领先实力,被谷歌称为“当前最强大的通用AI模型”。
根据官方数据,Gemini 2.5 Pro在LMArena测试中以领先第二名40分的绝对优势登顶,并包揽数学、创意写作、指令执行、长文本处理及多轮对话五项单项冠军。在视觉竞技场(Vision Arena)和编程测试中,其击败包括GPT-4.5、Grok-3等对手,甚至在网页开发竞技场(WebDev Arena)中斩获亚军,成为首个综合实力接近Claude 3.5 Sonnet的模型。
技术层面,Gemini 2.5 Pro支持百万级Token上下文处理(未来将扩展至200万Token),可同时解析文本、音频、图像及完整代码库。实测显示,该模型仅用一行提示词即生成交互式动画、像素游戏及分形可视化程序。例如,根据“宇宙鱼”指令,其自动编写出包含鱼类心理活动的动态场景;输入恐龙跑酷需求后,则生成完整游戏代码与像素化美术素材。
谷歌透露,2.5 Pro在未使用多数投票法等增强技术的情况下,即在GPQA科学测试中达到18.8%准确率,较行业平均水平显著提升。目前,该模型已面向Gemini Advanced用户开放,未来几周将公布商业定价方案,支持企业大规模部署。
此次升级标志着谷歌在AI推理领域取得关键突破,其能否持续领跑,或将引发OpenAI等竞争对手的新一轮技术竞速。
原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.co/article/712488.html