谷歌发布Gemini 3.1 Flash-Lite 速度最快、最具成本效益

马会林 • 2026年3月4日 10:46:00 • AI

3月4日，谷歌正式推出Gemini 3.1 Flash-Lite，声称这是Gemini 3系列中速度最快、性价比最高的模型，并表示3.1 Flash-Lite专为开发者的大规模、高吞吐量工作负载而设计，在其价格区间和模型级别中展现了极高的质量。

即日起，3.1 Flash-Lite将通过Google AI Studio中的Gemini接口向开发者开放预览版，并通过Vertex AI面向企业用户推出。

3.1 Flash-Lite每百万输入Token(Input tokens)需0.25美元，每百万输出Token(Output tokens)为1.50美元。根据Artificial Analysis的基准测试，3.1 Flash-Lite在保持同等或更高质量的前提下，性能表现优于2.5 Flash。其首字响应速度(Time to First Answer Token)提升了2.5倍，输出速度也增长了45%。谷歌称，这种低延迟特性是高频工作流的必备条件，使其成为开发者构建响应式实时体验的理想模型。

3.1 Flash-Lite在Arena.ai排行榜上获得了1432分。在推理和多模态理解(Multimodal understanding)的各项基准测试中，它的表现均超越了同级别的其他模型。例如，它在GPQA Diamond测试中取得了86.9%的成绩，在MMMU Pro测试中取得了76.8%的成绩。这一表现甚至超越了前几代体量更大的模型，如2.5 Flash。

除了原生性能外，Gemini 3.1 Flash-Lite在AI Studio和Vertex AI中还标配了“思考等级”功能。这让开发者能够灵活控制模型针对特定任务的“思考”深度，对于管理高频工作负载而言，这一功能至关重要。3.1 Flash-Lite能够处理大规模任务，例如对成本敏感的大批量翻译和内容审核。同时，它也能胜任需要深度推理的复杂工作，例如生成用户界面和仪表板、创建模拟环境以及遵循复杂指令。

谷歌表示，AI Studio和Vertex AI的早期接入开发者，以及拉提图德(Latitude)、卡特维尔(Cartwheel)和威灵(Whering)等公司，已经开始使用3.1 Flash-Lite来解决大规模的复杂问题。早期测试人员强调了3.1 Flash-Lite的效率和推理能力。他们表示，该模型能以大体量模型的精准度处理复杂输入，并能严格遵循指令，保持高度的一致性。

原创文章，作者：马会林，如若转载，请注明出处：https://www.kejixun.co/article/746160.html

马会林管理团队

0 0

新闻

谷歌Workspace应用图标全面换新，渐变色设计向AI看齐

继去年9月宣布将渐变色“G”标志定为公司新标识后，谷歌正将这一设计语言全面推向Workspace应用。据9to5Google当地时间4月26日报道，知情人士透露，Gmail邮箱、谷…

Google
2天前
AI

谷歌称75%新代码由AI生成，工程师转向审核角色

据《商业内幕》报道，谷歌当地时间周三披露，目前公司内部新编写的代码中已有四分之三由AI生成，随后再交由人类工程师审核。这一比例近年来持续攀升——截至2024年10月，该数字约为四分…

Google
6天前
AI

YouTube向娱乐行业开放人脸声纹检测技术，打击AI深度伪造

人工智能深度伪造技术为媒体创作带来诸多可能，其获取门槛已降至几乎人人可用的水平，但这也意味着不法分子同样能加以利用。如何管控网络上由AI生成的虚假欺骗性内容，成为当下最大担忧之一。…

聆听
2026年4月22日
AI

谷歌DeepMind组建Gemini精英团队，布林亲自督战追赶Anthropic

为了在AI编程领域缩短与Anthropic旗下Claude模型的差距，谷歌DeepMind近期重组力量，成立了一支由Sebastian Borgeaud领导的Gemini精英团队，…

Google
2026年4月22日
新闻

网页部署平台Vercel遭黑客入侵，第三方AI工具成攻击突破口

知名网页应用托管与开发平台Vercel近日证实遭遇一起安全入侵事件。一名自称是近期入侵Rockstar Games的幕后组织ShinyHunters成员的黑客，已在网上发布了部分窃…

小丸子
2026年4月20日
AI

谷歌联手Marvell开发两款AI芯片，挑战英伟达霸主地位

据科技媒体《The Information》援引两位知情人士消息报道，Alphabet旗下谷歌正与芯片设计公司Marvell Technology洽谈合作，共同研发两款专为高效运行…

小科同学
2026年4月20日
AI

谷歌向AI智能体开放Android开发指南

如今，任何人只要掌握提示词能力，就能成为Vibe Coding（氛围编程）开发者。ChatGPT、Claude、Gemini等工具甚至可以直接将一个点子转化为完整应用并发布到商店。…

Google
2026年4月18日
AI

Gucci携手谷歌2027年推智能眼镜，首个进入AI眼镜领域的奢侈品牌

据路透社4月17日凌晨报道，Gucci母公司开云集团CEO卢卡·德·梅奥表示，计划与谷歌合作推出Gucci品牌的智能眼镜，预计于2027年正式发布。这一举措有望使开云成为首个进入A…

李森
2026年4月17日
AI

波士顿动力Spot机器人获谷歌AI加持，可自主识别泄漏与爆炸风险

波士顿动力公司近日宣布，其四足机器人“Spot”已成功集成谷歌DeepMind开发的先进AI模型——Gemini Robotics-ER1.6，这一技术升级显著提升了机器人在工业检…

校草
2026年4月17日
AI

谷歌推出Mac原生版Gemini应用，支持全局快捷键唤醒

谷歌昨日（4月15日）正式发布Mac原生版Gemini应用，采用100% Swift语言开发，针对苹果Mac设备进行了深度优化。用户按下Option+Space即可唤起迷你聊天窗…

Google
2026年4月16日
AI

谷歌Chrome新增AI技能功能：常用提示词可一键复用

谷歌当地时间周二宣布，将为Chrome浏览器引入一系列人工智能新功能，其中最值得关注的是名为“Skills”（技能）的实用工具。该功能允许用户保存并重复使用自己常用的AI提示词，且…

Google
2026年4月15日
新闻

谷歌 Chrome 浏览器测试跨设备共享标签页自动打开功能，省去点击通知步骤

4月14日，谷歌 Chrome 浏览器正在测试一项更新，可在桌面端、iOS 及安卓设备间自动打开共享标签页，用户无需再点击通知即可打开。该功能预计在未来数月内向广大用户全面开放。 …

Google
2026年4月14日
AI

谷歌 Gemini AI 解锁新技能：生成交互式图表和 3D 模型

4月11日，谷歌正不断强化 Gemini 的可视化能力，当地时间 4 月 9 日，Gemini 的最新更新带来了交互式 3D 模拟与模型功能，用户通过简单提示即可生成动态内容。据…

苹果派
2026年4月11日
AI

微软发布 Harrier 系列嵌入 AI 模型，MTEB-v2 基准测试超越谷歌夺冠

4月9日，微软必应（Bing）团队于 4 月 7 日发布博文，宣布为满足现代 AI 智能体系统对信息处理的高标准需求，开源推出业界领先的文本嵌入模型系列 Harrier，该模型在多…

潮玩君
2026年4月9日
AI

谷歌改进 Gemini 助手危机响应机制，可帮助用户一键拨打求助热线

4月8日，据报道，谷歌今天对 Gemini 进行一系列改进，更好应对用户提出的心理健康问题。据报道，目前 Gemini 在遇到与自杀、自残相关的危机信号时会出现“一键连接”模块，引…

Google
2026年4月8日
AI

Anthropic最强AI模型Calude Mythos登场苹果、微软等合力推进网安项目

4月8日，Anthropic联合苹果、英伟达、微软、亚马逊云服务、谷歌、Linux基金会等11家科技巨头，共同启动Project Glasswing项目，并发布前沿AI模型Clau…

马会林
2026年4月8日
新闻

博通确认将向Anthropic供应谷歌TPU芯片提供英伟达技术的替代方案

4月7日，据博通确认，将使用谷歌的张量处理单元（TPU）向人工智能初创公司Anthropic PBC交付芯片，为市场提供了英伟达技术的替代方案。周一文件显示，博通与Alphabe…

校草
2026年4月7日
AI

谷歌推出可离线使用的 AI 听写应用 Google AI Edge Eloquent

4月7日，谷歌当地时间周一在 iOS 平台悄然推出了一款主打离线使用的语音听写应用“Google AI Edge Eloquent”，以此与 Wispr Flow、SuperWhi…

Google
2026年4月7日
AI

谷歌推出Gemma 4开源大模型，31B参数性能跻身全球前三

谷歌今日正式发布Gemma 4系列开源大模型，号称迄今为止该公司最智能的开源模型，专为高级推理与智能体工作流打造。本次共推出四种规格：高效20亿参数版（E2B）、高效40亿参数版（…

Google
2026年4月3日
手机

谷歌Pixel 11 Pro渲染图曝光移除原有彩色拼接部分

科技媒体Android Headline于3月31日发布博文，在分享了标准版与折叠屏版渲染图之后，再次曝光了谷歌Pixel 11 Pro手机的CAD渲染图。从最新放出的图片来看，新…

Google
2026年4月1日

发表回复

登录后才能评论

谷歌发布Gemini 3.1 Flash-Lite 速度最快、最具成本效益

相关推荐

发表回复