谷歌Gemini 2.5全家桶上线:Flash稳定、Flash-Lite刷新性价比纪录

谷歌Gemini 2.5全家桶上线:Flash稳定、Flash-Lite刷新性价比纪录

谷歌公司今日(6月18日)宣布Gemini 2.5系列AI模型重大进展:Gemini 2.5 ProGemini 2.5 Flash结束预览阶段,正式进入稳定运行状态,标志着两款模型已通过企业级压力测试,可支持生产环境部署。与此同时,全新轻量级模型‌Gemini 2.5 Flash-Lite‌首次亮相预览版,成为谷歌当前推理速度最快、成本效益最高的AI引擎。

此次升级的核心在于重构”成本-速度-性能”三角平衡。稳定版Gemini 2.5 Flash与Pro已获Spline、Rooms等创新企业,以及Snap、SmartBear等科技公司投入实际应用开发。而新推出的Flash-Lite在多项基准测试中表现亮眼:其代码编写、科学计算及多模态分析能力全面超越前代2.0 Flash-Lite,翻译与分类任务的延迟显著降低,尤其适配需要瞬时响应的场景。

更值得关注的是成本控制——Flash-Lite在未启用”动态思考”模式时,输入token成本低至‌每百万0.1美元‌(约人民币0.72元),输出成本为每百万0.4美元,相较同类模型具备显著价格优势。该模型继承了2.5系列的核心能力,包括百万级token上下文处理、外部工具链对接(如谷歌搜索与代码执行器),并提供推理预算灵活调控接口。

开发者可通过Google AI Studio与Vertex AI平台获取2.5 Flash/Pro稳定版及Flash-Lite预览版。消费端Gemini应用已集成2.5 Flash和Pro模型,而谷歌搜索引擎则部署了定制优化的Flash-Lite与Flash版本,以提升实时检索效率。此次全线升级,标志着谷歌在高效能AI商业化赛道迈出关键一步。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/724400.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论