
近日,谷歌因Gemini AI平台需求激增被迫收紧资源供应,以应对日益增长的开发者及企业负载压力。自2025年春季以来,Gemini API的调用请求量翻倍,核心算力资源供不应求。为保障生态系统的公平使用,谷歌于2026年5月17日正式实施基于算力额度的使用限制,采用类似流量套餐的滚动更新机制。对于超出配额的请求,系统将触发频率限制,确保所有合作伙伴在资源吃紧的背景下均能获得基础调用支持。
在这一系列变动中,Meta受到的冲击最为显著。据悉,由于Meta对该模型的需求远超其他客户,谷歌此前已明确表示无法足额满足其申请的算力配额。这一突发限制直接打乱了Meta多项内部AI项目的推进节奏。为应对算力压力,同时配合公司内部压缩人工智能研发成本的战略,Meta已紧急要求员工优化调用流程,提升代码及令牌的使用效率。
业内人士指出,此次资源调控反映出全球AI算力底座面临的严峻现实:尽管大模型能力不断跃升,但支撑其高效运行的基础算力基础设施建设速度,仍难以完全追赶上爆发式的应用需求。对于像Meta这样深度依赖云端算力的厂商而言,如何在资源受限的前提下维持研发速度,将成为下阶段竞争的关键课题。
原创文章,作者:Google,如若转载,请注明出处:https://www.kejixun.co/article/756400.html