‌英伟达联手Groq，AI推理时代正式分道扬镳

AI • 2026年1月4日 13:17:00 • AI

2026年开年，人工智能基础设施迎来关键转折：英伟达以200亿美元授权费引入Groq的专用推理架构，标志着通用GPU主导推理时代的终结。德勤数据显示，2025年底，AI模型推理环节的收益首次超越训练环节，延迟与状态保持能力成为新竞争核心。面对预填充与解码任务的结构性分化，英伟达不再依赖单一GPU架构，而是将Groq的SRAM高速缓存技术嵌入其Vera Rubin芯片体系，专攻低延迟解码场景，同时以GDDR7内存替代HBM，降低大规模预填充成本。

SRAM的超低能耗特性——单数据位传输仅需0.1皮焦耳——使其成为边缘AI、语音识别与实时机器人控制的理想载体，尤其适配参数低于80亿的精简模型。这一细分市场正因模型压缩技术爆发而迅速扩张，而英伟达此前并未布局。与此同时，Anthropic成功实现Claude模型在TPU与GPU间的无缝迁移，打破CUDA生态垄断，迫使英伟达通过技术整合守住生态护城河。Meta收购Manus公司，更凸显KV缓存命中率对智能体连续推理的关键作用，Groq的SRAM正成为这一“短期记忆”系统的理想载体。

未来，AI架构不再是“买什么芯片”，而是“把任务发往哪里”。预填充、解码、边缘、云端——每类负载都将被精准路由至最适配的硬件单元。英伟达的这场战略转身，不是退让，而是对碎片化时代的主动重构。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/742868.html

AI Groq 人工智能英伟达

AI认证作者

0 0

AI

超两万用户联名请愿，要求OpenAI保留GPT-4o模型

近日，人工智能领域巨头OpenAI的一项决定引发了用户的强烈反弹。该公司宣布将于2月13日正式停用GPT-4o及其三个变体模型，这一消息迅速点燃了众多忠实用户的不满情绪。截至当地时…

AI
4天前
商业

Kimi两个月估值翻倍破百亿美元阿里腾讯联合领投超7亿美元

国内人工智能独角兽企业月之暗面（Moonshot AI）再获资本市场重磅加持。据《科创板日报》2月17日独家消息，在完成上一轮5亿美元融资仅一个多月后，旗下产品Kimi新一轮超7亿…

商业头条
5天前
AI

OpenAI升级计费系统，用“信用点数”为AI服务续跑

人工智能领域的领军企业OpenAI日前宣布，已为其Codex和Sora等产品引入了一套全新的计费引擎。这套系统最大的亮点在于引入了“信用点数”机制，当用户触达传统的速率限制时，系统…

AI
2026年2月15日
AI

苹果回应Siri跳票传闻：仍按计划2026年年内推出

针对彭博社关于“Siri新功能推迟发布”的报道及随后引发的股价大跌，苹果公司昨日向CNBC发表声明，明确表示新版Siri仍按既定计划于2026年年内正式推出，试图平息市场对AI版语…

Apple
2026年2月13日
AI

百度千帆推AI编码订阅服务Coding Plan 首月9.9元抢占开发者市场

近日，百度千帆正式发布AI编码订阅服务“Coding Plan”，覆盖代码编写、理解与优化的全流程环节，成为国内云计算厂商在AI辅助编程领域的又一重要落子。该服务即日起开放订阅，新…

百度
2026年2月12日
新闻

xAI核心团队近半离职，面临人才保留挑战

当地时间周一晚间，埃隆·马斯克旗下人工智能公司xAI的联合创始人Tony Wu宣布离职，他在社交平台上发文暗示将开启“人生新篇章”。至此，xAI最初的12人创始团队中已有5人离开，…

net
2026年2月11日
AI

DuckDuckGo推出隐私优先AI语音聊天，承诺不存储用户音频

隐私搜索引擎DuckDuckGo于2月10日正式宣布，在其AI聊天平台Duck.ai上新增实时语音聊天功能，并承诺提供极致的隐私保护。该功能允许用户通过加密通道与大语言模型进行自然…

happy
2026年2月11日
AI

OpenAI升级ChatGPT研究工具，新增全屏浏览与精准溯源功能

今日，OpenAI宣布为其AI助手ChatGPT的深度研究工具推出重要更新，该功能现由更强大的GPT-5.2模型驱动，并新增了全屏查看器等实用特性，旨在提升用户进行深度信息检索与报…

AI
2026年2月11日
AI

马斯克预言：三年内太空将成为AI算力成本最低之地

特斯拉与SpaceX首席执行官埃隆·马斯克近日在访谈中抛出惊人观点：受制于地球电力增长的瓶颈，太空将在未来30至36个月内成为部署人工智能算力成本最低、且唯一具备大规模扩展性的场所…

好奇宝宝
2026年2月10日
AI

马斯克警告：唯AI与机器人能避免美国债务崩溃

特斯拉CEO埃隆·马斯克近日在访谈中发出严峻警告，称人工智能与机器人是解决美国国债危机的唯一途径，否则美国“1000%会破产”。马斯克指出，美国国债规模已达38.5万亿美元，仅年…

李小白
2026年2月9日
AI

阿里千问接入支付宝AI付一句话即可点外卖

近日，阿里旗下千问App正式接入支付宝“AI付”功能，用户在与AI对话过程中即可直接完成外卖点单与支付，标志着AI技术与日常消费场景的融合更进一步。据悉，用户只需在千问App内说…

AI
2026年2月9日
探索

SpaceX调整太空探索优先级：推迟火星任务，专注NASA登月计划

据《华尔街日报》报道，SpaceX已决定推迟原定于今年进行的火星任务，将战略重心转向其承诺已久的美国宇航局（NASA）登月计划。这一转变意味着该公司将优先确保在2027年3月实现无…

科学
2026年2月7日
AI

AI语音服务提供商ElevenLabs估值冲至110亿美元登顶全球AI语音赛道

近日，AI语音服务提供商ElevenLabs宣布完成5亿美元D轮融资，由红杉资本领投，a16z、ICONIQ Capital等机构跟投，公司估值飙升至110亿美元，成为当前全球估值…

商业头条
2026年2月6日
AI

Claude Opus 4.6发布：AI自主能力与办公集成再升级

人工智能公司Anthropic于2月5日正式推出新一代模型Claude Opus 4.6。此次迭代距离上版本仅两个月，重点强化了模型的自主规划能力与任务专注度，旨在显著减少人机交互…

AI
2026年2月6日
新闻

库克详解苹果AI蓝图与传承计划

在昨日举行的苹果公司全员大会上，首席执行官蒂姆·库克就公司人工智能战略与领导层继任计划发表了关键讲话。库克将AI定义为“我们一生中最深刻的机遇之一”，强调苹果凭借其独特的软硬件整合…

Apple
2026年2月6日
新闻

AI巨头公开互怼超级碗广告引发行业争执

当地时间周三，OpenAI首席执行官萨姆·奥尔特曼在社交平台公开抨击竞争对手Anthropic的超级碗广告“包含明显不实信息”，称其使用“含糊其辞的双面话术”。此次争议源于Ant…

聆听
2026年2月5日
AI

科研AI新突破：OpenScholar大幅降低引用幻觉

针对现有AI模型在学术引用中频繁“捏造”信息的难题，一项最新研究带来了重要进展。由华盛顿大学与艾伦人工智能研究所联合研发的OpenScholar模型，成功将引用准确率提升至与人类专…

若安丶
2026年2月5日
AI

松下设立首席人工智能官战略核心转向AI

昨日，松下公司宣布，将于4月1日起进行重大管理层架构调整，新设首席人工智能官与解决方案营收官两大核心职位。此举标志着这家科技巨头将人工智能从技术层面提升至驱动集团整体战略转型的核心…

野游栗
2026年2月5日
AI

AI智能体遭恶意利用成macOS新型威胁载体

知名密码管理工具1Password的安全团队于2月2日发布警示，近期爆火的AI智能体OpenClaw被发现存在严重安全漏洞，已被攻击者利用，成为针对macOS用户传播和植入恶意软件…

NEWS
2026年2月4日
AI

OpenAI高薪挖角竞争对手安全专家

人工智能领域的顶尖公司正不惜重金争夺关键人才。当地时间本周二，OpenAI首席执行官萨姆·奥尔特曼在社交平台X上宣布，其公司已正式任命迪伦·斯堪的纳罗为安全防范负责人。值得注意的是…

happy
2026年2月4日

发表回复

登录后才能评论

‌英伟达联手Groq，AI推理时代正式分道扬镳

相关推荐

发表回复