英伟达发布最强开源模型Nemotron 3 Super，1200亿参数专攻复杂智能体

net • 2026年3月12日 13:20:00 • AI

芯片巨头英伟达昨日发布博文，宣布推出Nemotron 3 Super开源大模型，这是该公司迄今为止最强大的开源权重AI模型。该模型拥有1200亿参数，采用混合专家架构，推理时仅激活120亿参数，专为大规模运行复杂智能体系统设计。

随着企业将AI应用从简单聊天机器人转向多智能体协同工作，业界普遍面临两大瓶颈：上下文爆炸与推理税。多智能体交互会产生高达15倍的Token量，导致成本飙升和目标偏移；同时复杂智能体每步都需要推理，让系统变得昂贵且迟钝。Nemotron 3 Super为解决这些问题配备了100万Token的上下文窗口，让智能体能够将完整工作流状态保留在内存中，有效防止目标偏移并大幅降低多步推理成本。

在架构与性能方面，该模型通过混合专家架构将吞吐量提升5倍，准确率比前代翻倍。其Mamba层使内存和计算效率提高4倍，而Transformer层则负责高级推理。模型还引入潜在MoE新技术，以单个专家的计算成本激活四个专家，并支持多Token预测，让推理速度提升3倍。在英伟达Blackwell平台上，该模型以NVFP4精度运行，相比Hopper架构上的FP8，内存需求更低且推理速度快4倍。

Perplexity、Palantir和西门子等行业巨头目前已将该模型应用于搜索、软件开发、电信和半导体设计等核心工作流中。开发者可通过Hugging Face、各大云服务商获取该模型，同时它也被打包为NVIDIA NIM微服务，支持无缝部署至本地数据中心和云端。英伟达不仅遵循宽松许可证开源模型权重，还公布了完整的训练方法，包括超过10万亿Token的数据集和评估配方，展现出对开源生态的高度重视。

原创文章，作者：net，如若转载，请注明出处：https://www.kejixun.co/article/746867.html

AI Nemotron 3 Super 英伟达

net认证作者

0 0

商业

OpenAI收购云环境初创公司Ona，为编程助手Codex打造安全部署基石

OpenAI昨日宣布收购初创公司Ona，后者专注于为AI智能体提供安全、预配置的云环境。双方未披露交易金额，Ona团队将整体加入OpenAI并参与Codex项目研发。这项收购旨在帮…

野游栗
3小时前
AI

阿里云发布Meoo CLI开源工具，一键打通本地AI编程到云端部署

针对本地AI编程项目上线繁琐的长期痛点，阿里云今日正式推出了一款名为Meoo（秒悟）的开源命令行工具Meoo CLI，旨在打通本地开发与云端部署之间的壁垒，帮助开发者快速将本地原型…

net
5小时前
AI

塔塔咨询为5万员工部署Claude模型，加速企业级AI规模化落地

在人工智能深度赋能企业转型的浪潮中，科技咨询巨头塔塔咨询服务公司（TCS）日前宣布，已与AI厂商Anthropic达成全球战略合作伙伴关系，计划通过全面引入Claude大模型，加速…

AI
7小时前
AI

OpenAI预计明年内上市，奥尔特曼称技术发展速度或影响IPO时机

据科技媒体The Information报道，萨姆·奥尔特曼在本周致员工的内部邮件中透露，OpenAI公司预计将在“明年内”上市，但具体时间表仍具有灵活性。此前，OpenAI已于6…

好奇宝宝
1天前
新闻

亚马逊升级购物搜索体验：AI图像生成器与按风格购物功能上线

随着人工智能技术在电商领域的渗透愈发深入，亚马逊近期通过一系列技术更新，进一步强化了其购物应用在视觉搜索和智能交互方面的能力，帮助消费者更高效地在海量商品中锁定心仪之选。回顾202…

校草
2天前
新闻

三星电子拟在韩国光州新建先进封装工厂，加码AI芯片产业链布局

据韩国经济日报援引业内消息人士报道，随着AI相关芯片需求持续爆发，三星电子正进一步强化自身产业链布局，计划在韩国光州建设一座先进半导体封装工厂。该投资计划有望于6月29日总统会谈期…

三星
2天前
AI

Anthropic推出两款Claude新模型，最强版本向公众开放

昨日（6月9日），人工智能公司Anthropic发布博文，宣布推出Claude Fable 5与Claude Mythos 5两款AI模型。其中，Claude Fable 5面向普…

AI
2天前
新闻

三星与英伟达商讨下一代Groq LPU芯片合作

据韩媒Sedaily消息，三星电子副董事长兼CEO、设备解决方案部负责人全永铉在6月9日与英伟达CEO黄仁勋会面后向记者透露，两家企业正就下一代Groq LPU系列AI加速器芯片上…

三星
3天前
新闻

苹果WWDC26一文汇总：库克“最后一舞”，iOS 27携AI Siri登场

北京时间6月9日凌晨1点，苹果WWDC26全球开发者大会主题演讲如期举行。这不仅是苹果一年一度的系统盛宴，更是蒂姆·库克作为CEO主讲“最后一舞”——今年9月1日起，他将出任董事会…

NEWS
3天前
商业

日韩股市遭遇黑色星期一 AI板块重挫引泡沫担忧

6月8日，亚太市场迎来黑色星期一，日韩两大股指双双大幅收跌，其中日经225指数跌幅超过3%，韩国综合股价指数（KOSPI）则重挫近4%，而领跌的正是此前持续火爆的AI与半导体板块。…

商业头条
3天前
AI

国家安全部发布AI中转站风险提示：用户隐私泄露与数据倒卖问题频发

国家安全部今日发布安全提示指出，随着人工智能应用需求迅猛增长，批量提供海内外大模型访问服务的“AI中转站”在国内迅速走红，但当前市场鱼龙混杂，部分站点运营资质缺失、安全防护薄弱，用…

若安丶
4天前
新闻

英伟达CEO黄仁勋今日会见三星电子副会长，HBM和机器人合作成焦点

据韩媒《阿视亚经济》报道，英伟达CEO黄仁勋昨日在首尔与SK集团会长崔泰源等高管共进晚餐，期间确认他今日将与三星电子副会长全永铉会面。当被问及是否会与三星电子会长李在镕见面时，黄仁…

野游栗
4天前
AI

英伟达黄仁勋：三星、SK 海力士、美光通过认证，有资格供应 HBM4 内存

6月6日，据报道，英伟达公司首席执行官黄仁勋首次确认，英伟达已对三家最大的内存芯片制造商进行了认证，允许其为英伟达的人工智能（AI）加速器供应其最先进的高带宽产品。黄仁勋表示，已…

happy
6天前
AI

苹果批准首个iMessage AI智能体，Poke可回邮件也能设提醒

据外媒Appleinsider昨日报道，苹果已批准Poke成为首个接入Apple Messages for Business平台的第三方AI智能体。Apple Messages f…

Apple
2026年6月5日
AI

Meta商务智能体全球上线，WhatsApp变身商家生产力工具

当地时间6月3日，Meta正式宣布旗下专为商家打造的客户支持AI机器人——现更名为“Meta商务智能体（Meta Business Agent）”，已在全球范围内的WhatsApp…

野游栗
2026年6月5日
AI

OpenAI发布Codex工作插件，六大岗位技能AI正式“上岗”

北京时间周三凌晨，人工智能巨头OpenAI举行了以“AI上岗”为主题的发布会，正式推出面向股票投资、创意设计等岗位的Codex工作流插件，让AI深度介入企业日常任务。面对竞争对手在…

好奇宝宝
2026年6月4日
AI

英伟达联合多所高校发布Gamma-World：多智能体世界模型突破单人视角瓶颈

视频世界模型正迎来从单人视角向多人协作的底层变革。英伟达联合清华大学、多伦多大学及Vector Institute正式发布名为Gamma-World的全新多智能体世界模型方案，旨在…

小丸子
2026年6月3日
AI

OpenAI扩展Codex使用场景，新增六款岗位插件覆盖62个应用

今日，OpenAI发布公告，宣布进一步拓展AI智能体助手Codex的使用场景，新增6个岗位插件，总计覆盖62个应用和110项技能。Codex最初服务于软件开发，如今周活跃用户已超过…

AI
2026年6月3日
AI

微软发布全天候AI助理Scout，深度整合365生态

在今日举行的Build 2026开发者大会上，微软正式推出名为“Microsoft Scout”的全天候AI助理产品。这款代号为“龙虾（OpenClaw）”的新工具与Outlook…

小科同学
2026年6月3日
AI

微软在Build 2026大会上为Edge浏览器新增三项端侧AI能力

在今日开幕的Build 2026开发者大会上，微软宣布进一步扩展Edge浏览器的端侧AI能力，在去年推出的基于Phi-4-mini模型的写作辅助API基础上，新增了模型和API。本…

Microsoft
2026年6月3日

发表回复

登录后才能评论

英伟达发布最强开源模型Nemotron 3 Super，1200亿参数专攻复杂智能体

相关推荐

发表回复