
芯片巨头英伟达昨日发布博文,宣布推出Nemotron 3 Super开源大模型,这是该公司迄今为止最强大的开源权重AI模型。该模型拥有1200亿参数,采用混合专家架构,推理时仅激活120亿参数,专为大规模运行复杂智能体系统设计。
随着企业将AI应用从简单聊天机器人转向多智能体协同工作,业界普遍面临两大瓶颈:上下文爆炸与推理税。多智能体交互会产生高达15倍的Token量,导致成本飙升和目标偏移;同时复杂智能体每步都需要推理,让系统变得昂贵且迟钝。Nemotron 3 Super为解决这些问题配备了100万Token的上下文窗口,让智能体能够将完整工作流状态保留在内存中,有效防止目标偏移并大幅降低多步推理成本。
在架构与性能方面,该模型通过混合专家架构将吞吐量提升5倍,准确率比前代翻倍。其Mamba层使内存和计算效率提高4倍,而Transformer层则负责高级推理。模型还引入潜在MoE新技术,以单个专家的计算成本激活四个专家,并支持多Token预测,让推理速度提升3倍。在英伟达Blackwell平台上,该模型以NVFP4精度运行,相比Hopper架构上的FP8,内存需求更低且推理速度快4倍。
Perplexity、Palantir和西门子等行业巨头目前已将该模型应用于搜索、软件开发、电信和半导体设计等核心工作流中。开发者可通过Hugging Face、各大云服务商获取该模型,同时它也被打包为NVIDIA NIM微服务,支持无缝部署至本地数据中心和云端。英伟达不仅遵循宽松许可证开源模型权重,还公布了完整的训练方法,包括超过10万亿Token的数据集和评估配方,展现出对开源生态的高度重视。
原创文章,作者:net,如若转载,请注明出处:https://www.kejixun.co/article/746867.html