‌Nvidia发布Nemotron-Nano-9B-v2小型语言模型推理速度提升6倍

柠萌 • 2025年9月2日 13:39:00 • AI

英伟达（Nvidia）近日正式推出新型小型语言模型Nemotron-Nano-9B-v2，进一步推动小型模型的技术发展。该模型拥有9亿参数，虽比同类小型模型规模更大，但较原始12亿参数版本大幅精简，可在单台Nvidia A10 GPU上高效运行。据Nvidia AI模型后训练总监Oleksii Kuchiaev介绍，参数缩减旨在优化部署需求，其混合架构使批量处理速度达到同类变换模型的6倍。

该模型支持英语、日语等六种语言，适用于指令跟随和代码生成任务。其创新性在于用户可通过/think等控制令牌切换AI的推理过程，系统默认生成思维链但支持关闭。此外，”思考预算”机制允许开发者设定推理标记数量，平衡准确性与响应速度。测试显示，在推理开启模式下，该模型在AIME25、MATH500等基准测试中表现优异，尤其在长上下文处理中准确性显著高于同类开放模型。

Nvidia为模型采用开放许可协议，允许商业自由使用且不主张输出所有权，大幅降低企业部署门槛。这一举措为需要轻量级推理能力的开发者提供了新工具，其动态推理控制功能进一步拓展了小型语言模型的应用场景，标志着高效AI部署技术的重要突破。

原创文章，作者：柠萌，如若转载，请注明出处：https://www.kejixun.co/article/732708.html

柠萌管理团队

0 0

AI

英伟达推出Nemotron 3 Nano Omni全模态模型，吞吐量最高提升9.2倍

当地时间4月28日，英伟达正式发布名为Nemotron 3 Nano Omni的开源全模态推理模型，旨在为企业级AI Agent提供一体化基础模型底座。该模型基于30B?A3B混合…

AI
1天前
新闻

英伟达 DLSS 4.5 SDK 发布，支持将动态多帧生成、光线重构等新技术接入游戏

4月22日，据报道，英伟达现已发布 DLSS 4.5 SDK，让开发者能够在游戏中整合动态多帧生成等新技术。随着 DLSS 4.5 Streamline SDK 发布，开发者现在可…

马会林
2026年4月22日
商业

AI芯片制造商Cerebras启动美股IPO，挑战英伟达

据路透社报道，人工智能芯片制造商Cerebras Systems已于近日向美国证券交易委员会提交首次公开募股申请，计划在纳斯达克上市，股票代码拟定为“CBRS”。这家立志挑战AI芯…

商业头条
2026年4月19日
AI

NVIDIA推出全球首个开源量子AI模型，攻克校准与纠错难题

NVIDIA近日宣布推出全球首个开源量子AI模型“NVIDIA Ising”，旨在解决量子处理器校准和量子纠错两大关键难题，从而加速量子计算技术的实际应用。该模型系列包含两个核心部…

柠萌
2026年4月17日
AI

英伟达发布全球首个开源量子 AI 模型“ISING”，解决量子计算纠错与校准两大核心难题

4月15日，英伟达今天发布全球首个开源量子 AI 模型“ISING”，旨在帮助科研人员、企业构建可以实际应用的量子处理器，重点解决误差校正、处理器校准两大核心痛点。人们在通往大规模…

苹果派
2026年4月15日
AI

英伟达AI程序员自主优化GPU核心代码，7天击败人类专家

4月8日，英伟达研究团队近日发表了一项突破性成果：他们开发了一套名为“自主变异操作器”的AI系统，让AI化身自主程序员，专门负责优化GPU芯片的核心计算程序。在连续工作7天后，这套…

潮玩君
2026年4月8日
新闻

英特尔 BMG-G31 GPU 核心面积为 268 平方毫米，集成 277 亿个晶体管

4月7日，根据 Intel 英特尔向德国媒体 PCGH (PC Games Hardware) 确认的情况，应用于锐炫 Arc Pro B70 / B65 专业显卡的 &#8220…

李森
2026年4月7日
新闻

Quantum Machines发布开放加速堆栈，打通经典XPU与量子计算系统

3月25日，量子计算企业Quantum Machines宣布推出业界首个可将任意经典XPU与量子计算控制堆栈相整合的开放加速堆栈，实现量子计算机原生支持量子纠错与人工智能。该堆栈在…

校草
2026年3月25日
产品

英伟达发布GeForce Game Ready 595.97 WHQL驱动：优化游戏体验，修复三项问题

3月25日，英伟达发布GeForce Game Ready 595.97 WHQL显卡驱动。这一版本主要是日常的优化与修复，旨在提升玩家在支持DLSS、光线追踪、路径追踪和NVID…

李森
2026年3月25日
新闻

英伟达串流技术引爆苹果 Vision Pro 生态 CloudXR 6.0技术支持

3月18日，据报道称本周在美国圣何塞举办的 GTC 2026 活动中，英伟达宣布和苹果公司合作，Vision Pro 头显升级 visionOS 26.4 系统更新后，可以获得 C…

校草
2026年3月18日
新闻

英伟达新一代 Rubin 芯片阵容亮相，黄仁勋预测到 2027 年 AI 芯片有望带来 1 万亿美元收入

3月17日，据报道，英伟达 CEO 黄仁勋在 2026 年 GTC 技术大会的主题演讲中，抛出了一系列重磅消息。他不仅一口气发布了包括全新 Vera 处理器在内的多款新硬件，还大…

潮玩君
2026年3月17日
新闻

SK海力士亮相GTC 2026 集中展示下一代AI存储技术

当地时间3月16日至19日，SK海力士亮相在美国加州圣何塞举行的“GTC 2026”大会，重点展示其在AI时代作为基础设施核心的存储技术布局。依托与英伟达的深度合作，SK海力士在本…

秋秋
2026年3月17日
AI

英伟达进军太空计算领域星载AI性能提升25倍

当地时间3月17日，在美国加州圣何塞举行的2026年GTC大会上，英伟达正式发布面向太空应用的“太空计算”平台，推出Space-1 Vera Rubin模块、IGX Thor及Je…

AI
2026年3月17日
AI

英伟达开源 AI 模型Nemotron 3 Ultra 吞吐量效率提升 5 倍

3月17日，在美国加州圣何塞举行的 2026 年 GTC 大会上，英伟达为推动智能体（Agentic）、物理与医疗 AI 的下一波浪潮，宣布全面扩展其开源模型家族。在智能体领域，…

马会林
2026年3月17日
AI

黄仁勋推出英伟达版“小龙虾” NemoClaw：主打“一键安装”

3月17日，在美国加州圣何塞举行的 2026 年 GTC 大会上，英伟达推出针对“小龙虾”OpenClaw 智能体平台的 NemoClaw 软件栈，主打“一键安装”体验。在 GT…

柠萌
2026年3月17日
AI

英伟达发布开源大模型Nemotron 3 Super，推理速度提升三倍

英伟达在AI大模型领域再次投下重磅筹码，于3月12日正式推出专为AI智能体设计的新一代开源模型Nemotron 3 Super。该模型凭借颠覆性的架构创新和逼近闭源顶尖模型的性能，…

若安丶
2026年3月13日
AI

英伟达发布最强开源模型Nemotron 3 Super，1200亿参数专攻复杂智能体

芯片巨头英伟达昨日发布博文，宣布推出Nemotron 3 Super开源大模型，这是该公司迄今为止最强大的开源权重AI模型。该模型拥有1200亿参数，采用混合专家架构，推理时仅激活…

net
2026年3月12日
新闻

英伟达投260亿美元转型，欲打造开源AI模型抗衡OpenAI

芯片巨头英伟达正酝酿一场重大战略转型。据外媒连线今日报道，英伟达宣布将在未来五年内投资260亿美元，用于开发开源AI模型，此举被解读为该公司正从纯粹的芯片制造商向顶尖AI前沿实验室…

NEWS
2026年3月12日
AI

英伟达“龙虾”即将上线将推出“NemoClaw”开源 AI 智能体平台

3月10日，据《连线》发布博文，报道称下周在圣何塞举办的 GTC 年度开发者大会上，英伟达将推出名为“NemoClaw”的开源 AI 智能体平台。知情人士透露，英伟达目前正向各大…

柠萌
2026年3月10日
AI

美拟对全球AI芯片出口实施许可管制，英伟达AMD股价应声下跌

美国政府正酝酿一项影响深远的AI芯片出口管制新规，拟将现行仅覆盖约40个国家的限制措施扩展至全球范围。根据已起草的法规草案，未来英伟达、AMD等公司的AI加速器出口至任何地区，都可…

李小白
2026年3月6日