英伟达开源“双塔”扩散语言模型，生成吞吐量提升超两倍

AI • 2小时前 • AI

昨日，英伟达正式开源了旗下最新的Nemotron-Labs-TwoTower扩散语言模型，以一套名为“双塔”的架构创新，试图打破传统自回归模型在文本生成中的吞吐量瓶颈。传统自回归模型需逐token串行解码，面对大规模合成任务时效率明显不足，而英伟达的方案将任务拆解为两个部分：保持冻结的“上下文塔”负责处理提示词并保留原有语言理解能力，经过专门训练的“去噪器塔”则并行生成并优化token。

这一设计巧妙平衡了质量与速度——在2×H100 GPU的评测环境下，模型保留了基线模型98.7%的生成质量，同时实际生成吞吐量实现了2.42倍的显著提升，对于需要批量生产合成文本的数据团队而言，兼具高性能与高效率。

该模型还具备极高的灵活性，支持扩散模式、模拟自回归和标准自回归三种解码方式，开发者可根据任务需求自由选择。目前，模型已作为开放权重项目发布，遵循NVIDIA Nemotron开放模型许可协议，完全支持商业用途。尽管在代码生成和数学推理任务上相较原始基线有轻微性能回落，且对GPU显存有一定要求，但其为大模型推理加速提供了极具潜力的技术方向。

随着人工智能应用向高频、大规模场景持续渗透，通过算法架构优化来换取生成速度的思路，正成为模型研发领域不可忽视的新趋势，而英伟达此次开源无疑为这一赛道注入了强劲动能。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/756574.html

Nemotron-Labs-TwoTower 双塔英伟达

AI认证作者

0 0

AI

OpenAI发布首款AI芯片，号称媲美英伟达 Blackwell

6月25日，OpenAI 首次对外展示与博通联合设计的定制 AI 芯片 Jalapeño，希望通过自研芯片加快算力基础设施建设，并降低对英伟达 GPU 的依赖。 OpenAI、An…

科技观察者
2026年6月25日
AI

英伟达黄仁勋：AI 工厂时代来临，智能体重塑计算格局

6月25日，据报道，在英伟达年度股东大会上，英伟达首席执行官黄仁勋描绘了一幅雄心勃勃的 AI 基础设施扩张蓝图。黄仁勋表示 AI 产业已迈入新的阶段，智能体 AI（Agent A…

校草
2026年6月25日
AI

黄仁勋呼吁社会全面拥抱AI，类比汽车适应时代

当地时间6月17日，英伟达CEO黄仁勋在接受美联社采访时再度为人工智能热情发声，他呼吁社会必须主动改变，更积极、更广泛地拥抱AI，以改善人们的生活并加速经济增长与科学突破。面对AI…

若安丶
2026年6月19日
商业

英伟达拟发行200亿美元债券，为AI芯片研发筹措资金

据路透社报道，知情人士透露，英伟达计划在美国债券市场筹资200亿美元（约合1353.83亿元人民币），这将是该公司自2021年6月以来首次重返投资级债券市场。英伟达上一次发债融资规…

校草
2026年6月16日
新闻

SpaceX完成历史性IPO，马斯克成全球首位万亿富豪，宣布深化与英伟达合作

SpaceX在完成历史性首次公开募股（IPO）后，股票正式于纳斯达克开始自由交易，首日常规交易收涨超过19%，公司市值飙升至2.11万亿美元，推动埃隆·马斯克成为全球首位个人财富达…

聆听
2026年6月14日
新闻

英伟达向中国客户推销Vera处理器：最快8月上市，不受出口限制

据路透社报道称，英伟达已开始向中国客户推介其下一代数据中心处理器Vera，且该CPU并不受美国出口禁令限制。知情人士透露，英伟达方面已通知中国客户，这款面向AI数据中心的处理器最快…

若安丶
2026年6月13日
新闻

三星与英伟达商讨下一代Groq LPU芯片合作

据韩媒Sedaily消息，三星电子副董事长兼CEO、设备解决方案部负责人全永铉在6月9日与英伟达CEO黄仁勋会面后向记者透露，两家企业正就下一代Groq LPU系列AI加速器芯片上…

三星
2026年6月9日
商业

日韩股市遭遇黑色星期一 AI板块重挫引泡沫担忧

6月8日，亚太市场迎来黑色星期一，日韩两大股指双双大幅收跌，其中日经225指数跌幅超过3%，韩国综合股价指数（KOSPI）则重挫近4%，而领跌的正是此前持续火爆的AI与半导体板块。…

商业头条
2026年6月9日
新闻

英伟达CEO黄仁勋今日会见三星电子副会长，HBM和机器人合作成焦点

据韩媒《阿视亚经济》报道，英伟达CEO黄仁勋昨日在首尔与SK集团会长崔泰源等高管共进晚餐，期间确认他今日将与三星电子副会长全永铉会面。当被问及是否会与三星电子会长李在镕见面时，黄仁…

野游栗
2026年6月8日
AI

英伟达黄仁勋：三星、SK 海力士、美光通过认证，有资格供应 HBM4 内存

6月6日，据报道，英伟达公司首席执行官黄仁勋首次确认，英伟达已对三家最大的内存芯片制造商进行了认证，允许其为英伟达的人工智能（AI）加速器供应其最先进的高带宽产品。黄仁勋表示，已…

happy
2026年6月6日
AI

英伟达联合多所高校发布Gamma-World：多智能体世界模型突破单人视角瓶颈

视频世界模型正迎来从单人视角向多人协作的底层变革。英伟达联合清华大学、多伦多大学及Vector Institute正式发布名为Gamma-World的全新多智能体世界模型方案，旨在…

小丸子
2026年6月3日
AI

英伟达 RTX Spark PC 处理器正式发布：联发科合作 20 核 CPU + 英伟达 RTX GPU

6月2日，英伟达 CEO 黄仁勋在2026 台北国际电脑展主题演讲中正式宣布推出 RTX Spark PC 处理器。英伟达 RTX Spark 由联发科合作的 20 核 Grac…

潮玩君
2026年6月2日
AI

英伟达发布 DLSS 4.5 光线重建技术：支持全部 RTX 显卡，8 月推出

6月2日，NVIDIA（英伟达）发布 DLSS 4.5 光线重建 (Ray Reconstruction) 技术。这项技术将于今年 8 月正式推出，适用于所有 GeForce RT…

李小白
2026年6月2日
新闻

英伟达N1x处理器跑分曝光，性能与苹果三年前M3 Max持平

据多方消息，英伟达计划在台北国际电脑展（Computex）上，联合微软与ARM公布一项重磅的全新处理器合作项目。与此同时，备受关注的英伟达N1x处理器预发布跑分已在网络上提前流出，…

聆听
2026年6月1日
新闻

黄仁勋批部分CEO：将裁员归咎于AI“太敷衍”

英伟达CEO黄仁勋近日对部分企业高管将裁员归咎于人工智能的做法提出批评，直言这种说法“太敷衍”。他在接受新加坡亚洲新闻台采访时表示：“AI才刚刚兴起，怎么可能就已经在导致失业了？”…

泡沫大盗
2026年5月26日
AI

英伟达在新加坡设立具身智能研发中心

英伟达上周宣布，计划在新加坡设立一座全新的人工智能研究实验室，重点聚焦具身智能领域，以进一步推动自动化技术与机器人技术的布局。新加坡数字发展与信息部长杨莉明在声明中表示，具身智能指…

AI
2026年5月25日
新闻

黄仁勋苏姿丰抵台备战2026台北电脑展

距离2026台北国际电脑展正式开幕仅剩一周，两大芯片巨头英伟达与AMD的首席执行官已先后抵达中国台湾地区，为即将到来的新品发布做最后准备。本届展会将于6月2日在台北市南港区等地拉开…

若安丶
2026年5月25日
商业

英伟达第一财季净利润猛增211% 营收创816亿美元新高

英伟达今日发布2027财年第一财季报告，业绩全线超出预期。截至2026年4月26日，公司实现营业总收入816.15亿美元，同比增长85%；归母净利润高达583.21亿美元，同比暴涨…

商业头条
2026年5月21日
新闻

2026台北电脑展前瞻：英特尔掌机芯片与英伟达PC SoC成焦点

PC行业年度盛会COMPUTEX 2026距离开幕已不足一个月，但今年市场热情却比往年冷淡不少。据TrendForce报道，大众反应平淡的原因在于PC市场受到内存涨价冲击，多数厂商…

好奇宝宝
2026年5月11日
新闻

黄仁勋寄语应届生：别怕AI，当下是开启事业的最佳时机

英伟达创始人兼CEO黄仁勋近日出席卡内基梅隆大学2026年毕业典礼并发表演讲，他鼓励即将走出校园的应届生们不必畏惧人工智能，强调AI将为人类整体带来积极影响，而当下正是开启事业的最…

小科同学
2026年5月11日

发表回复

登录后才能评论

英伟达开源“双塔”扩散语言模型，生成吞吐量提升超两倍

相关推荐

发表回复