‌阿里巴巴通义千问团队斩获NeurIPS 2025最佳论文奖，中国AI研究再登国际顶会

柠萌 • 2025年11月30日 12:22:00 • AI

全球人工智能顶级会议NeurIPS 2025于昨晚公布获奖名单，阿里巴巴通义千问团队凭借论文《Attention Gating Makes Better Foundation Models》从2万篇投稿中脱颖而出，成为4篇最佳论文中唯一的中国团队。本届大会录取率仅25%，竞争强度创历史新高，凸显了该成果的含金量。

论文创新性地提出了一种名为“滑动门”的注意力门控机制，在标准注意力层后加入可学习门控，实时筛选参与下游计算的关键注意力头与token。团队形象地将这一过程比作“安检”，有效拦截无效信息，提升计算效率与模型鲁棒性。实验数据显示，在3.5万亿tokens的训练规模下，1.7B稠密模型与15B MoE模型仅需增加1%参数，即可实现困惑度降低0.2、MMLU提升2分的显著效果，Pile数据集各子域均获一致提升。

这一技术突破已应用于即将发布的Qwen3-Next大模型，阿里同步开源了代码与1.7B实验模型至GitHub，供全球社区验证。通义千问团队表示，未来将进一步扩展门控机制至多模态与长文本领域，推动“会自我过滤的注意力”成为下一代大模型的标准组件。此次获奖不仅标志着中国AI基础研究能力的国际认可，也为大模型的高效训练提供了新范式。

原创文章，作者：柠萌，如若转载，请注明出处：https://www.kejixun.co/article/739906.html

NeurIPS 2025 通义千问阿里巴巴

柠萌管理团队

0 0

AI

阿里Qwen3.7-Max登顶全球编程榜第二国产模型再创纪录

昨日，全球权威编程评测榜单Code Arena公布最新排名。阿里巴巴推出的Qwen3.7-Max模型以1541分强势跃居全球第二，仅次于Claude系列，成为国产大模型在编程领域的…

AI
2026年5月27日
AI

Qwen3.7系列预览版上线，阿里云峰会即将正式发布

近日，阿里通义千问两款最新大模型——Qwen3.7-Max-Preview与Qwen3.7-Plus-Preview已率先登陆Qwen Chat及Arena AI（原LMArena…

AI
2026年5月19日
AI

阿里巴巴推出“AI店小蜜”，电商客服进入智能体时代

近日，阿里巴巴正式推出全新的“AI店小蜜”，这是电商领域首个同时具备售前咨询与售后办事能力的客服Agent产品。该产品全链路基于通义千问最新大模型构建，并深度融合淘宝海量交易数据进…

野游栗
2026年5月12日
商业

传腾讯阿里正洽谈投资DeepSeek，估值或超200亿美元

据科技媒体The Information报道，腾讯控股与阿里巴巴集团正就投资AI初创公司DeepSeek展开洽谈。若交易达成，DeepSeek的估值将超过200亿美元，约合1367…

商业头条
2026年4月23日
AI

阿里巴巴推出新一代AI模型Qwen3.6-Max-Preview，编程能力大幅提升

阿里巴巴近日正式发布Qwen系列新一代旗舰模型——Qwen3.6-Max-Preview。作为该系列的早期预览版，用户现已可在QwenStudio中与其进行交互对话，并通过阿里云百…

AI
2026年4月21日
AI

阿里巴巴推出AI开发工具Meoo：零代码一分钟生成网站

阿里巴巴旗下ATH事业群近日正式发布了一款全新的AI开发工具——Meoo（中文名“秒悟”）。该工具集成了千问、Kimi、GLM和MiniMax四大国内顶尖AI模型，旨在让没有任何编…

AI
2026年4月16日
新闻

阿里巴巴新设集团技术委员会升级通义大模型事业部

4月9日，据报道，阿里巴巴集团 CEO 吴泳铭发布内部信，宣布 AI 相关组织调整，包括新设立集团技术委员会，升级通义大模型事业部，加速 AI 建设。根据内部信，阿里巴巴在集团层…

柠萌
2026年4月9日
AI

阿里通义发布PrismAudio：视频生成环境音框架，让AI“先思考再发声”

3月25日，据报道，阿里巴巴通义实验室发布PrismAudio，这是一个专注于环境音/音效合成的视频生成音频框架。与常见的人物配音不同，PrismAudio致力于生成马蹄声、风雨声…

潮玩君
2026年3月25日
新闻

阿里巴巴蔡崇信：发展 AI 终极目标并非仅研发前沿模型，而是造福社会

3月23日，据报道，阿里巴巴集团主席蔡崇信在中国发展高层论坛 2026 年年会“技术创新与未来产业发展专题研讨会”上发表演讲，系统阐述了中国人工智能发展的三大核心驱动力，并披露阿里…

校草
2026年3月23日
新闻

阿里巴巴发布企业级AI原生工作平台“悟空” 内置于钉钉

3月18日，据报道，阿里巴巴近日发布企业级AI原生工作平台“悟空”。据悉，悟空是一款独立应用，即日起开启邀测，并将直接内置到钉钉之中。为配合该平台，钉钉进行了全面CLI（命令行界面…

若安丶
2026年3月18日
新闻

马云现身杭州云谷学校交流AI 蔡崇信、吴泳铭等阿里核心管理层罕见聚齐

3月3日晚间，据报道，马云与阿里、蚂蚁的核心管理层来到杭州云谷学校，与校长、老师们畅谈AI带来的挑战和机会。云谷学校公众号显示，阿里巴巴集团主席蔡崇信、CEO吴泳铭、风险委员会主…

柠萌
2026年3月4日
新闻

市场监管总局约谈7家平台企业，要求杜绝“内卷式”竞争

有媒体报道，国家市场监督管理总局近日对国内主要平台企业进行集中约谈，剑指促销推广活动中存在的突出问题。2月13日，市场监管总局约谈了阿里巴巴、抖音、百度、腾讯、京东、美团、淘宝闪购…

柠萌
2026年2月15日
AI

阿里发布低推理成本编程AI模型Qwen3-Coder-Next 赋能本地开发与智能体

阿里巴巴旗下千问团队近日正式推出专为编码代理与本地开发打造的开放权重语言模型Qwen3-Coder-Next。该模型基于其基础架构构建，采用了创新的混合注意力与专家混合模型（MoE…

好奇宝宝
2026年2月4日
AI

千问App砸30亿推春节请客计划，阿里生态联动免单吃喝玩乐

阿里巴巴旗下AI应用千问App宣布，将投入30亿元启动“春节请客计划”，该活动将于2月6日正式上线。据悉，春节期间，千问App将联合淘宝闪购、飞猪、大麦、盒马、天猫超市、支付宝等阿…

AI
2026年2月2日
新闻

‌美图与阿里2.5亿美元可转债落地，AI电商合作全面启动

昨日，美图公司正式宣布，与阿里巴巴签署的2.5亿美元可转债协议所有先决条件均已达成，并于当日完成交割。此次资金注入将用于公司一般商业用途，标志着双方战略合作进入实质性落地阶段。早…

野游栗
2026年1月1日
AI

阿里巴巴开源“高情商”语音AI 交互体验直逼真人

据报道，阿里巴巴通义实验室正式开源新一代端到端语音交互大模型Fun-Audio-Chat-8B，以超低延迟、自然流畅的交互体验，推动开源语音AI进入全新阶段。该模型不仅能实时理解用…

小科同学
2025年12月25日
AI

阿里巴巴通义千问发布Qwen-Image-Layered 颠覆图像编辑规则

阿里巴巴通义千问团队近日发布革命性模型Qwen-Image-Layered，首次实现将普通照片自动分解为多个可独立编辑的RGBA图层，彻底打破AI图像编辑“整体重绘”的局限。用户无…

AI
2025年12月22日
AI

‌阿里巴巴开源”百聆”语音大模型 3秒录音可克隆音色并切换9国语言

阿里巴巴通义大模型近日宣布，其”百聆”系列语音模型完成重大升级并正式开源。此次发布的两款新型语音模型突破性实现了仅需3秒录音即可无缝切换9种语言和18种方言…

AI
2025年12月16日
AI

阿里通义千问发布Qwen3-TTS语音合成AI模型支持49种音色与多方言

近日，阿里通义千问正式推出新一代语音合成AI模型Qwen3-TTS，该模型通过Qwen API开放访问，在音色多样性、多语种支持及拟人化表现上实现显著突破。 Qwen3-TTS提供…

李森
2025年12月11日
AI

阿里通义千问发布Qwen Code v0.3.0 全面升级开发者AI编程体验

阿里通义千问正式推出Qwen Code命令行AI工具的最新版本v0.3.0，该版本专为Qwen3-Coder模型优化，通过增强代码理解、自动化任务和智能辅助功能，显著提升开发者效率…

柠萌
2025年12月10日

发表回复

登录后才能评论

‌阿里巴巴通义千问团队斩获NeurIPS 2025最佳论文奖，中国AI研究再登国际顶会

相关推荐

发表回复