华为昇腾 0 Day 支持 MiniMax M2.7 模型,推理部署提供全流程支持

4月13日,据昇腾 AI 开发者公众号,4 月 12 日,MiniMax 正式开源其第一个自我深度迭代的模型 MiniMax M2.7。昇腾一直同步支持 MiniMax M2 系列模型,此次 M2.7 模型一经开源发布,昇腾 AI 基础软硬件即实现 0 Day 适配,可基于 vllm Ascend 在 Atlas 800 A3、Atlas 800I A2 系列产品上为该模型的推理部署提供全流程支持。

华为昇腾 0 Day 支持 MiniMax M2.7 模型,推理部署提供全流程支持

MiniMax M2.7 能够自行构建复杂 Agent Harness,并基于 Agent Teams、复杂 Skills、Tool Search Tool 等能力,完成高度复杂的生产力任务。在研发过程中,MiniMax 基于模型构建强化学习 Harness 中的数十个复杂的 skills,更新自己的 memory,驱动模型自身的强化学习,并基于结果优化强化学习过程和 Harness,开启模型的自我进化。

昇腾持续加速算子和基础软硬件创新,匹配 MiniMax M2.7 模型创新的 FlashComm 序列切分,AllReduce 换成 ReduceScatter 和 AllGather 通信加速;深度优化的 Transformer Attention 前序全链路融合算子和 MoE 大融合算子,彻底消除中间张量读写和多算子调度开销;同时在多 DP 并发场景下,自适应 DP 域负载均衡,大幅降低 prefill 对 decode 的抢断,显著提升重载忙时的吞吐性能,让广大用户和开发者畅享 MiniMax M2.7 新体验。

构建模型自我进化智能体:MiniMax 团队在开发过程中,研究员将 M2 的早期版本引导为一个研究型 Agent Harness 来参与下一代模型的迭代循环,它能够与不同的研究项目组进行交互和协作,研究员在每一层引导方向,模型在每一层负责构建,研究员只需在关键决策和讨论时介入。通过 Agent 驱动,大幅加速了问题发现和实验迭代,从而更快地交付模型。部分 RL 场景下,M2.7 能够胜任 30-50% 的工作流。

软件工程领域:M2.7 更深入地打磨了真实软件工程所需的编程能力,覆盖日志分析与 Bug 定位、代码重构、代码安全、机器学习、安卓开发等方向。在涵盖多种编程语言的基准测试 SWE-Pro 中 M2.7 以 56.22% 的正确率追平 GPT-5.3-Codex;而在更贴近真实工程场景的 SWE Multilingual(76.5)和 Multi SWE Bench(52.7)中展现出更显著优势。

专业办公领域:M2.7 模型提升了专业知识和任务交付能力,在 GDPval-AA 得分为开源最高;并且具备与复杂环境交互的能力,在 40 个复杂 skills (>2000 Token) 的 case 上,仍能保持 97% 的 skills 遵循率。

互动娱乐领域:M2.7 构建了一个 Agent 交互系统 OpenRoom,它将 AI 互动置入一个万物皆可互动的 Web GUI 空间,极大加强了人设保持和对话能力,并且能够随着模型 Agentic 能力的提升和社区共建持续进化。

原创文章,作者:HUAWEI,如若转载,请注明出处:https://www.kejixun.co/article/749836.html

HUAWEI的头像HUAWEI认证作者

相关推荐

发表回复

登录后才能评论