MiniMax发布新一代大模型M2.7 开源办公评测登顶| 科技讯

MiniMax发布新一代大模型M2.7 开源办公评测登顶

AI • 2026年3月19日 10:44:00 • AI

3月19日，据报道，MiniMax发布新一代Agent旗舰大模型M2.7。该模型通过构建Agent Harness体系，深度参与自身训练与优化流程，在部分研发场景中可承担30%-50%的工作量，并在内部评测集上实现约30%的效果提升。

在核心能力上，M2.7在SWE-bench Pro中取得56.22%的成绩，接近国际一线水平。同时在VIBE-Pro、Terminal Bench 2等真实工程测试中表现突出，支持端到端项目交付与复杂系统理解。办公场景方面，其在GDPval-AA的ELO得分为1495，为开源最高，并显著提升Office文档处理与多轮编辑能力。

目前，M2.7已在MiniMax Agent与开放平台全球上线。从自研优化到开源登顶，MiniMax正以M2.7推动Agent模型能力边界向外扩展。

根据测试数据，M2.7在SWE-bench Pro中取得56.22%成绩，接近国际一线水平；同时在VIBE-Pro、Terminal Bench 2等真实工程测试中表现突出，支持端到端项目交付与复杂系统理解。办公场景方面，其在 GDPval-AA 的ELO得分是1495，为开源最高，并显著提升Office文档处理与多轮编辑能力。

M2.7强化了“多智能体协作”（Agent Teams）能力。在这一模式下，模型需同时承担多个角色，进行对抗性推理与协同决策。这对模型的身份保持、逻辑一致性与协议遵循提出更高要求，也被视为Agent应用从单点能力走向复杂系统的重要标志。与此同时，MiniMax也在探索Agent的“非生产力边界”。通过增强模型的人设保持与情感交互能力，M2.7开始具备更强的互动属性，并支撑起MiniMax最新推出的互动娱乐产品OpenRoom，将AI交互延伸至沉浸式Web环境，探索“对话即界面”的新交互范式。

从行业层面来看，随着OpenClaw等Agent框架的走红，AI竞争正从“模型能力”转向“执行系统能力”。M2.7的发布，意味着国内厂商正在尝试定义下一阶段的技术路线——即以Agent为核心、以自我进化为驱动的AI系统。分析人士认为，如果自我进化能力进一步成熟，未来AI系统有望实现从数据构建、模型训练到评测优化的全流程自动化，这将显著压缩研发周期，并重塑AI产业的成本结构与竞争格局。

原创文章，作者：AI，如若转载，请注明出处：https://www.kejixun.co/article/747905.html

MiniMax发布新一代大模型M2.7 开源办公评测登顶

相关推荐

发表回复