
小米集团昨日正式发布并全面开源具身大模型「MiMo-Embodied」,标志着通用具身智能研究从“垂直领域专用”向“跨域能力协同”迈出关键一步。随着具身智能逐步落地家居场景、自动驾驶技术迈向规模化应用,行业亟需解决机器人与车辆间的认知与能力互通问题。MiMo-Embodied作为业界首个跨域具身基座模型,成功统一了自动驾驶与具身智能的任务建模,为室内外智能协同提供了新思路。
该模型具备三大核心技术亮点:跨域能力覆盖同步支持具身智能(可供性推理、任务规划、空间理解)与自动驾驶(环境感知、状态预测、驾驶规划)的六大核心任务;双向协同赋能验证了室内交互与道路决策能力的知识转移效应;全链优化可靠通过多阶段训练策略(具身/自驾能力学习→CoT推理增强→RL精细强化),显著提升真实环境部署可靠性。
在29项核心基准测试中,MiMo-Embodied性能全面领先现有开源、闭源及专用模型。具身智能领域,其在17个Benchmarks上取得SOTA成绩,重新定义任务规划与空间理解能力边界;自动驾驶领域,于12个Benchmarks实现全链路突破;通用视觉语言领域亦展现卓越泛化性。小米表示,该模型的开源将加速跨场景智能融合,推动行业迈向更高效的通用智能时代。
原创文章,作者:XIAOMI,如若转载,请注明出处:https://www.kejixun.co/article/739270.html