
继今年2月发布并开源VLA大模型Xiaomi-Robotics-0后,小米今日宣布正式推出该模型的真机后训练全流程,让这一曾在HuggingFace全球VLA模型下载榜上位列第六的模型,进一步向“开箱即用”的生产力工具迈进。
据小米介绍,基于预训练基座,团队仅利用20小时的任务数据进行真机后训练,便让机器人掌握了“将耳机收纳进耳机盒”这一高难度动作,并能连续丝滑地完成多个耳机的收纳操作。这一看似简单的任务实则充满挑战:耳机与收纳槽之间的公差极小,模型必须具备亚毫米级的空间感知精度才能实现精准对位;同时,耳机与盒体表面粗糙度最低达到Ra0.03μm,极易在触碰过程中发生位移,模型必须能够快速修正动作偏差以避免装配失败。
通过发布完整的后训练流程,小米展示了其VLA模型在精密操作任务上的快速学习能力。官方表示,这意味着开发者与行业用户将能够基于开源基座,以更少的数据和算力成本,针对具体场景进行高效后训练,让Xiaomi-Robotics-0从通用预训练模型加速进化为解决实际问题的专用机器人智能体。
原创文章,作者:XIAOMI,如若转载,请注明出处:https://www.kejixun.co/article/751171.html