近日,国际计算机视觉顶级会议CVPR 2026放榜,群核科技联合浙江大学、宇树科技等共同完成的两篇论文双双入选。CVPR堪称是“计算机视觉界的奥斯卡”,每年汇聚全球最前沿的 AI 研究成果。本届CVPR有效投稿数达16092篇,最终录用4090篇,录用率25.42% 。
当机器人从实验室走向真实家庭,“翻车”频发的根源在于AI缺乏对物理空间的深度理解。针对这一痛点,群核科技在两篇论文中分别给出了“学习框架”与“评测基准”的双重解法。
在《Arcadia》论文中,团队提出了面向具身智能终身学习的全生命周期闭环框架,让机器人“活到老学到老”。该框架依托其自研的SpatialLM大模型可将机器人采集的多模态传感器数据高效解析为结构化语义信息;结合SpatialGen的空间生成能力,系统可自动生成丰富的仿真3D场景,而通过群核科技空间智能训练平台SpatialVerse进行物理特性模拟和数据扩增,为机器人提供了海量且物理一致的“训练场”。实测数据显示,搭载Arcadia框架的宇树G1人形机器人在真实世界零样本测试中,导航和操作任务成功率分别达46%和27%,整体性能较主流开源方案提升约3倍。
另一篇论文《SpatiaLQA》则聚焦于更基础的问题:如何衡量AI对空间的理解?当前的视觉语言模型擅长物体识别和常识问答,但在面对遮挡关系、相对位置约束等空间逻辑问题时能力明显不足。SpatiaLQA基准测试正是为此而生——它系统化定义了空间逻辑推理的评价指标,并提供了一套涵盖多种空间关系的评测数据集,相当于为AI的“空间智商”设立了一场严苛的“高考”。该基准的构建,同样依托于群核科技SpatialLM在空间理解能力上的深厚积累。
从Arcadia让机器人学会“如何持续学习”,到SpatiaLQA回答“如何理解空间”,两篇论文共同指向一个核心判断:空间智能正在成为AI从数字世界迈向物理世界的“关键跳板”。而作为链接数字与物理世界的重要桥梁,群核科技正通过持续的技术深耕,推动AI走进物理世界。
本文来自投稿,不代表科技讯立场,如若转载,请注明出处:https://www.kejixun.co/article/746643.html