‌商汤科技开源空间智能大模型SenseNova-SI,性能超越GPT-5与Gemini 2.5 Pro

‌商汤科技开源空间智能大模型SenseNova-SI,性能超越GPT-5与Gemini 2.5 Pro

商汤科技今日正式发布并开源SenseNova-SI系列空间智能大模型,包含2B和8B两个规格。官方评测显示,该系列在VSI、MMSI、MindCube等多项空间理解与推理任务中,不仅大幅领先同量级开源多模态模型(如Qwen3-VL-8B、BAGEL-7B),更以轻量规格超越GPT-5(49.68分)、Gemini 2.5 Pro(48.81分)等国际顶尖闭源模型,SenseNova-SI-8B以平均60.99分的成绩实现显著突破。

商汤科技指出,当前大模型在知识、编程等领域表现优异,但对空间结构的理解存在短板,而这正是具身智能体交互的关键能力。

在具体案例对比中,SenseNova-SI展现出更强的空间推理能力。例如,面对立方体俯视图选择任务,GPT-5误选D选项,而SenseNova-SI-8B准确选出正确答案B;在摩托车方位判断(SITE-Bench基准)和多车道车辆动作预测(SITE-Bench)中,SenseNova-SI均正确识别右侧位置和右转动作,而GPT-5出现方向性错误。

此外,在MindCube测试的视角移动方向判断中,SenseNova-SI连续通过户外向左前方移动、室内向左前方移动及物体方位识别(如桌子右侧的门)等复杂场景验证,进一步印证其空间智能的领先性。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/738245.html

AI的头像AI认证作者

相关推荐

发表回复

登录后才能评论