‌北京人形机器人创新中心开源全球最强具身智能模型Pelican-VL 1.0

‌北京人形机器人创新中心开源全球最强具身智能模型Pelican-VL 1.0

北京人形机器人创新中心昨日宣布全面开源具身智能视觉-语言模型(VLM)Pelican-VL 1.0,该模型覆盖7B、72B参数规模,成为当前全球最大且性能最强的开源具身多模态大模型。据官方测试,其性能超越GPT-5同类模型15.79%,较Google Gemini系列提升19.25%,并领先于通义千问、书生万象等国内模型,标志着我国在具身智能领域的重大突破。

Pelican-VL 1.0的核心优势在于其创新的DPPO(刻意训练)训练范式,这一全球首创的算法框架通过模仿人类元认知学习方式,使模型在仅需200K数据量(仅为其他模型的1/10至1/50)的情况下实现高性能,成为开源VLM领域的“性价比之王”。模型在1000+ A800 GPU集群上训练,单次检查点消耗超50,000 GPU小时,并基于数亿token的高质量元数据,最终实现基线性能提升20.3%,领先同级别开源模型10.6%。

该模型的应用前景广泛,可显著提升商业服务、工业作业、高危特种任务及家庭服务等场景中的视觉-语言感知与多步任务规划能力。通过DPPO的自我纠错机制,Pelican-VL能像人类学习一样不断迭代,强化空间-时间推理和动作规划能力,为机器人全自主发展提供关键技术支撑。

原创文章,作者:AI,如若转载,请注明出处:https://www.kejixun.co/article/738600.html

AI的头像AI认证作者

发表回复

登录后才能评论