宇树科技王兴兴:具身智能“ChatGPT 时刻”大概还要需两到三年

近日,在2026中国网络媒体论坛上,宇树科技创始人王兴兴的一场主题演讲,将外界对于机器人产业的期待再次推向高潮。围绕“当机器人刷屏”这一主题,这位宇树科技创始人从技术现状与未来拐点两个维度,给出了一个颇具现实感又充满想象空间的判断——具身智能距离真正的爆发节点,或许只差两到三年。

宇树科技王兴兴:具身智能“ChatGPT 时刻”大概还要需两到三年

在他的描述中,当前机器人行业仍未跨过关键门槛。尽管近年来,无论是运动控制、感知系统还是大模型驱动的交互能力,都取得了显著进展,但整体来看,这些能力尚未形成“通用化”的闭环。换句话说,机器人依然更像是“特定场景的工具”,而非真正能够适应复杂环境的“智能体”。

王兴兴进一步提出了一个极具画面感的判断标准,用以定义具身智能的“ChatGPT时刻”。他设想,如果有一天带着一台机器人进入一个完全陌生的会场,它能够在约80%的场景中,仅通过语音或语言指令完成约80%的任务,那么这一刻,便意味着具身智能完成了从“可用”到“好用”的质变。

这一标准的背后,其实隐含着行业最核心的挑战——泛化能力。不同于工业机器人在固定环境中的高精度重复作业,具身智能需要面对的是开放世界的不确定性:复杂空间、多样任务以及人与机器之间更自然的交互方式。也正因此,尽管近年来AI大模型快速迭代,但如何将其真正“装进身体”,依然是行业需要攻克的关键难题。

对于时间表,王兴兴给出了相对审慎的判断。他认为,实现这一关键节点,大约还需要两到三年。不过,他也提到,一位刚从美国硅谷回来的业内人士持更为激进的看法,认为18个月内就有可能迎来拐点。这种时间预期的分歧,恰恰反映出当前技术演进的不确定性——既可能突然突破,也可能在关键环节反复打磨。

值得注意的是,尽管对“ChatGPT时刻”的具体时间存在不同看法,但王兴兴强调,今年或明年,行业一定会迎来一轮显著的技术跃迁。这种判断并非空穴来风。从大模型与机器人控制系统的融合,到多模态感知能力的提升,再到成本与工程化能力的持续优化,多个关键变量正在同步推进,推动具身智能从实验室逐步走向现实世界。

从更宏观的视角来看,机器人行业或许正站在类似于生成式AI爆发前夜的位置。正如ChatGPT在短时间内重塑人机交互范式,具身智能一旦跨过“临界点”,也有望迅速改变服务业、制造业乃至日常生活的运行方式。

可以预见,未来两到三年,将成为决定具身智能能否真正“走出屏幕”的关键窗口期。而当机器人不再只是展示视频中的“炫技主角”,而是能够在陌生环境中稳定完成任务时,这场被称为“ChatGPT时刻”的产业跃迁,或许就真的到来了。

原创文章,作者:李森,如若转载,请注明出处:https://www.kejixun.co/article/748765.html

李森李森管理团队

相关推荐

发表回复

登录后才能评论