17173 > 游戏资讯 > 科技新闻 > 正文

王兴兴指出具身智能核心瓶颈 难以适应复杂多变现实场景

2026-03-17 22:01:36 神评论
17173 新闻导语

宇树科技王兴兴揭示具身智能核心瓶颈:泛化能力不足制约机器人适应复杂现实场景。提出三大突破方向,包括视频生成世界模型,解决动作对齐难题,推动机器人通用模型迎来ChatGPT时刻。

据媒体报道,2026亚布力论坛年会于3月17日-19日在黑龙江亚布力举办。宇树科技创始人王兴兴表示指出,具身智能若要迎来类ChatGPT的革命性时刻,仍需攻克多项关键技术难题。

王兴兴认为,当前最核心的瓶颈在于泛化能力不足。机器人在预先训练的场景中可以实现接近100%的任务成功率,但一旦环境发生改变,其性能便会大幅下降,难以适应复杂多变的现实场景。这一问题直接制约着机器人从实验室走向真实应用的能力。

针对这一挑战,他提出了三个突破方向:首先是提升模型的表达能力,增强机器人运动指令与动作的丰富度,为泛化能力筑牢基础;其次是提高数据利用率,由于机器人领域训练数据极度稀缺,必须在有限数据中挖掘更高价值,推动行业普惠发展;第三是强化强化学习的规模效应,进一步释放算法潜力。

在技术路径的选择上,王兴兴明确表示长期看好基于视频生成的世界模型。他解释,这一路径的逻辑与人类行为高度相似:先让AI在“大脑”中想象并生成机器人执行任务的高质量视频,再将生成视频与机器人动作精准对齐,转化为实际执行指令,从而让机器人完成复杂任务。

王兴兴特别提到字节跳动的Seedance 2.0视频生成技术,认为高保真、高可控的视频生成是实现该路径的重要基础。

不过王兴兴也坦言,这一方向目前面临全球共性难题——视频生成内容与机器人实际动作难以精准对齐。这是制约机器人“大脑想象”转化为“现实行动”的关键卡点。

王兴兴相信,一旦该问题得到解决,机器人通用模型将迎来根本性突破,具身智能的“ChatGPT时刻”也将真正到来。

【来源:快科技】
关于具身智能,机器人,泛化能力,世界模型,视频生成,Seedance 2.0,ChatGPT,字节跳动,宇树科技,王兴兴的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷