本文由第三方AI基于17173文章http://news.17173.com/content/03172026/220136918.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
王兴兴指出具身智能核心瓶颈 难以适应复杂多变现实场景
2026-03-17 22:01:36
神评论
17173 新闻导语
宇树科技王兴兴揭示具身智能核心瓶颈:泛化能力不足制约机器人适应复杂现实场景。提出三大突破方向,包括视频生成世界模型,解决动作对齐难题,推动机器人通用模型迎来ChatGPT时刻。
据媒体报道,2026亚布力论坛年会于3月17日-19日在黑龙江亚布力举办。宇树科技创始人王兴兴表示指出,具身智能若要迎来类ChatGPT的革命性时刻,仍需攻克多项关键技术难题。
王兴兴认为,当前最核心的瓶颈在于泛化能力不足。机器人在预先训练的场景中可以实现接近100%的任务成功率,但一旦环境发生改变,其性能便会大幅下降,难以适应复杂多变的现实场景。这一问题直接制约着机器人从实验室走向真实应用的能力。
针对这一挑战,他提出了三个突破方向:首先是提升模型的表达能力,增强机器人运动指令与动作的丰富度,为泛化能力筑牢基础;其次是提高数据利用率,由于机器人领域训练数据极度稀缺,必须在有限数据中挖掘更高价值,推动行业普惠发展;第三是强化强化学习的规模效应,进一步释放算法潜力。
在技术路径的选择上,王兴兴明确表示长期看好基于视频生成的世界模型。他解释,这一路径的逻辑与人类行为高度相似:先让AI在“大脑”中想象并生成机器人执行任务的高质量视频,再将生成视频与机器人动作精准对齐,转化为实际执行指令,从而让机器人完成复杂任务。
王兴兴特别提到字节跳动的Seedance 2.0视频生成技术,认为高保真、高可控的视频生成是实现该路径的重要基础。
不过王兴兴也坦言,这一方向目前面临全球共性难题——视频生成内容与机器人实际动作难以精准对齐。这是制约机器人“大脑想象”转化为“现实行动”的关键卡点。
王兴兴相信,一旦该问题得到解决,机器人通用模型将迎来根本性突破,具身智能的“ChatGPT时刻”也将真正到来。

【来源:快科技】
今日热点
热门测试游戏

