17173 > 游戏资讯 > 科技新闻 > 正文

何小鹏掀桌子了!VLA直通终局L4 端到端没机会了

2026-03-03 15:00:59 神评论
17173 新闻导语

何小鹏宣布VLA直通L4自动驾驶,最快1年实现!揭秘小鹏二代VLA如何通过数据驱动、10亿参数每日更新4版,实现99%重刹减少、夜间识别提升96%,挑战端到端技术天花板。2026智能军备竞赛开战!

2026智能军备竞赛,何小鹏打响第一枪——

夸下海口:

“直达终局L4,最快一年实现完全自动驾驶”。

怕你不信,直接给出证据:

“三个月468版,平均一天更新4版”。

这样进化速度下,何小鹏一点情面也不留,直接摊牌:

“L2是缝合怪,端到端已见顶,机会只能在小鹏”。

何小鹏的这番炮火宣言,代表VLA阵营,倾泻到一段式端到端玩家头上。

今年智能化军备竞赛,这是最有希望争夺物理AI门票的两大阵营。

何小鹏信心爆棚的根据到底是什么?

解答这个问题,要从小鹏最新VLA的直观体验、原理框架入手。

小鹏VLA交卷,体验如何?

先快速围观一下何小鹏最新“鹏言鹏语”,包括但不限于立Flag——“最快1年,实现完全自动驾驶”:

火力全开尽情输出——“端到端小模型已经到天花板”:

以及向全行业下战书——“车已到门店,欢迎来试尽管对比”:

4月全量推送,何小鹏说第二代VLA表现不仅远远超越小鹏以往的XNGP,更是遥遥领先行业主流的端到端系统。

定量说,给了具体提升数据,包括减少99%重刹、98%急加速、60%安全接管,并提升124%路面障碍物识别能力,提升118%侧后方车辆识别能力,夜间决策准确性提升96%,避让舒适性还可提升95%……

感知不到?直观定性也有,最基础的高速、城区、窄路、无地图停车场全适配。

而让何小鹏惊呼“这也能开”的,是一系列高度复杂困难,老司机都要格外留心应对的场景。

比如春节期间早期测试用户已经在家乡集市上进行了实测:

异形物多,行人多单车多,还经常有不可预测小朋友到处在跑,且灯光杂乱,二代VLA丝滑穿行。

面对路边乱七八糟的违停场景,VLA能自主“钻缝”通过:

“找路”能力的背后,实际上是模型对场景的识别理解能力,甚至能够理解交警的手势、语言:

交警查酒驾,小鹏VLA很老实地停下来让用户吹气,交警示意“走走走”,又很聪明地及时驶离。

当然,二代VLA的重要进步还体现在安全性上,最具代表性的场景是面对路边突然的鬼探头或开门杀:

还能在夜间识别避让穿黑色衣服的行人,或者各种横穿马路的小动物:

以上种种能力,何小鹏说都是VLA大模型“智能涌现”的结果,从第二代开始,小鹏坚持不依赖任何规则,不在中国写规则,也不在全球任何地方写规则。

这意味着,小鹏二代VLA可以不用当地任何地图数据,不做针对性优化,直接在全球绝大部分道路场景正常通行。

全部数据驱动。

这一点,是何小鹏认为“直通终局L4”,拿到物理AI门票的关键。

10亿参数每天更新4版,怎么做到的?

二代VLA背后的能力,小鹏AI大管家刘先明(最新title是通用智能中心负责人)认为本质就是物理AI基座模型,可以拆解成一个公式:

包括模型、算力、数据,也就是Scaling law的核心要素,还有本体,指芯片、硬件底层。

模型层面,物理AI要解决的第一个问题,就是信号输入输出不同于语言模型,是连续且大量的,几乎很难去逐个分词、拆解。

第二个问题,是物理世界的反馈难以预测,很难直接定义评价体系。

所以不重新设计一套完整的基座模型,解决不了问题。

小鹏的方法是直接打造成一套原生多模态的物理世界的基模。连续性问题,设计了一套原生多模的tokenizer,就是信号的处理单元,能以更高效率、更原始的方式编码所有的信号,并且加入极早期融合去避免单一模态所带来的偏差。

反馈评价问题,小鹏的方法是视觉推理COT,即思维链技术,但是是高度实时的,推理效率相比行业平均“提升了32倍”。

比如跟车慢行场景,所以模型会通过思维链找到几种不同的解决方案,包括向左去激进、变道、折回再去超车等等,每个方案会通过模型评分供系统选择。

算力层面,当然越充足越好,但小鹏在数值之外,更加强调有效算力概念:

举的例子是,只有小鹏自研算法在自研图灵芯片上才能跑到最高有效算力,背后小鹏针对目标场景和应用case设计了专门的底层的硬件架构,还有一整套AI编译器,以及根据芯片和编译器反向定义模型基本结构。

三个东西联合优化,硬件的利用效率从通用芯片加开源模型的22%提升到了现在的85%。

当然还有云端。从去年11月发布二代VLA以来,3个月一共更新468版模型,平均每天接近4版模型,并且这是一个上十亿参数的大模型。

GPU 的硬件利用率提升到现在的90%,核心就是优化整个模型和训练过程当中的容错性、稳定性,还有它的训练的效率,也就硬件利用率,还有数据读取效率。

数据层面,小鹏直接用最近的训练实况证明自己:

整个单次训练高质量数据达到了50PB,是常规大语言模型的20倍左右。

对应第二代VLA整体的Token数量在4万亿左右,与训练的ChatGPT级别的模型规模相当。

模型、算力、数据和芯片,构成小鹏VLA基础能力,类比一下的话,分别对应着人类大脑的基础认知能力、脑容量、正向学习经验,以及实时拆解完成任务的能力。

但这还不够。

数据驱动也有自己的问题,那就是数据分布特征、质量明显影响模型性能,也就是说只有尽量多学习好的和不好的case,才能不断拉高AI司机能力上限。

解决办法一是仿真测试世界模型,小鹏在过去一年中,仿真的里程case的数量从3万个增加到了50万个,官方宣称一天的测试量相当于3,000 万公里的道路实测数据。

其二是强化学习,通过正负反馈的机制,让模型明白什么样的行为策略是可取的,什么样的是应该避免的,解决物理世界反馈难以评价的问题。

一句话总结,二代VLA之所以让何小鹏信心爆棚,底层能力两个,一个是快速迭代能力,一个是模型全流程的自我驱动。

所谓真数据闭环、数据驱动,最核心的其实就是完全的模型化,开发初期就自断规则辅助依赖,后期不留任何走回头路的机会。

一开始的“戒断”很痛苦,需要反复对模型框架、数据质量、参数规模以及软硬件协同摸索优化,但一旦智能涌现,一通百通。

2026两大阵营对决:小鹏已立军令状

之前刘先明给老板立的军令状上了热搜:

8月份追赶不上特斯拉在硅谷的能力,裸奔金门大桥。

怎么样才算追上?这次给出了具体指标:

安全接管里程提升50倍,平均接管里程提升25倍。

也就是说,不算用户不满通行效率和风格的情况,仅仅考虑安全因素,小鹏VLA要实现千公里级别一次的接管率。

对应车端VLA大模型的参数量,从如今的10亿提升到200亿——三图灵芯片量产车,甚至四图灵的Robotaxi车型,就是何小鹏说的直达L4终局。

当然了今年内可能叫准L4更贴切一点。

但破4之前,何小鹏还有一件不得不做的事。

一方面何小鹏高举物理AI大旗,并且笃信Scaling law生效,能从AI司机延伸到通用AI。

另一方面,L2+的量产落地在VLA之外,还有人选择了一段式端到端。

这个阵营的玩家名字也被越来越多人放在一起:华为、地平线、Momenta……

并且从供应商角度出发,未来一段时间内,一段式路线的实际搭载量和路测里程,大概率超过VLA阵营玩家。

毕竟同样是车位到车位的体验,大量老牌车企更愿意选择务实、成本可控的路径。

这可能也是小鹏在自用之外,同样把VLA和图灵芯片外供的原因,第一个吃螃蟹的,是大众:

一段式端到端这条路线,对VLA有巨大的潜在威胁:

数百TOPS+融合感知,如果也能实现千公里级别的接管率,那么花费巨大车端云端成本的VLA,是不是根本没有必要?

甚至局限到To C赛道,根本不需要千公里接管率,几百公里接管一次的水平,就足以解决日常通勤最大痛点,成为影响下单的核心因素。

正因为如此,VLA阵营玩家实际压力更大,与时间赛跑的局面更加紧迫,不但要争分夺秒交付证明自己可以做到,还要从技术逻辑、从商业逻辑上击败对手。

2026注定是VLA、一段式端到端两大阵营的赛跑、对决。

只有率先证明泛化性和安全性共存的一方,才有资格晋级L4,直接挑战Waymo代表的传统自动驾驶阵营,才有底气把物理AI从PPT变成现实。

何小鹏打响了VLA阵营的第一枪,表现出的决绝和自信同样让人吃惊:

公开表态“破釜沉舟”,完全斩断了小鹏走回头路的可能。

到底是“金麟岂是池中物”,还是半场开香槟,今年的路线之争,你更看好哪一方?

【来源:快科技】
关于VLA,L4,端到端,自动驾驶,小鹏,物理AI,图灵芯片,数据驱动,智能涌现,Scaling law的新闻
亲爱的 17173 玩家们~我们正在打磨平台的找游戏功能,想听听你平时是怎么筛选、导航找游戏的?你的真实习惯和偏好,能让后续找游戏更顺手哦!立即点击填写问卷 参与问卷