小米自动驾驶模型Xiaomi OneVL开源：业内率先统一VLA、世界模型路线

2026-05-13 19:01:53 神评论

17173 新闻导语

小米开源Xiaomi OneVL自动驾驶模型，业内首次统一VLA与世界模型技术路线！在多项基准测试中达到SOTA，推理速度提升显著，为车端实时部署提供可行方案。点击了解技术细节与性能突破！

今日，小米正式发布并开源Xiaomi OneVL自动驾驶模型。

该模型在业内率先实现VLA、世界模型、潜空间推理等多个技术路线的统一，在具备XLA模型强悍推理能力的基础上，大幅提升了推理的速度和精度，是行业内具备开创性的方案。

其在精度上超越显式CoT、在速度上对齐“仅答案”预测的潜空间CoT方案。

过去，VLA和世界模型是自动驾驶领域两条相对独立的技术路线：VLA专注于理解场景并输出驾驶动作，世界模型专注于预测未来场景的演变。

XiaomiOneVL通过潜空间推理，首次将两者统一到同一套框架中。

在涵盖感知、推理与规划的多个主流基准上，Xiaomi OneVL全面刷新潜在推理方法的性能上限：

在ROADWork、Impromptu、Alpamayo-R1三项基准上均达到SOTA，并在NAVSIM上取得优越性能，PDM-score达到88.84，首次在潜空间推理中超越显式 CoT（88.29）；

目前唯一在所有基准上超越显式自回归CoT的隐式推理方法；

挂载MLP回归头变体，延迟进一步压到0.24s(4.16 Hz)，仅为VLA自回归推理的5.4%，为量产车端实时部署提供了可行路径。

消融实验进一步验证，压缩物理世界的动态信息能带来显著的性能提升。

同时，Xiaomi OneVL能为模型决策提供语言和视觉双维度的可解释性——既能用文字说明“为什么这样开”，也能用预测画面展示“接下来会发生什么”。

【来源：快科技】

关于Xiaomi OneVL,自动驾驶,VLA,世界模型,潜空间推理,开源,SOTA,CoT,实时部署,可解释性的新闻