理想汽车发布下一代自动驾驶基础模型 MindVLA-o1：看得更准、想得更深

2026-03-17 18:04:00 神评论

17173 新闻导语

理想汽车发布MindVLA-o1自动驾驶模型，实现3D空间理解、多模态思考等五大突破，看得更准、想得更深，提升驾驶安全与效率。点击了解技术细节！

3 月 17 日消息，今日，理想汽车基座模型负责人詹锟出席 NVIDIA GTC 2026，发表主题演讲《MindVLA-o1：开启全能范式 —— 下一代统一视觉-语言-动作自动驾驶大模型探索》，发布了理想汽车的下一代自动驾驶基础模型 MindVLA-o1。

据介绍，MindVLA-o1 通过五大技术创新 ——3D 空间理解、多模态思考、统一行为生成、闭环强化学习和软硬件协同设计，构建面向物理世界智能的自动驾驶基础模型。

据了解，该模型的核心突破可以概括为以下五个维度：

看得更准（3D 空间理解）：以前的系统更多是在处理平面图像，而 MindVLA-o1 结合了摄像头和激光雷达，通过 3D 编码器让车能够像人类一样感知物体的深浅、距离和运动状态，真正理解三维物理空间。

想得更深（多模态思考）：它是首个能“脑补”未来的模型。通过隐世界模型，它不仅看现在，还能在隐形空间里提前“预演”未来几秒可能发生的场景，从而做出更有预见性的决策。

行得更稳（统一行为生成）：系统采用 VLA-MoE 架构，专门配备了“动作专家”。它能同时生成所有行驶轨迹点，并通过类似“去噪”的优化过程，确保车开得既丝滑又符合物理规律。

进化更快（闭环强化学习）：理想构建了一个强大的世界模拟器。模型不仅在马路上学，还能在虚拟世界里进行大规模、高效率的自我练习和策略优化，大大降低了训练成本。

部署更高效（软硬件协同）：通过研究模型精度与硬件延迟的平衡，理想将架构设计的时间从几个月缩短到几天，让复杂的大模型能更流畅地跑在车端芯片上。

英伟达 GTC 2026 大会专题

【来源：IT之家】

关于MindVLA-o1,自动驾驶,理想汽车,3D空间理解,多模态思考,统一行为生成,闭环强化学习,软硬件协同设计,基础模型,NVIDIA GTC的新闻