史上最强 AI 基建方案:英伟达发布 Vera Rubin 平台,单 Token 成本降至 1/10
英伟达发布Vera Rubin AI平台,单Token成本降至1/10!新一代NVL72机架效率飙升,推理吞吐量提升10倍,MoE训练仅需1/4 GPU。点击了解史上最强AI基建方案。
3 月 17 日消息,今天(3 月 17 日)在美国加州圣何塞举行的 2026 年 GTC 大会上,英伟达为推动智能体 AI(Agentic AI)发展,发布 Vera Rubin AI 平台。
英伟达创始人兼首席执行官黄仁勋强调,Vera Rubin 是一次代际飞跃,标志着其史上最大规模基础设施建设的开端,全面覆盖从大规模预训练到实时智能体推理的 AI 全生命周期。

在核心算力层面,新一代 NVL72 机架实现了效率的突破性提升。该机架通过 NVLink 6 连接 72 块 Rubin GPU 与 36 块 Vera CPU。

与上一代 Blackwell 平台相比,该系统仅需四分之一的 GPU 即可完成混合专家大模型(MoE)训练,同时每瓦推理吞吐量提升高达 10 倍,单 Token 成本降至十分之一。
此外,专为验证 AI 模型结果设计的 Vera CPU 机架集成了 256 块液冷 CPU,其运行效率达到传统 CPU 的两倍,速度提升 50%。

为应对智能体系统低延迟和长上下文的需求,英伟达推出了 Groq 3 LPX 推理加速机架。该系统包含 256 个 LPU 处理器,与 Vera Rubin 结合后,每兆瓦推理吞吐量飙升至最高 35 倍。


在数据存储方面,全新 BlueField-4 STX 机架构建了 AI 原生存储基础架构。借助全新的 DOCA Memos 框架,该系统能够高效处理大型语言模型生成的海量键值(KV)缓存数据,在大幅降低能耗的同时,将推理吞吐量提升最高 5 倍,从而实现更快速的 AI 多轮交互。

英伟达 GTC 2026 大会专题
- 1《深海迷航2》上线12小时累计销量突破200万份
- 2可永久提升属性!韩国MMO《王权与自由》全新赛季上线
- 3《权力游戏国王大道》能不能搬?如何提升战力?9小时游玩感受!
- 4韩国奇幻背景FPS新作《枪与巨龙》公开实机视频
- 5从扮演007特工到2.5D动作,5月这些新游值得一玩!
- 6暗黑4社区左右互搏:一边用新“不死”Build冲层,一边骂游戏已“坏掉”
- 7亚马逊逼开发者做AI游戏,做完了把所有懂AI的人都开了
- 8暗黑4“树的馈赠”回归,经验、金币、材料三倍速毕业?
- 9好莱坞女星艾丽·范宁穿“碎蛋”高跟鞋引发热议
- 10感谢全国网友支持!央视拿下两届世界杯版权 美加墨费用约4亿:揭秘国际足联服软原因

