英伟达 GB300 NVL72 刷新 MLPerf 纪录:10 分钟训完 4050 亿 AI 参数模型
英伟达GB300 NVL72刷新MLPerf纪录:10分钟训完4050亿AI参数模型,性能达H100的4倍以上,软硬件协同创新突破。
科技媒体 Wccftech 昨日(11 月 12 日)发布博文,报道称在 MLPerf AI 训练基准测试中,英伟达基于 Blackwell Ultra 架构的 GB300 NVL72 平台包揽了全部 7 个项目的冠军,取得了压倒性胜利。

援引博文介绍,本次测试中最亮眼的成绩是,GB300 NVL72 平台仅用时 10 分钟,便完成训练拥有 4050 亿参数的 Llama 3.1 大模型。
此外,在其他关键测试中也表现出色,例如仅需 0.4 分钟即可完成 Llama 2 70B 模型的 LoRA 微调,训练 Llama 3.1 8B 模型也只需 5.2 分钟。

与上一代产品相比,Blackwell Ultra 的性能实现了巨大飞跃。测试结果显示,在 Llama 2 70B 微调任务中,8 块 GB300 GPU 提供的性能是同等数量 H100 GPU 的 5 倍。

而在 Llama 3.1 405B 预训练任务中,GB300 的性能也达到了 H100 的 4 倍以上,并且比同为 Blackwell 架构的 GB200 快了近 2 倍。

该媒体指出这一性能突破的背后,是软硬件协同创新的结果。硬件方面,GB300 NVL72 系统集成了速率高达 800 GB/s 的 Quantum-X800 InfiniBand 高速网络,并为每块 GPU 配备了 279GB 的 HBM3e 高带宽内存,整个系统的总内存容量(GPU+CPU)更是达到了惊人的 40TB。
在软件层面,FP4 精度的全面采用是关键。英伟达通过在模型训练的每一层都应用 FP4 精度,将计算速度提升至 FP8 的两倍,而 Blackwell Ultra 架构则将这一优势进一步放大至 3 倍。

- 1《遗忘之海》PC端7月9日公测上线!公测前瞻情报公开
- 2《英雄联盟》官宣怀旧模式,详情于7月12日MSI决赛揭晓
- 3《剑侠情缘:重逢》正式官宣开启预约,虎牙联手西山居打造三端互通
- 4戴炸弹项圈输了就"爆炸"!日本推出《弥留之国的爱丽丝》真人大逃杀游戏
- 5《三体2:黑暗森林》罗辑选角引发全网热议,胡歌演技争议成焦点
- 6《洛奇》22周年新企划,《洛奇永恒》换新引擎,经典场景重制
- 7魔兽故事:暴雪真没活了!魔兽新剧情再玩弑师梗?最强洛阿被一刀秒
- 8《幻兽帕鲁》正式版,27页系统大幅革新,官方建议新开存档
- 9五千万人预约的“新世界”,又把MMO的桌子给掀了
- 10《胜利女神》联动《女神异闻录》,泄露视频紧急下架

