暴降 90%!英伟达 Blackwell 架构将 AI 推理成本压缩至十分之一
英伟达Blackwell架构震撼发布!AI推理成本暴降90%,单位Token生成成本降至十分之一。了解硬件突破如何重塑行业成本与效率,点击查看详情!
2 月 13 日消息,英伟达昨日(2 月 12 日)发布博文,宣布在 AI 推理领域的“token 经济学”(Tokenomics)方面,其 Blackwell 架构取得里程碑式进展。
英伟达在博文中指出,通过推行“极致软硬件协同设计”策略,优化硬件在处理复杂 AI 推理负载时的效率,解决了随着模型参数膨胀带来的算力成本激增问题。数据显示相比上一代 Hopper 架构,Blackwell 平台将单位 Token 生成成本降低至十分之一。

行业落地方面,包括 Baseten、DeepInfra、Fireworks AI 及 Together AI 在内的多家推理服务提供商已开始利用 Blackwell 平台托管开源模型。
援引博文介绍,英伟达指出,通过结合开源前沿智能模型、Blackwell 的硬件优势以及各厂商自研的优化推理栈,这些企业成功实现了跨行业的成本缩减。

例如,专注于多智能体(Multi-agent)工作流的 Sentient Labs 反馈,其成本效率相比 Hopper 时代提升了 25% 至 50%;而游戏领域的 Latitude 等公司也借此实现了更低的延迟和更可靠的响应。

Blackwell 的高效能核心在于其旗舰级系统 GB200 NVL72。该系统采用 72 个芯片互联的配置,并配备了高达 30TB 的高速共享内存。这种设计完美契合了当前主流的“混合专家(MoE)”架构需求,能够将 Token 批次高效地拆分并分散到各个 GPU 上并行处理。

在 Blackwell 大获成功的同时,英伟达已将目光投向下一代代号为“Vera Rubin”的平台。据悉,Rubin 架构计划通过引入针对预填充(Prefill)阶段的 CPX 等专用机制,进一步推高基础设施的效率天花板。
- 1网易520发布会多款新游集体亮相!但《无限大》缺席
- 2《传奇世界无双》6月26日盛大开测!传奇巨星奥尼尔化身"传世大鲨坦"加盟!
- 3游戏直接崩了!《暗黑4》玩家利用机制刷出2401只哥布林
- 4MMO网游破局之作?《七界梦谭》二测爆肝近百小时带来全新理解
- 5诛仙体验服上线!官方直播带你体验暴力法师——炼血!
- 6《天龙八部·归来》×国产神话3A 5月29日一战封神!
- 7前《妮姬》主美新作女角色太大了!大的看不到未来
- 8《冒险岛》怀旧服“归岛测试”今日开启!时光正好,一键登岛!
- 9“内定”+“空降”?《守望先锋》十周年活动,一手好牌打的稀烂
- 10网游时光机:叫板魔兽、硬刚主流MMO,这款“不合群”的网游,最终活成一股清流

