黄仁勋诚不欺我!大摩最新报告:英伟达最新AI GPU贵两倍但长远回报更高
大摩报告证实黄仁勋观点:英伟达Blackwell AI GPU虽贵两倍,但计算效率超谷歌TPU/亚马逊Trainium 2-8倍!揭秘下一代Vera Rubin芯片性能领先优势。
投资银行摩根士丹利在最新报告中指出,超大规模数据中心运营商使用英伟达当前的Blackwell AI GPU构建一座1吉瓦规模的数据中心,其建造成本将是使用谷歌TPU或亚马逊Trainium芯片构建同等规模数据中心的两倍。
尽管英伟达Blackwell芯片的数据中心建造成本翻倍,但摩根士丹利认为其计算效率远超定制芯片。
摩根士丹利在报告中将英伟达多款GPU与亚马逊及谷歌的定制ASIC芯片进行了每瓦TFLOPS性能对比。测算结果显示,英伟达芯片的每瓦性能比这些定制ASIC芯片高出2到8倍。
此前,英伟达CEO黄仁勋曾多次公开表示,英伟达芯片虽然价格高昂,但长期来看能为客户带来更高的回报。
在具体每瓦浮点运算性能得分中,英伟达计划推出的下一代Vera Rubin(FP4)架构芯片得分高达19.5,位居榜单第一。英伟达其他芯片Vera Rubin(FP8)得分为6.8,GB300(FP8)得分为6.0,H100(FP8)得分为3.1。
作为对比,谷歌的TPUv7(FP8)得分仅为4.3,亚马逊的Trn3(FP8)得分仅为2.5,两者的定制芯片性能基本介于英伟达Blackwell与上一代Hopper之间,部分指标甚至低于Hopper。
不过评估AI芯片还有其他维度。人工智能基础设施提供商Nebius分析指出,另一大关键标准是每百万Token的生成成本与GPU每小时运行成本的比值。
根据Nebius测算,Groq AI芯片每生成百万Token的成本为5到10美分(约合0.34至0.68元人民币),其生成速度达每秒800个Token。
英伟达Blackwell芯片每生成百万Token的成本则为25美分(约合1.70元人民币),生成速度约为每秒450个Token。

- 1《遗忘之海》PC端7月9日公测上线!公测前瞻情报公开
- 2《英雄联盟》官宣怀旧模式,详情于7月12日MSI决赛揭晓
- 3《剑侠情缘:重逢》正式官宣开启预约,虎牙联手西山居打造三端互通
- 4戴炸弹项圈输了就"爆炸"!日本推出《弥留之国的爱丽丝》真人大逃杀游戏
- 5《三体2:黑暗森林》罗辑选角引发全网热议,胡歌演技争议成焦点
- 6《洛奇》22周年新企划,《洛奇永恒》换新引擎,经典场景重制
- 7魔兽故事:暴雪真没活了!魔兽新剧情再玩弑师梗?最强洛阿被一刀秒
- 8《幻兽帕鲁》正式版,27页系统大幅革新,官方建议新开存档
- 9五千万人预约的“新世界”,又把MMO的桌子给掀了
- 10《胜利女神》联动《女神异闻录》,泄露视频紧急下架

