黄仁勋诚不欺我!大摩最新报告:英伟达最新AI GPU贵两倍但长远回报更高
大摩报告证实黄仁勋观点:英伟达Blackwell AI GPU虽贵两倍,但计算效率超谷歌TPU/亚马逊Trainium 2-8倍!揭秘下一代Vera Rubin芯片性能领先优势。
投资银行摩根士丹利在最新报告中指出,超大规模数据中心运营商使用英伟达当前的Blackwell AI GPU构建一座1吉瓦规模的数据中心,其建造成本将是使用谷歌TPU或亚马逊Trainium芯片构建同等规模数据中心的两倍。
尽管英伟达Blackwell芯片的数据中心建造成本翻倍,但摩根士丹利认为其计算效率远超定制芯片。
摩根士丹利在报告中将英伟达多款GPU与亚马逊及谷歌的定制ASIC芯片进行了每瓦TFLOPS性能对比。测算结果显示,英伟达芯片的每瓦性能比这些定制ASIC芯片高出2到8倍。
此前,英伟达CEO黄仁勋曾多次公开表示,英伟达芯片虽然价格高昂,但长期来看能为客户带来更高的回报。
在具体每瓦浮点运算性能得分中,英伟达计划推出的下一代Vera Rubin(FP4)架构芯片得分高达19.5,位居榜单第一。英伟达其他芯片Vera Rubin(FP8)得分为6.8,GB300(FP8)得分为6.0,H100(FP8)得分为3.1。
作为对比,谷歌的TPUv7(FP8)得分仅为4.3,亚马逊的Trn3(FP8)得分仅为2.5,两者的定制芯片性能基本介于英伟达Blackwell与上一代Hopper之间,部分指标甚至低于Hopper。
不过评估AI芯片还有其他维度。人工智能基础设施提供商Nebius分析指出,另一大关键标准是每百万Token的生成成本与GPU每小时运行成本的比值。
根据Nebius测算,Groq AI芯片每生成百万Token的成本为5到10美分(约合0.34至0.68元人民币),其生成速度达每秒800个Token。
英伟达Blackwell芯片每生成百万Token的成本则为25美分(约合1.70元人民币),生成速度约为每秒450个Token。

- 1国服重启!《代号:LUNA》「拾光测试」定档5月28日
- 2当所有人扑向手游的风口,它却回头为端游玩家造了一座“慢城”
- 3《七界梦谭》五大离谱设定!这可能是近几年最阴间的游戏了
- 4看了200个华强买瓜视频后,我意识到B站鬼畜区变天了
- 5巴西MMORPG《凡尼亚Online》支持中文,推出新公会系统
- 6点券自由交易真的要来了?《DNF》手游二周年爆料
- 7《剑网3国际版》与《仙剑奇侠传三》合作上线,新资料片同步改版
- 8因为双重氪金,网石新作《权力游戏:国王大道》被喷,官方滑跪退款
- 9150万在线神话再现?《冒险岛》怀旧服爆火背后,藏着怎样的时代执念
- 10不限号不付费!《精灵曙光重制版》启航测试今日正式开启

