本文由第三方AI基于17173文章http://news.17173.com/content/07012026/140328290.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
英伟达刷新 DeepSeek V4 推理纪录:单 Token 成本降至 1/5,AI 吞吐量最高提升 20 倍
2026-07-01 14:03:28
神评论
17173 新闻导语
英伟达Blackwell平台优化DeepSeek V4推理:单Token成本暴降至1/5,AI吞吐量飙升20倍,全栈技术助你降本增效!
7 月 1 日消息,英伟达昨日(6 月 30 日)发布博文,宣布在英伟达 Blackwell 平台上,通过优化全栈推理,相比较 DeepSeek V4 模型 1 个月前上线初期,单 Token 成本最多降至五分之一。

注:单 Token 成本(Cost Per Token)指模型生成或处理单个 token 的成本指标,常用于比较不同硬件、软件栈或部署方式的推理成本表现。
英伟达在博文中表示已将单 Token 成本列为 AI 总拥有成本的核心指标,并表示针对 DeepSeek v4 模型,Blackwell 平台已将其降低至行业最低水平。
在技术实现方面,英伟达通过生产运营层、应用加速层、基础设施访问层 3 层来优化推理:
生产运营层负责分布式服务、编排、自动扩缩容和内存管理;
应用加速层负责运行时优化,如计算与通信重叠、内核融合;
基础设施访问层负责调用 GPU、网络、内存与系统能力。

性能方面,英伟达通过分离式服务、大规模专家并行、基于 NVIDIA NVLink 的并行通信、NVFP4 精度以及多 token 预测等技术,叠加优化后,Blackwell 平台单 GPU 的 token 吞吐量最高可提升 20 倍。


【来源:IT之家】
热门测试游戏
- 1终于有新端游MMO了!NEXON出品,尺度大的不可思议
- 2624人、10个亿,快手在西幻MMO里搞了一场诡秘豪赌
- 36月热游情报:米哈游公布全新AI情感伴侣,《GTA6》预售引发全球抢购
- 4《逆水寒》八周年资料片“月刃破晓”即将上线 全新团本“关山止戈·边塞”7月9日登场
- 5《御龙在天》6月30日全服更新:龙渊战场正式开启,全新职业“索命”同步上线
- 6等等党没希望了!多家公司警告内存价格飙升至少持续至2028年
- 7《燕云十六声》要跑路了?官方发文暗示要7月“撤离”!
- 8全新阵营玩法「烽行险道」首曝!《诛仙世界》S4赛季「碧落凡心」7月8日开启
- 9国产游戏《异环》新时装身材缩水,老外质疑被和谐引发论战
- 10《洛奇英雄传》暑期福利开启,三大活动开放,时装强化石免费领取

