本文由第三方AI基于17173文章http://news.17173.com/content/05032026/140524458.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
一图看懂DeepSeek V4与美国顶级AI差距:落后8个月
2026-05-03 14:05:24
神评论
17173 新闻导语
DeepSeek V4与美国顶级AI差距曝光:落后8个月但性价比超群!权威机构NIST评估显示中国最强AI大模型在多项测试表现优异,成本优势高达53%。
4月24日DeepSeek V4系列大模型正式发布,距离去年的DeepSeek R1更新过去了15个月了,V4的性能到底如何也引发了国内外的讨论,美国人也非常关心。
评估DeepSeek V4的能力已经有很多测试了,美国外交关系委员会组织了3个高级研究员之前的研究报告显示其落后美国顶级大模型大约7个月。
现在美国国家标准与技术研究院(NIST)下属人工智能标准与创新中心(CAISI)也来评估DeepSeek V4,他们的结论是DeepSeek V4落后美国大约8个月,跟前面的差距差不多。

在他们的AI能力评估结果中,DeepSeek V4得分在800分,而当前最强的是GPT-5.5,分数超过1200分,GPT-5.4及Opus 4.6也在1000分以上。
DeepSeek V4整体性能跟8个月前的GPT-5差不多,但DeepSeek官方之前在发布报告中认为跟GPT-5.4差不多。
不过CAISI也承认DeepSeek V4是他们评测过的中国最强AI大模型,在网络、软件工程、自然科学、抽象推理和数学这五个领域中九项测试都很强。

更重要的是,DeepSeek V4的性价比更强,即便与美国最有成本优势的GPT-5.4 mini大模型相比,DeepSeek V4在7个基准测试中有4个测试成本更优,高出41%到53%不等。


【来源:快科技】
今日热点
热门测试游戏
- 1完美世界:《异环》全球首日流水超 1 亿元,核心指标优于《幻塔》同期水平
- 2次世代MMO端游《上古世纪2》首测来了,还有另一款续作曝光
- 3正惊GIF:别硬撑了!绝佳身材美女一只轻抚长腿,不舒服就去休息吧
- 4《少女前线:蓝蝶契约》及《逆向坍塌:F》两款新作首曝
- 5《007》新作口碑爆了!年度最佳有力竞争者
- 6《Diablo 4》Lord of Hatred DLC 结局解析——接下来会发生什么?
- 7网游圈换了一茬又一茬,唯有这个“异类”,却是越老越能打!
- 8怀旧周报:好评如潮?《暗黑破坏神4》新DLC逆袭,《龙之谷》怀旧服70级曝光
- 9绅士日报:视觉盛宴!肉装美女带球撞人,尺度太大看得人鼻血横流
- 10这次二游终于开始「好好说话」了

