新游热游: 全球国内手游盘点测试表开服表怀旧频道

品牌: 游戏X博士正惊游戏公众号

新闻大全

17173 > 游戏资讯 > 科技新闻 > 正文

DeepSeek V4中文能力测评出炉：重回国内第一！

2026-04-28 09:00:27 神评论

17173 新闻导语

DeepSeek V4中文大模型测评出炉！Pro版70.98分登顶国内第一，Flash版紧随其后。六大维度全面领先，数学推理、智能体能力大幅提升，支持百万级长上下文，成本更低效率更高！

SuperCLUE团队发布DeepSeek V4系列中文大模型测评结果，DeepSeek-V4-Pro凭借综合表现拿下国内第一，Flash版本紧随其后位居第二，国产开源模型再迎突破。

本次测评覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循、幻觉控制六大维度，Pro版本得分70.98分，Flash版本68.82分，两项成绩均大幅领先国内其他模型。

DeepSeek V4系列采用全新注意力机制，全版本支持百万级长上下文，同时降低算力与显存占用，搭配国产芯片使用，整体效率更高。

相比上一代 V3.2，两个版本均实现全面提升。Pro版本智能体能力提升超20分，数学推理提升近10分，指令遵循提升近12分，幻觉控制也有明显优化。

Flash版本在保持高效推理的同时，智能体与数学推理同样大幅提升，性价比突出。

Pro版本（15元/百万Tokens）侧重高性能，幻觉控制更稳，适合复杂任务与专业场景。Flash 版本速度更快、成本更低，API价格仅1.25元每百万Tokens，日常使用更划算。

测评同时指出，模型与海外顶尖模型在代码生成、复杂指令执行等方面仍有差距。整体来看，DeepSeek V4凭借均衡能力与亲民成本，站稳国内第一梯队，成为日常办公、开发创作、长文本处理的优质选择。

【来源：快科技】

关于DeepSeek V4,中文大模型,测评,数学推理,代码生成,智能体任务规划,指令遵循,幻觉控制,国产开源模型,长上下文的新闻

今日热点

我们线下试玩了《古剑》，烛龙这次不“藏拙”了

《古剑》7月18日线下试玩《终末地》云游戏不限量测试

腾讯网易暑期大战！《遗忘之海》VS《怪物猎人》你选？

《魔兽世界》12.1奖励全解析《暗黑4》S14赛季7月1日上线

热门测试游戏

热门新闻排行

Wan网页游戏免费玩