17173 > 游戏资讯 > 科技新闻 > 正文

7月上线!DeepSeek V4正式版官宣:将引入峰谷定价机制

2026-06-29 19:00:56 神评论
17173 新闻导语

DeepSeek V4正式版7月中旬上线!引入峰谷定价机制,高峰时段API价格翻倍;V4-Flash每百万token仅2元,支持百万token超长上下文,性能碾压前代。抢先了解低价时段与新技术!

DeepSeek团队今日官宣,DeepSeek V4正式版计划于7月中旬正式上线,新版本将带来更多功能优化与性能提升。

与此同时,为了更合理地分配算力资源、提升服务稳定性,DeepSeek宣布正式版上线后将同步调整API定价策略,引入"峰谷定价"机制。

根据官方价格表,API在高峰时段的价格将是平时的2倍,每天的高峰时段定为上午9点至12点、下午2点至6点,其余时间均按平时价格计费,与现行的DeepSeek V4 API定价保持一致。

以高峰期时段为例,V4-Flash的API定价输入每百万token仅2元(缓存命中低至0.02元),输出每百万token为4元,V4-Pro受算力成本影响价格相对偏高,输入每百万token为6元(缓存命中1元),输出每百万token为12元。

据此前报道,DeepSeek V4预览版已于今年4月24日上线并同步开源,主打百万字超长上下文,在Agent能力、世界知识与推理性能等方面均达到国内及开源领域的领先水平。

按照模型规模,V4分为两个版本,均采用MoE混合专家架构,其中旗舰版V4-Pro总参数达1.6万亿、激活参数490亿,定位高性能,适合处理复杂任务。

轻量版V4-Flash总参数2840亿、激活参数130亿,推理开销与显存占用大幅降低,主打快捷、经济,响应更快、成本更低。

两个版本均原生支持100万token的超长上下文,并采用MIT开源协议,开发者可免费商用与二次开发。

技术层面,V4系列最大的亮点在于全新的注意力机制,它在token维度进行压缩,并结合DSA稀疏注意力方案,大幅削减了计算与显存开销。

因此V4在百万token场景下的推理计算量仅为前代V3.2的约27%,显存占用更是低至10%,长上下文处理效率显著提升,同时也更好地支撑了Agent与代码生成场景。

官方此前表示,待下半年昇腾950批量上市后,Pro版本价格还将进一步大幅下调,目前DeepSeek V4预览版可通过官网、App、API及本地部署等多种方式使用。

【来源:快科技】
关于DeepSeek V4,峰谷定价,API定价,MoE,长上下文,注意力机制,开源,V4-Pro,V4-Flash,算力成本的新闻
17173不想再闭门造车了!想请您来【QQ群:1075303978】当“骨灰级体验官”。你觉得新版丑、难用、没内味?直接骂,我们听着。新功能你先用、改版方案你投票,有效反馈还能攒积分兑换点卡/周边好礼。 一键入群