提升7倍 DeepSeek官宣测试全新大模型:或为V4 Lite
DeepSeek官宣测试全新大模型V4 Lite,上下文能力提升7倍至1M!揭秘2000亿参数性能与V3对比,展望1.5万亿满血版V4新技术。
前几天国产AI来了一波爆发,智谱GLM-5、Minimax 2.5及DeepSeek在11日同一天都发布了新的大模型,其中DeepSeek的自然最受关注。
此前我们已经报道过了,这次更新主要是提升了上下文能力,达到了1M,而之前的DeepSee V3系列也就是128K,这方面相对前代V3系列大模型提升了7倍。
今晚DeepSeek也在官方群中正式确认了这一点,表示网页及APP版正在测试新的长文本模型结构,支持1M上下文。
同时DeepSeek还强调API服务还没变,还是V3.2系列大模型,只支持128K上下文。

从DeepSeek的介绍来看,这次的新模型还是文本模型,主要提升就是上下文能力,这个在很多领域也非常重要,长对话时很容易因为上下文不够导致大模型记不住之前的内容了。
虽然网上已经有很多实测显示这次的DeepSeek大模型在编程、输出速度等方面提升也非常大,但相比于此前的期待,这次的更新难免有些失望。
这次的大模型显然不是V4,更可能是V4 Lite,因为参数量据悉只有2000亿,比V3系列的6700亿还少很多,因此部分能力比V3还差也是正常。
猜测这个模型是V4 lite,DeepSeek未来发布的V4大模型也不太可能只有一款,而是有不同版本,每个系列有不同的方向和设计,现在的这个V4 Lite只是探路,因此提升的内容不多,而且DeepSeek官方也没有详细说明其技术架构,一切还有待更多信息释放。
传闻中的DeepSeek V4满血版是1.5万亿参数,比V3系列翻倍还多,还会使用之前DeepSeek研究的Engram、mHC等新技术,性能全面提升的同时成本还低,这个期待值还是很高的。

- 1《梦幻新诛仙:轻享》今日开启测试!盘点6月扎堆测试的游戏
- 2技术、制作、战斗全到位:拳头从暴雪“成建制”招人,LOL MMO还远吗?
- 3王祖贤担任《天下》IP 18周年品牌代言人,多款重磅新内容定档今夏
- 4《王者荣耀世界》 S1赛季正式上线,腾讯还能逆风翻盘吗?
- 5《诡秘之主》玩法是传奇页游?游戏最新实机放出
- 6实机画面首爆!二次元RPG《阿索拉:星之祈愿》公开预告视频
- 7《影之刃零》官宣跳票,《战神》新作公布!索尼State of Play 发布会抢先看
- 8越战题材FPS网游《人间地狱:越南》临近上线宣布跳票至8月13日
- 9暴雪突然想起《星际2》?这款发行16年的RTS迎来大改
- 10仅由两名开发者打造,多人弹幕MMORPG《Runeward Online》曝光

