本文由第三方AI基于17173文章http://news.17173.com/content/04242026/170244503.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
DeepSeek V4适配国产芯片!摩尔线程MTT S5000实现Day-0支持
2026-04-24 17:02:44
神评论
17173 新闻导语
DeepSeek V4适配国产芯片摩尔线程MTT S5000!支持百万字上下文,FP8优化显存降低50%,吞吐量提升65.7%。立即下载体验!
4月24日消息,今日,DeepSeek正式上线V4预览版并宣布开源,该模型支持百万字超长上下文处理。
摩尔线程联合智源众智FlagOS社区宣布,在旗舰AI训推一体GPU MTT S5000上,完成对DeepSeek-V4-Flash大模型的Day-0极速适配,并实现全量核心算子深度优化与部署支持。

DeepSeek-V4-Flash采用MoE架构,总参数284B、激活参数13B,支持百万Token上下文,首次采用FP4+FP8混合精度,对算力芯片提出更高要求。
摩尔线程MTT S5000是国内率先原生支持FP8的全功能GPU,搭载硬件级FP8 Tensor Core,相比BF16/FP16可将显存压力降低50%,计算吞吐量翻倍。

本次适配由智源FlagOS完成FP8量化,团队聚焦FP8算子与Sparse Attention算子两大关键,通过两大方向实现突破:
一是依托FlagTree编译器做精细化shape对齐与矩阵计算加速;
二是通过FlagOS-Tune自动搜索最优内核配置,效果超越手工调优。实测显示,开启自动调优后TTFT时延降低16.5%,ITL时延降低39.7%,吞吐量提升65.7%。

目前,双方已完成DeepSeek-V4-Flash适配,并正在推进更大规模的DeepSeek-V4-Pro(1.6T)在MTT S5000上的迁移适配。
开发者可在魔塔、HuggingFace下载镜像开箱即用。
【来源:快科技】
热门测试游戏
- 1曝《永恒之塔2》国际服最新预告,端游将于9月正式公测
- 2为了醋包了顿饺子?《古剑》最新曝光实机PV解析
- 3潜行暗杀,质量爆炸!网易新作《归唐》19分钟最新实机曝光
- 4怀旧周报:《英雄联盟》MMO网游蓄势待发?前《魔兽》首席战斗设计师加盟
- 5《剑星》续作《血雨》公开预告视频 跟前作截然不同
- 6《流放之路2》新赛季开荒十大焚诀!剧情就能拿100神圣?
- 7腾讯网易都在争的赛道!这几款高自由度沙盒生存游戏不容错过
- 8《帝国时代》与竞品逆行?反向移植,移动端包围PC端!
- 9《使命召唤》加注搜打撤赛道:DMZ能啃下《逃离塔科夫》的地盘吗?
- 10网游时光机:从150万同时在线,到被玩家骂翻天,剑灵只用了不到两年时间!

