本文由第三方AI基于17173文章http://news.17173.com/content/04242026/180156959.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
摩尔线程携手智源 FlagOS,为 MTT S5000 GPU 完成 DeepSeek-V4 模型 Day-0 适配
2026-04-24 18:01:56
神评论
17173 新闻导语
摩尔线程MTT S5000 GPU完成DeepSeek-V4模型Day-0适配!独家FP8精度支持,显存效率翻倍,AI推理性能突破。点击了解国产GPU与大模型前沿技术融合。
感谢网友 菜鸟N号 的线索投递!
4 月 24 日消息,摩尔线程今天携手智源 FlagOS,为旗舰级 AI 训推一体全功能 GPU MTT S5000 完成 DeepSeek-V4-Flash 模型 Day-0 适配。

据介绍,DeepSeek-V4-Flash 模型采用混合专家(MoE)架构,总参数量达 284B,激活参数 13B,支持百万 token(词元)上下文长度。预训练数据超 32Ttoken,在最大推理力度模式(Flash-Max)下推理能力逼近 Pro 版本。
值得注意的是,DeepSeek-V4 模型首次采用了“FP4+FP8”混合精度策略,而国内当前主流 AI 芯片仍普遍以 BF16 为主。摩尔线程凭借原生 FP8 支持能力,可更高效承载 DeepSeek-V4 的前沿精度设计。

同时,MTT S5000 GPU 内置硬件级 FP8 Tensor Core 加速单元,相比传统 BF16/FP16 能将数据位宽直接减半,显存带宽压力降低 50%,理论计算吞吐量实现翻倍。
为充分发挥 MTT S5000 的 FP8 优势,FlagOS 团队为 DeepSeek-V4 模型进行 FP8 量化。通过系统级分析,双方技术团队将本次适配的攻坚重点锁定在 FP8 算子与 Sparse Attention 算子,在“编译优化”与“自动调优”两大方向取得重大突破。

综合此前报道,摩尔线程已多次 Day-0 即时适配国产大模型,涵盖 MiniMax M2.7、智谱 GLM-5 等
【来源:IT之家】
热门测试游戏
- 15月28日正式开测!网易《遗忘之海》最新爆料来袭:是玩法融合的野心,还是“大杂烩”的冒险?
- 2天下十八年,我们想送你一份特别的礼物
- 3看完一百张AI生成的美女图,我感觉人类文明凶多吉少了
- 4袁和平加盟《燕云十六声》任动作总顾问!蓬山、伙伴系统5月29日上线
- 510W+氪度!《燕云十六声》入坑半年!我都氪哪了?
- 6专访《逍遥江湖》老玩家亓哥:江湖十五年,是游戏,也是人生
- 7时隔多年推出新门派,《大话西游2》在520交了一份什么答卷?
- 820年老游戏还在逆生长!《梦幻西游》390万在线后再放大招
- 9《深海迷航2》发售五天销量超400万 创收超1亿美元
- 10《天国:拯救》开发商 Warhorse 官宣新作:《指环王》主题 RPG 游戏

