17173 > 游戏资讯 > 科技新闻 > 正文

摩尔线程 MTT S5000 适配 FlagOS 训练全要素软件栈,实现 Qwen3-0.6B 端到端无中断训练

2026-03-27 22:01:33 神评论
17173 新闻导语

摩尔线程MTT S5000适配FlagOS,实现Qwen3-0.6B端到端无中断训练,稳定运行6天,性能提升1.65%。探索AI芯片与模型训练新突破!

3 月 27 日消息,摩尔线程今日发文,北京智源人工智能研究院(简称:智源研究院)正式发布重磅验证成果:六款 AI 芯片、三大模型、同构 + 异构千卡 —— 众智 FlagOS 以统一技术栈完成 AI 训练“全要素”验证。

注意到,作为本次验证的核心参与厂商之一,摩尔线程基于旗舰级 AI 训推一体全功能 GPU 智算卡 MTT S5000,完整适配了 FlagOS 训练全要素软件栈 —— 包括 FlagScale 系统调度决策框架、Megatron-LM 分布式训练框架、Transformer Engine 加速库、FlagGems 与 Triton 算子库,以及 FlagCX 通信库。

在此次验证中,MTT S5000 面向 Qwen3-0.6B 语言模型完成了 1T Tokens 从头训练验证,实现连续 6 天以上、超过 14000 步的无中断稳定训练。训练所得模型 Loss 曲线与基线高度一致,平均相对误差控制在 0.82% 以内;在标准下游任务评测中,较行业标杆基线提升 1.65 个百分点,充分验证了全功能 GPU 算力在大模型端到端训练中的稳定性与有效性。

【来源:IT之家】
关于MTT S5000,FlagOS,Qwen3-0.6B,AI训练,摩尔线程,GPU,语言模型,分布式训练,智源研究院,模型验证的新闻
17173 首页全新改版规划中!现向各位玩家征集真实使用意见,你的想法将直接影响新版页面设计~动动手指填写问卷,快来共创你心仪的页面布局吧! 参与问卷