17173 > 游戏资讯 > 科技新闻 > 正文

摩尔线程宣布开源MusaCoder:首个国产全功能GPU全栈训练代码大模型

2026-06-10 17:07:06 神评论
17173 新闻导语

摩尔线程开源MusaCoder,国产全功能GPU全栈训练代码大模型,KernelBench评测超越Claude、DeepSeek,提升GPU算子生成效率,开发者必备!

今日,摩尔线程宣布正式发布并开源MusaCoder,这是面向GPU底层算子生成的专用代码大模型。

摩尔线程表示,MusaCoder是业内首个基于国产GPU算力底座完成全链路训练与验证的开源代码大模型,其完整后训练流程均在基于MTT S5000构建的夸娥智算集群上完成。

据介绍,MusaCoder包含9B和27B两个参数规模,主要面向GPU底层算子生成任务设计,重点支持从PyTorch标准算子自动生成高性能CUDA/MUSA原生Kernel代码。

这一能力可降低开发者手写底层GPU算子的门槛,提升GPU高性能计算场景下的代码生成、验证和优化效率。

性能方面,在KernelBench评测中,MusaCoder-27B-RL取得Overall Pass@8 93.2%、Avg.@8 88.60%的成绩,超越Claude Opus 4.7、DeepSeek-V4 Pro、GLM-5.1、Kimi K2.6等主流SOTA代码模型,达到当前行业领先水平。

摩尔线程称,MusaCoder的SFT(监督微调)、RFT(拒绝采样微调)、RL(强化学习)、异步rollout、在线编译执行验证及reward计算等全栈训练与验证流程,均依托MTT S5000构建的夸娥智算集群完成。

这也意味着,国产GPU不仅能够支撑大模型推理和常规微调任务,也能够稳定承载代码大模型后训练全周期算力需求。

尤其是在GPU Kernel生成这类任务中,训练系统需要频繁进行代码生成、编译、执行、验证和反馈计算,对硬件、编译栈、运行时、调度系统和评测基础设施都提出了更高要求。

MusaCoder训练总流程

【来源:快科技】
关于摩尔线程,MusaCoder,国产GPU,代码大模型,GPU算子,夸娥智算集群,MTT S5000,KernelBench,深度学习,模型训练的新闻
17173不想再闭门造车了!想请您来【QQ群:1075303978】当“骨灰级体验官”。你觉得新版丑、难用、没内味?直接骂,我们听着。新功能你先用、改版方案你投票,有效反馈还能攒积分兑换点卡/周边好礼。 一键入群