Day-0 支持:摩尔线程完成智谱 GLM-5.2 极速适配
摩尔线程Day-0极速适配智谱GLM-5.2!MTT S5000 GPU原生FP8加速,80GB大显存支持百万token上下文,AI Coding与Agent推理效率飙升,点击了解详情。
6 月 17 日消息,智谱今日宣布上线并开源 GLM-5.2。在全球百万用户参与盲测的前端开发评估系统 Code Arena 上,GLM-5.2 取得全球可用模型第一的表现。摩尔线程今日宣布在 AI 训推一体全功能 GPU 智算卡 MTT S5000 上,完成对智谱新一代开源旗舰模型 GLM-5.2 的 Day-0 极速适配。

据介绍,摩尔线程技术团队基于 SGLang-MUSA 推理引擎及 TileLang-MUSA 算子编程语言,完成了模型结构适配、关键算子优化、框架拉起与部署验证,在 MTT S5000 上实现 GLM-5.2 的高效、高精度推理。摩尔线程还表示,MTT S5000 从硬件算力、软件栈到开源框架进行了全链路适配与深度优化:
支撑超长上下文GLM-5.2 的 Solid 1M 上下文与长程任务能力,使长 Prompt 编码、上下文读入与 KV Cache 生成成为推理链路中的关键环节。长输入请求在进入生成阶段前,需要先完成大规模 Prefill 计算;这一阶段高度依赖并行矩阵计算、Attention 算子效率、显存容量与访存带宽。
MTT S5000 凭借硬件级原生 FP8 加速,单卡稠密算力高达 1000 TFLOPS,配备 80GB 大容量显存与 1.6TB/s 超高带宽,可在长输入 Prefill 阶段集中释放高吞吐优势,为百万 token 级上下文处理提供充足缓存空间和稳定数据吞吐。依托 MUSA C++、Triton-MUSA 与 TileLang-MUSA 等工具链,GLM-5.2 相关算子结构可快速迁移并针对长序列场景持续优化,帮助降低长上下文请求的首 Token 等待时间(TTFT),提升 AI Coding、RAG 和长文档分析等场景的在线推理效率。
赋能前沿 Coding 与 Agent 能力面向 GLM-5.2 重点强化的编程、智能体和长程任务场景,摩尔线程基于 GLM 家族多代模型的适配与优化经验,将模型结构适配、算子优化、框架拉起和部署验证能力快速迁移至 GLM-5.2。通过原生算子定制、TileLang-MUSA 编程优化和 SGLang-MUSA 推理框架协同,MTT S5000 能够在保障模型精度的前提下提升推理吞吐、降低响应延迟,为客户提供面向 AI Coding、Agent 工作流和长文档分析的高效推理服务。
附开源链接如下:
GitHub:https://github.com/zai-org/GLM-5
Hugging Face:https://huggingface.co/zai-org/GLM-5.2
ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.2
- 1对于单机孤狼玩家,腾讯国服《弧光猎人》或许是更合适的选择
- 2《剑星:血雨》新女主伊薇太幼引争议 网友举例韩妹打脸老外
- 3掌控禁忌,役使恶魔!《暗黑破坏神:不朽》全新职业“术士”今日正式上线
- 4NEXON将延续《泡泡堂》IP 承诺其他IP暂无停运计划
- 5《上古世纪归来》公布先驱测试计划 原厂正版授权重启经典端游
- 6《魔域》重大活动今日上线 海量福利共赴守护之约
- 7风靡全球的《宝可梦GO》 把300亿张照片卖给了美国军方
- 8Nexon新作MMO《无冕之烬》免费试玩开启!截止6月22日
- 9《龙之谷》6月17日更新上线:勇者讨伐战第2季单人开战,全新龙玉与周年庆预热同步登场
- 10八年磨一剑!《太吾绘卷:天幕心帷》完整版今日正式上线

