本文由第三方AI基于17173文章http://news.17173.com/content/04092026/020425304.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
智谱 GLM-5.1“Day0”上线华为云,在昇腾算力上实现 Layer 级 MOE 绝对均衡
2026-04-09 02:04:25
神评论
17173 新闻导语
智谱GLM-5.1全球最强开源模型上线华为云!昇腾算力实现Layer级MOE绝对均衡,推理加速30%,支持一键调用API,开发者不容错过。
感谢网友 Autumn_Dream 的线索投递!
4 月 8 日消息,智谱今天正式发布新一代旗舰模型 GLM-5.1。华为官方宣布,智谱 GLM-5.1“Day0”上线华为云。

据介绍,智谱 GLM-5.1 在昇腾算力上实现了 Layer 级 MOE 绝对均衡,通过框架能力优化让专家均衡产出 Token,同时结合昇腾 Attention 算子特征,通过推理框架和硬件协同的定向优化,提升算力均衡和 HBM 访存均衡能力。华为云通过系统级优化,实现推理加速,整体吞吐提升 30%。
当前,华为云 MaaS 模型即服务平台已为开发者提供免部署、一键调用智谱 GLM-5.1 API 的 Tokens 服务,支持在线体验。企业也可通过华为云魔坊(ModelArts)模型训推平台,一键完成推理服务部署上线,支持公共池和专属池两种资源部署方式,满足独占和非独占算力的使用诉求。
据今日早些时候报道,智谱 GLM-5.1 号称目前全球最强的开源模型。官方表示,其是唯一达到 8 小时级持续工作的开源模型,在最接近真实软件开发的 SWE-bench Pro 基准测试中,GLM-5.1 实现国产模型首次超越 Opus 4.6。

【来源:IT之家】
关于的新闻
- 北大与 DeepSeek 联合开源 DSpark:破解 AI 大模型高并发推理瓶颈,速度提升 60% 至 85% 2026-06-27
- 国产大模型Kimi表态:最高优先是研发 要跟美国御三家AI掰掰手腕 2026-06-26
- 华为与湖北移动完成全国运营商首个 AI 推理加速方案现网测试,长序列 Token 吞吐率提升 372% 2026-06-26
- 网易发布 Confucius4-TTS:业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型,3 秒音频即可克隆音色 2026-06-23
- 8月有望追赶美国最强神话大模型 智谱GLM-5.5将升级万亿参数 2026-06-23
热门测试游戏
- 1《遗忘之海》PC端7月9日公测上线!公测前瞻情报公开
- 2《英雄联盟》官宣怀旧模式,详情于7月12日MSI决赛揭晓
- 3《剑侠情缘:重逢》正式官宣开启预约,虎牙联手西山居打造三端互通
- 4戴炸弹项圈输了就"爆炸"!日本推出《弥留之国的爱丽丝》真人大逃杀游戏
- 5《三体2:黑暗森林》罗辑选角引发全网热议,胡歌演技争议成焦点
- 6《洛奇》22周年新企划,《洛奇永恒》换新引擎,经典场景重制
- 7魔兽故事:暴雪真没活了!魔兽新剧情再玩弑师梗?最强洛阿被一刀秒
- 8《幻兽帕鲁》正式版,27页系统大幅革新,官方建议新开存档
- 9五千万人预约的“新世界”,又把MMO的桌子给掀了
- 10《胜利女神》联动《女神异闻录》,泄露视频紧急下架

