本文由第三方AI基于17173文章http://news.17173.com/content/05252026/120043715.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN
2026-05-25 12:00:43
神评论
17173 新闻导语
面壁智能联合清华开源中国首个华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN,释放6倍显存红利,支持手机端运行,0.5B-8B全系列开源。
5 月 25 日消息,面壁智能联合清华大学、OpenBMB 开源社区,今天正式发布并开源其在低比特大模型训练方向的最新成果 ——BitCPM-CANN。
官方表示,这是中国首个完全基于国产算力平台(华为昇腾)实现端到端训练并开源的三值(1.58-bit)大模型。从量化算子、训练算法到全链路框架,BitCPM-CANN 均在华为昇腾上原生完成,包含 0.5B、1B、3B、8B 四个模型尺寸,与同尺寸 MiniCPM4 全精度家族逐项对照评测,性能表现优异。

相比传统 BF16 精度,BitCPM-CANN 在推理阶段释放约 6 倍显存红利,同时将模型能力保留率维持在 90%–97.2%。

官方表示,对手机产业来说,6 倍的显存红利意味着,一个 8B 参数的 BitCPM-CANN 大模型,可以轻松运行在当前主流旗舰手机之上。
此外,面壁智能基于 MindSpeed × Megatron-LM 主干搭建了完整的低比特训练底座,包含环境适配、32K 长序列支持、并行策略、融合算子等完整工程体系。从此,所有面向昇腾的低比特训练工作,都可建立在同一套公共基础设施之上。
BitCPM-CANN 0.5B / 1B / 3B / 8B 全系列模型权重现已开源,附链接如下:
HuggingFace:https://huggingface.co/collections/openbmb/bitcpm-cann
ModelScope:https://modelscope.cn/collections/OpenBMB/BitCPM-CANN
【来源:IT之家】
热门测试游戏
- 1价值2000元补偿,《洛克王国》主策划道歉!打感情牌还是诚恳反思?
- 230年后重新回归!《遗忘传说》重置版首次开放试玩
- 3开放世界ARPG《龙之剑:觉醒》举办答疑活动
- 4AI外挂不读内存不会被封?腾讯重拳出击:封号10年、永久拉黑
- 5这可能是国产MMO最接近“角色扮演”本源的一次
- 6相爱相杀十年!《贪玩蓝月》和《传奇》迎来世纪和解
- 7《王者荣耀世界》S1赛季来了!新英雄实装,性转功能上线,看点满满
- 89年老网游宣布停更,17万玩家请愿开发续作!呼吁最后更新日登录游戏
- 9原价128元永久畅玩!《暗黑破坏神4》宣布国服免费领延长至8月4日
- 10这款游戏众筹14年,累计筹集超10亿美元,却仍旧处在测试阶段?

