本文由第三方AI基于17173文章http://news.17173.com/content/10052025/091208482.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源
2025-10-05 09:12:08
神评论
17173 新闻导语
IBM Granite 4.0系列开源LLM模型发布,采用Mamba-Transformer混合架构,内存需求降低70%,性能提升,Apache 2.0许可免费使用。
IBM 当地时间 2 日宣布推出 Granite 4.0 系列企业级 LLM 模型,新一代的模型采用 Mamba-Transformer 混合架构,可在不牺牲性能的前提下大幅降低内存需求,这降低了推理部署的成本。
Granite 4.0 系列模型的首发型号包括 Small、Tiny、Micro 规模的标准和指令变体(规格参见下方列表),未来其它参数规模版本和推理变体则将在 2025 年底推出。
Granite-4.0-H-Small:总参数 32B,激活 9B;
Granite-4.0-H-Tiny:总参数 7B,激活 1B;
Granite-4.0-H-Micro:总参数 3B;
Granite-4.0-Micro:采用传统 Transformer 架构,总参数 3B。
IBM 表示混合架构的设计能在长输入和多并发场景下减少 70% 的内存需求。性能方面,即使是最小的 Granite 4.0 模型在基准测试中也明显优于 Granite 3.3 8B,而 Granite-4.0-H-Small 则以较小参数规模取得了开源模型中一流的表现。
IBM 以标准 Apache 2.0 许可开源 Granite 4.0 系列模型,这些模型得到了 ISO 42001 认证并经过加密签名。
【来源:IT之家】
热门测试游戏
- 1我的世界:传奇世界概念图揭示2027年将推出全新主题公园
- 2破460万份!《杀戮尖塔2》用数据说话:反响极佳
- 3日媒:2025 年中国车企首次登上全球汽车总销量榜首,终结日本“25 年连霸”
- 4告别上班式打卡、不用再熬夜搞副本!这款武侠游戏太懂成年人了!
- 5《红色沙漠》开发商承诺发布补丁改善操作体验,为糟糕的键鼠支持致歉
- 6自由更换主职业!韩国MMO《天堂2》22周年庆开启
- 7全程高能!五款近期热门美女恋爱影游带你解锁沉浸式互动新体验
- 8护甲重做!欧美MMO《万神殿:堕落者的崛起》曝重大调整
- 9本月公测网游推荐!多个韩国MMO开服爆火,经典IP焕发新生
- 10完全免费,爷青回!《CS1.6》页游版正式发布




