17173 > 游戏资讯 > 科技新闻 > 正文

IBM 推出 Granite 4.0 系列模型:混合架构降低内存需求,Apache 2.0 开源

2025-10-05 09:12:08 神评论
17173 新闻导语

IBM Granite 4.0系列开源LLM模型发布,采用Mamba-Transformer混合架构,内存需求降低70%,性能提升,Apache 2.0许可免费使用。

IBM 当地时间 2 日宣布推出 Granite 4.0 系列企业级 LLM 模型,新一代的模型采用 Mamba-Transformer 混合架构,可在不牺牲性能的前提下大幅降低内存需求,这降低了推理部署的成本。

Granite 4.0 系列模型的首发型号包括 Small、Tiny、Micro 规模的标准和指令变体(规格参见下方列表),未来其它参数规模版本和推理变体则将在 2025 年底推出。

  • Granite-4.0-H-Small:总参数 32B,激活 9B;

  • Granite-4.0-H-Tiny:总参数 7B,激活 1B;

  • Granite-4.0-H-Micro:总参数 3B;

  • Granite-4.0-Micro:采用传统 Transformer 架构,总参数 3B。

IBM 表示混合架构的设计能在长输入和多并发场景下减少 70% 的内存需求。性能方面,即使是最小的 Granite 4.0 模型在基准测试中也明显优于 Granite 3.3 8B,而 Granite-4.0-H-Small 则以较小参数规模取得了开源模型中一流的表现

IBM 以标准 Apache 2.0 许可开源 Granite 4.0 系列模型,这些模型得到了 ISO 42001 认证并经过加密签名。

【来源:IT之家】
关于Granite 4.0,IBM,LLM,Mamba-Transformer,开源,Apache 2.0,内存需求,推理部署,企业级,模型的新闻

你不知道点进去会是什么