本文由第三方AI基于17173文章http://news.17173.com/content/03172026/200631169.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
3TB 主内存 + 8TB CXL 内存:Penguin 推出 KV Cache 服务器
2026-03-17 20:06:31
神评论
17173 新闻导语
Penguin推出业界首款CXL KV Cache服务器,集成3TB主内存+8TB CXL内存,为AI推理提供11TB海量内存,显著降低延迟并提升吞吐量,专为金融分析、RAG等企业级任务优化。
3 月 17 日消息,Penguin Solutions 当地时间本月 16 日宣布推出业界首款采用 CXL 技术的量产型 KV Cache 服务器。其综合了 3TB 的 DDR5 系统主内存和 8 个 1TB 的 CXL 内存 AIC 模块,可为 AI 推理负载提供合计 11TB 的海量内存空间。

注意到,Penguin 表示 AI 推理通常而言 30% 依赖于算力而 70% 依赖于内存,这是此类工作负载与模型训练 / 调优最大的不同。同时,延迟表现也很大程度上影响了推理场景的用户使用体验。
Penguin Solutions 此次推出的 MemoryAI KV Cache 服务器可为 AI 推理系统带来更低的延迟、更短的首 Token 响应时间、更高的吞吐量、更高的 XPU 集群利用效率,持续满足严苛的服务水平一致性要求,尤其适合实时金融分析、海量数据集 RAG、监管合规性分析等需求大窗口和低延迟的企业级任务。
英伟达 GTC 2026 大会专题
【来源:IT之家】
今日热点
热门测试游戏
- 1网游时光机:惊艳时代的无锁定神作,国服代理费4000万美元,不到两年就凉了!
- 2当游戏不再“算计”玩家,一款老游如何用“确定性”留住4000万用户
- 3可爱大雷妹!《第七史诗》新增自然英雄“埃斯特尔”
- 4《三国群英传:格斗版》二测开启,最新实机视频曝光
- 5魔兽世界怀旧服国服提前上线后续阶段追赶机制,团本难度骤然降低,装等最高可+14
- 6AI生成《黑神话:潘金莲》美图 性感风骚的美人
- 7“五一不出门!”5款真人美女互动影游,带你玩转全球!
- 8《黑色沙漠》开发商出售《EVE Online》开发商
- 9开放世界动作RPG《龙之剑:觉醒》公开主角全新设计
- 10《天国:拯救2》开发商坚称从未打算用AI取代人工

