本文由第三方AI基于17173文章http://news.17173.com/content/05252026/020454860.shtml提炼总结而成,可能与原文真实意图存在偏差。不代表网站观点和立场。推荐点击链接阅读原文细致比对和校验。
废弃硬件变身AI神器:768GB英特尔傲腾内存成功运行万亿参数大模型!
2026-05-25 02:04:54
神评论
17173 新闻导语
极客用6根二手英特尔傲腾内存,在单GPU工作站成功运行万亿参数Kimi大模型!揭秘768GB内存+RTX 3060的AI神器配置,低成本突破显存瓶颈。
据报道,Reddit用户APFrisco近日通过一套极客方案,利用6根二手英特尔傲腾DCPMM持久内存模块,在单GPU工作站上成功运行了拥有1万亿参数的Kimi K2.5大模型,推理速度约为每秒4个Token。
该系统基于英特尔至强金牌6246处理器与泰安S5630GMRE-CGN主板构建。内存系统总容量为768GB,由6根32GB三星DDR4-2666 ECC内存条与6根128GB英特尔傲腾DCPMM持久内存模块组成。
图形算力由两张华硕GeForce RTX 3060 OC 12GB显卡承担,存储设备采用西部数据WD SN850X 2TB固态硬盘,电源为华擎Steel Legend SL-850G 850W全模组电源。
软件运行层面,该方案采用了基于llama.cpp的GPU与CPU混合推理方法。通过llama.cpp的override-tensor标志,系统将模型路由组件强制分流至总计24GB显存的GPU中处理,其余参数则由傲腾内存承担存储与读取任务,有效规避了单卡显存不足的瓶颈。
英特尔傲腾系列产品虽已停产,但其介于DRAM与固态硬盘之间的读写特性,使其成为替代昂贵内存方案的特殊选择。
业内分析认为,随着CXL计算快速连接标准的成熟,未来市场有望出现更具性价比的字节寻址内存解决方案,以支撑大型语言模型对内存容量的迫切需求。

【来源:快科技】
热门测试游戏
- 1这可能是国产MMO最接近“角色扮演”本源的一次
- 2开放世界ARPG《龙之剑:觉醒》举办答疑活动
- 3《燕云十六声》文津馆玩法曝光:校园社交?能科举还能住宿舍!
- 4AI外挂不读内存不会被封?腾讯重拳出击:封号10年、永久拉黑
- 5《三角洲行动》新限定公布,玩家:又来?我的收藏癖都要治好了
- 6《逆水寒》手游团队签军令状?为设备高温测试前往吐鲁番
- 7《无畏契约》反作弊系统反引玩家担忧,拳头回应:不会损坏硬件
- 8热游情报:《洛克王国世界》S2赛季陷入口碑危机,“停止杀死游戏”启动立法
- 9阿里京东美团被曝同时竞购朴朴超市 20亿到50亿美元到手或只是一张门票
- 10相爱相杀十年!《贪玩蓝月》和《传奇》迎来世纪和解

