DeepSeek完美收官:开源劳苦功高的3FS!
在不舍与兴奋中,我们迎来了DeepSeek开源周第五天。今天DeepSeek开源的项目是:Fire-Flyer文件系统,即3FS。
据了解,3FS是一个高性能并行文件系统,它是所有Deepseek数据访问的助推器,能应对AI训练和推理工作负载的挑战。
它利用现代SSD和RDMA网络提供共享存储层,能简化分布式应用程序的开发,具有以下主要特性:
1、分离式架构:结合了数千个SSD和数百个存储节点的网络带宽,使应用程序可以不受位置限制地访问存储资源
2、强一致性:实现了链式复制与分配查询(CRAQ)协议,确保数据的强一致性,简化应用程序开发
3、文件接口:提供基于事务性键值存储(如FoundationDB)支持的无状态元数据服务,使用通用的文件接口,无需学习新的存储API
4、多样化工作负载支持
4.1 数据准备:高效组织数据分析管道的输出和管理大量中间结果
4.2 数据加载:支持计算节点间的训练样本随机访问,消除预取或打乱数据集的需求
4.3 检查点保存:支持大规模训练的高吞吐并行检查点保存
4.4 推理KVCache:提供比基于内存缓存更具成本效益的替代方案,同时提供高吞吐量和更大容量
另外,3FS的核心性能指标表现在聚合读取吞吐量上,具体体现就是在由180个存储节点组成的集群中,可实现 6.6 TiB/s 的聚合读取吞吐量。
在基准测试表现中,在25节点集群的 GraySort 基准测试中,吞吐量可达 3.66 TiB/分钟;在单客户端节点的 KVCache 查找峰值吞吐量超过40 GiB/s。
尤其值得一提的是,3FS对于V3和R1中训练数据预处理、数据集加载、嵌入向量搜索和KV Cache查找等工作,都立下了汗马功劳,可谓功高盖主!
网友们表示,3FS和Smallpond为AI数据处理设定了新基准,将改变数据处理的游戏规则。这对于AI演化来说,相当于从自行车升级到了高铁!大家说,3FS牛不牛!
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 3月新游推荐:韩游最重磅的3A《红色沙漠》即将发售!《失落星船:马拉松》能否蹭上搜打撤的热度?
- 一看吓一跳:雷死人不偿命的囧图集(1035)
- 一看吓一跳:雷死人不偿命的囧图集(1036)
- 一看吓一跳:雷死人不偿命的囧图集(1034)
- 正惊GIF:人神共愤!如此漂亮女教师被气到动手,学生竟一脸无所谓
- 热游情报:宝可梦、守望、古印度黑猴新作曝光!首款二次元GTA抢先定档
- 一看吓一跳:雷死人不偿命的囧图集(1033)
- 一看吓一跳:雷死人不偿命的囧图集(1037)
- 颜值COS,玉足、白丝过膝袜,体操服双马尾,简直太迷人
- 《蔚蓝档案》「白丝透肤VS发光腹肌!砂狼白子体操服侧拍,腰线凹陷度堪比3D建模」
- 「体操服の‘液态曲线’!橘望顶配身材|白丝厚D呼之欲出,腰臀比秒杀建模」
- 《燕云十六声》掌中宝+特殊蹊跷位置大全,三寸之身任务合集,仅剩7天10连抽连袅袅之音!
- 经典MMORPG《冒险岛M》上线PC!盘点3月外服端游
- 「纯欲天花板」2B花嫁撕破次元!白丝过膝陷肉感,透粉脚底VS发光蛮腰の双重暴击
- 《传奇5》真的要来了?还有《绝地求生》衍生作上线!盘点2026年能够玩到的韩国游戏
- 《大话西游2》元宵节任务灯谜与字谜答案整理!欢迎补充
- 和平精英2025灵敏度分享码:最稳压枪灵敏度方案推荐
- 3月新游推荐:韩游最重磅的3A《红色沙漠》即将发售!《失落星船:马拉松》能否蹭上搜打撤的热度?
- AI大姐姐:胸猛美女,挑战你的视觉极限(221)




