今天小編分享的科學經驗:DeepSeek第五彈炸裂收官!開源全新并行檔案系統,榨幹磁碟全部帶寬,歡迎閱讀。
DeepSeek 開源周,今日正式收官!
内容依舊驚喜且重磅,直接公開了 V3 和 R1 訓練推理過程中用到的檔案系統。
具體來說,包括以下兩項内容:
Fire-Flyer 檔案系統(簡稱3FS,第三個 F 代表 File),一種利用現代 磁碟 和 RDMA 網絡的全部帶寬的并行檔案系統;
Smallpond,基于 3FS 和 DuckDB 構建的輕量級數據處理框架。
劃重點就是,3FS 可以把固态硬碟的帶寬性能利用到極致,表現出了驚人的速度:
180 節點集群中的聚合讀取吞吐量為 6.6TB/s;
25 節點集群中 GraySort 基準測試的吞吐量為 3.66TB/ 分鍾;
每個客戶端節點的 KVCache 查找峰值吞吐量超過 40GB/s。
V3 和 R1 中訓練數據預處理、數據集加載、嵌入向量搜索和 KV Cache 查找等工作,3FS 都立下了汗馬功勞。
網友們表示,3FS 和 Smallpond 為 AI 數據處理設定了新基準,将改變數據處理的遊戲規則。
對于 AI 來說,這就像從自行車更新到了高鐵。
将 磁碟 和 RDMA 性能榨幹
根據 DeepSeek 團隊介紹,3FS 是一種高性能的分布式檔案系統,面對的就是 AI 訓練和推理工作負載的挑戰。
它利用現代 磁碟 和 RDMA 網絡來提供共享存儲層,從而簡化分布式應用程式的開發。
磁碟 就是固态硬碟,而 RDMA(遠程直接訪問,remote direct memory access)是一種直接存儲器訪問技術。
它可以在沒有雙方作業系統介入的情況下,将數據直接從一台計算機的内存傳輸到另一台計算機,也不需要中央處理器、CPU 緩存或上下文交換參與。
特點就是高通量、低延遲,尤其适合在大規模并行計算機集群中使用。
具體到 3FS,具有以下特點:
分布式架構:結合了數千個 磁碟 的吞吐量和數百個存儲節點的網絡帶寬,使應用程式能夠以不受位置影響的方式訪問存儲資源。
強一致性實現帶:分配查詢的鏈式復制 ( CRAQ ) 以實現強一致性,使應用程式代碼簡單易懂。
檔案接口:檔案接口眾所周知且随處可用,無需學習新的存儲 API。
并且,3FS 能夠适用于大模型訓練推理和過程中不同類型的應用負載:
數據準備:将數據分析 pipeline 的輸出重組成分層目錄結構,并有效管理大量中間輸出。
數據加載器:通過跨計算節點随機訪問訓練樣本,消除了預取或混洗數據集的需要。
Checkpoints:支持大規模訓練的高吞吐量并行 Checkpoints。
用于推理的 KV 緩存:為基于 DRAM 的緩存提供了一種經濟高效的替代方案,可提供高吞吐量和更大的容量。
在大型 3FS 集群上的讀取測試中,實現了驚人的高吞吐量。
該集群由 180 個存儲節點組成,每個存儲節點配備 2 × 200Gbps InfiniBand 網卡和 16 個 14TB NVMe 磁碟。
大約 500+ 個客戶端節點用于讀壓測,每個客戶端節點配置 1x200Gbps InfiniBand 網卡。
在訓練作業的背景流量下,最終聚合讀吞吐達到約 6.6TB/s。
DeepSeek 還用 GraySort 基準測試評估了基于 3FS 構建的 smallpond 框架,該基準測試可測量大規模數據集的排序性能。
測試分為兩個階段,先用鍵的前綴位通過 shuffle 對數據進行分區,然後進行分區内排序。兩個階段既需要從 3FS 讀取,也需要向 3FS 寫入數據。
測試集群包含 25 個存儲節點(2 個 NUMA 網域 / 節點、1 個存儲服務 /NUMA、2 × 400Gbps NIC/ 節點)和 50 個計算節點(2 個 NUMA 網域、192 個物理核心、2.2 TB RAM 和 1 × 200 Gbps NIC/ 節點)。
最終對 8192 個分區中 110.5TB 數據進行排序,耗時 30 分 14 秒,平均吞吐量為 3.66TB/ 分鍾。
另外,KV 緩存客戶端的讀取吞吐量,峰值也達到了 40GB/s。
One More Thing
回顧 DeepSeek 這五天開源的内容,幾乎都和 AI Infra 相關:
第一天,,DeepSeek 獨創 MLA 架構的高性能版本,直接突破 H800 計算上限;
第二天,, 第一個用于 MoE 模型訓練和推理的開源 EP 通信庫,提供高吞吐量和低延遲的 all-to-all GPU 内核;
第三天,,一個通用矩陣乘法庫,僅 300 行代碼,是 V3/R1 訓練推理關鍵秘籍;
第四天,,創新的雙向流水線并行算法 DualPipe、用于 MoE 的負載均衡算法 EPLB,以及訓練和推理框架的性能分析數據;
第五天,3FS 和 Smallpond,高效的分布式檔案系統和以之為基礎的數據處理框架。
并且主打的就是極度壓縮成本,降低消耗的同時将各種硬體的性能全部發揮到極致。
而另外一邊,有網友已經在期待 V4 和 R2 的上線了。
至此,DeepSeek 開源周的連載也要告一段落了,但 DeepSeek 後續動作依然值得持續關注。
感興趣的話,歡迎掃碼備注「DeepSeek- 職業 / 姓名」加入群聊,一起關注 DeepSeek 更多動态!
項目地址:
https://github.com/deepseek-ai/3FS
參考鏈接:
https://x.com/deepseek_ai/status/1895279409185390655