今天小編分享的科技經驗:DeepSeek“開源周”收官 ,歡迎閲讀。
ZAKER 科技 2 月 28 日消息,國内 AI 明星公司 DeepSeek 為期五天的 " 開源周 " 今日結束,其于 2 月 24 日正式啓動,計劃開源 5 個代碼庫,旨在與全球開發者社區分享其在通用人工智能(AGI)領網域的研究進展。
在這五天裏,DeepSeek 先後開源了 FlashMLA、DeepEP、DeepGEMM、優化并行策略(DualPipe 和 EPLB)以及面向全數據訪問的推進器 3FS(Fire-Flyer 檔案系統)多個項目。
FlashMLA 是專為英偉達 Hopper GPU 優化的高效 MLA 解碼内核,專為處理可變長度序列設計;DeepEP 是首個用于 MoE(混合專家模型)訓練和推理的開源 EP 通信庫;而 DeepGEMM 則提供支持給 V3/R1 的訓練和推理;DualPipe 是一種用于 V3/R1 訓練中計算與通信重疊的雙向管道并行算法。
這些代碼庫将提供給全球開發者二次開發和改進,并有望促進 AI 技術在更廣泛領網域應用上取得突破。