今天小編分享的科技經驗:業界首例,中國聯通 AI 大模型存算分離技術實現突破,歡迎閲讀。
IT 之家 12 月 7 日消息,據中國聯通官方,近日,中國聯通研究院與浙江聯通、聯通服裝制造軍團協同突破瓶頸,針對 AI 敏感數據的本地存儲異地訓練需求提出了創新的業務模式,并成功在杭州與金華兩地間實施了業界首次 30TB 樣本數據的跨 200 公裏存算分離拉遠訓練,經過實際測算,訓練效率高達 97% 以上。
IT 之家從官方介紹獲悉,通過本次測試充分驗證了存算分離技術的安全性、可行性和高效性,為未來 AI 技術的發展提供了新的思路和方向。
存算分離技術是指将存儲數據的倉庫和對數據進行計算的加工廠獨立開來,在訓練時直接将數據從遠端存儲設備中拉過來進行計算,而不需要先存儲到本地的磁盤再進行處理,可以有效保證用户數據的安全性和一致性。
中國聯通稱,海量樣本數據處理過程中存在兩大挑戰:一是數據多存儲于企業端,部分安全性要求較高的數據不便外遷;二是樣本數據量激增,AI 智算中心在具備強大算力的同時,還需額外配備存儲資源,顯著提升了建設成本。在此背景下,業内對實現 " 存算分離拉遠、樣本随訓随拉 " 需求迫切。
▲ 圖源中國聯通公眾号
本次存算拉遠測試驗證的主要特色包括:
第一,以跨地市 AI 大模型訓練能力創新重構智算訓練模式。傳統的智算集中訓練模式,需要用户将樣本上傳到智算中心進行落盤訓練,但是部分用户對隐私樣本落盤存在安全顧慮。浙江聯通通過 IP 廣網域無損方案,實現了杭州存、金華訓的 " 數據不落盤 " 拉遠訓練,以算網協同的能力,為企業用户隐私樣本訓練探索出了一條新路。
第二,樣本數據總量達 30TB,傳輸距離超 200 公裏,計算拉遠效率大于 97%。通過聯通服裝制造軍團 " 衣瞳行業模型 " 的 AI 訓練存算分離現網測試。充分驗證了針對 AI 訓練業務存算拉遠的技術可行性,未來有相關數據敏感業務需求的用户可通過運營商算力服務,完成隐私樣本不出園區的拉遠訓練,實現成本與安全的最佳平衡。