今天小編分享的科學經驗:尋找AI大模型時代的存力破壁人:華為的行與思,歡迎閱讀。
提到 AI 基石,人們普遍會想到計算硬體、大模型等,卻容易忽略了一個關鍵的 AI 支柱——存力。
大模型的全周期,都離不開存力與算力的協同保障。比如 Pre-Training 預訓練階段,涉及 EB/PB 級海量數據的處理,頻繁保存與讀取 Checkpoint 檔案,對存儲的帶寬和吞吐量要求很高;Post-Training 後訓練階段,模型精調需要處理個性化數據,存儲系統需應對頻繁的 IO 操作。Inference 推理階段,token 輸出過慢會讓用戶長時間等待、體驗差,而低延遲的實時數據傳輸,依賴于存儲的并發訪問能力。
算力突飛猛進而存力不足,兩者的不協同,在一定程度上制約雲數據中心的效率,也成為當前 AI 雲亟需突破的一大難點。
這時候,迫切需要人才以代碼為利器,為行業解難題。華為軟體精英挑戰賽,正是這樣一個復合型人才的練兵場。
華為軟體精英挑戰賽是華為公司面向全球在校大學生舉辦的大型軟體編程競賽,自 2015 年啟動以來,已經成為全球高校學子展示軟體設計與編程實力、挑戰技術巅峰的頂級舞台。
以 " 普朗克計劃 " 為主題的 2025 第十一屆華為軟體精英挑戰賽,吸引了全球 800 多所高校、超 22000 名選手、超 4200 支隊伍報名參賽。經過八大賽區區網域初賽、區網域復賽等環節的激烈角逐,共有 34 支隊伍、92 名優秀選手成功晉級 4 月 19 日舉辦的全球總決賽。最終,粵港澳賽區來自南方科技大學和香港科技大學的 "Tom and Jerry" 隊一舉奪魁,赢得全球總冠軍,獨攬 20 萬元獎金。
究竟什麼賽題,能激發全球軟體人才的挑戰興趣呢?在大模型技術快速迭代的當下,華為今年賽題抽象自華為雲存儲真實業務難題:選手們需從行業案例中提煉數據分片、緩存預熱、多協定互通等策略,結合算法創新,解決賽題中的存力瓶頸。
通過解題,年輕的參賽者們能直面來自大模型時代的存力挑戰,親歷了從技術瓶頸發現、架構設計到商業應用的完整鏈條。
雲存儲在更新,人才在成長,華為在技術創新與人才培養上持續投入,為大模型強基、固本、培源。所以,從 2025 年華為軟體精英挑戰賽,我們可以更深入地了解,大模型時代的底座、底氣和底蘊。
不少開發者都提過:打完比賽之後,所寫的代碼就沒什麼用了,不能真的用技術為社會發光發熱,這樣的經歷多來幾次,就感覺參加比賽沒什麼意義。讓一場比賽具有意義感,不浪費選手們的時間與期待,賽題必須鮮活,貼近現實,緊密結合行業前沿技術與實際應用,解決產業面臨的真問題。
2025 華為軟挑大賽中,華為雲精心打造的賽題,就源自雲存儲的真實挑戰。
AI 時代正在全業務流重塑對雲存儲的關鍵需求,雲存儲正在成為算力之外的第二生產力,具備海量數據承載能力、高性能存取效率與彈性擴展架構等優勢,成為驅動 AI 訓練效率提升、成本優化及多模态創新的基石。
但存算不協同,可能出現存儲帶寬無法支撐海量小檔案,比如百萬級圖文數據的傳輸,拖慢大模型的開發進程;存儲系統無法及時将數據加載到 GPU,可能導致數千萬元投資的 GPU 集群利用率不足,形成 " 内存牆 " 難題,產生巨額算力浪費。
所以,發展大模型,既需要算力的充沛保障,也要進一步更新存力。
為此,華為雲率先進行了技術突破瓶頸,打造了面向 AI 場景推出的 AI-Native 智算存儲解決方案,以 OBS 作為海量數據底座,提供大規模、高可靠性的數據存儲解決方案,疊加華為雲 SFS Turbo 緩存加速層,可以為 AI 應用提供高效的數據訪問能力。
通過以存助算 / 強算 / 代算 / 補算,華為雲存儲為大模型構築了強大的存力基石,提供了產業的真實實踐。但創新之路永無止境,讓存力最大化,仍有優化空間。
比如說 AI 訓練環節,性能還可以進一步優化。針對海量小檔案高性能、低時延處理以及大模型訓練 CheckPoint 快速存儲與恢復的特殊需求,華為雲在數據湖 OBS 之上,引入了高性能存儲加速緩存層 SFS Turbo,為 AI 訓練集群提供高性能數據讀寫能力,滿足訓練數據加載和故障恢復過程中 CheckPoint 機制的性能要求。然而,由于成本優化的需求,SFS Turbo 中的冷數據會被分級存儲到 OBS 中。
如何實現 OBS 中數據向 SFS Turbo 的快速加載,是雲存儲面臨的重要挑戰,也對加速 AI 訓練效率具有關鍵意義。
誰能來迎接這一前沿挑戰?答案是具有創造力和極強工程能力的軟體人才。
多年以來,華為軟體精英挑戰賽不斷将校園裡的天才構想,帶入賽場,帶入技術世界和產業世界,已成為具有人才培養與產學聯動示範意義的重要賽事。2025 大賽沿用了自 2022 年發起的 " 普朗克計劃 ",華為雲 CTO 張宇昕表示," 華為軟體精英挑戰賽以‘普朗克計劃’為主題,希望越來越多像‘普朗克’一樣的軟體人才站出來,開創新的技術方向,突破新的技術領網域 "。
年輕的軟體人才就在華為的賽場,與雲存儲完成了一場風雲際會。
不少高校老師都反映說,AI 領網域,工業界具備大數據、算力、算法能力等優勢,所以普遍走得比學術界更快。老師們自己還沒搞懂,學校買不到 GPU 算卡,導致當前的人才培養模式,很難滿足 AI 時代的人才需求。于是,一些由企業舉辦的產業賽事便成為人才實操的主要陣地。
而華為軟體精英挑戰賽,更緊密地實現了學術界與工業界的對接。大賽每屆賽題都源于華為探索世界領先技術中遇到的真實業務難題,同時緊密結合行業前沿技術,本屆大賽也不例外。在大模型時代,該比賽與其他產業賽事呈現出明顯的差異:
首先是現實性強。大賽賽題高度還原了真實業務挑戰,讓選手們解答現實難題,而非紙上談兵。比如本屆大賽就聚焦于開發一個存儲服務的控制系統,旨在通過減少硬碟數據碎片化程度,提升系統整體效率,并依據存儲系統的整體性能來評定最終得分。選手們能感受到,存力問題直接關系到大模型效率與成本問題,是當下全社會各行業都關心的,避免純解題過于懸浮、與現實脫節,攻克這類難題能真的推動產業進步,帶給選手們滿滿的成就感。
同時挑戰難度大。本屆大賽的選手們需要根據題目提供的對象标籤、對象大小等信息,将具有相似特征的對象盡可能聚合寫入,降低硬碟上數據的碎片化程度。在讀取時,選手需要合理規劃磁頭的動作,提高系統讀取對象的效率。這一賽題非常考驗選手們的算法設計和工程能力,也讓選手們通過比賽能夠真正得到提升,有所收獲。
本屆大賽還與時俱進,鼓勵各位選手使用包括 DeepSeek 在内的市面上所有的 LLM,将 AI 能力融入參賽作品中,增強作品的深度和創新性,不僅能充分激發選手們的創造性思維,還能讓高校學生不用擔心算力資源限制,上手實戰最新的 AI 大模型,達到以賽促學、以賽促用的效果。
此外,本屆大賽也十分關注華為根技術的生态發展,年輕人才加速湧入,可以增強軟體生态的韌性,應對全球科技博弈的不确定挑戰。
為了讓更多開發者學習和使用華為根技術,華為開發者空間為每位參賽選手準備了一台雲主機、一套開發工具及雲上存儲空間,讓開發者基于華為根生态創新。華為雲為選手提供從工具到生态的全方位支持。
這些都是其他產業賽事很少具備的生态資源,也讓華為軟體精英挑戰賽作為國產軟體生态壯大的一支有生力量,幾乎無可替代。
正是這些特征,讓本屆華為軟體精英挑戰賽,成為年輕人才在大模型時代快速成長起來的絕佳舞台。而選手們以代碼為利器的存力攻堅戰,也為 AI 雲存儲淬煉了一些優秀算法。
在雲存儲與 AI 算力深度融合的大模型時代,華為軟體精英挑戰賽以極具前瞻性的賽題設計,揭示了雲存儲作為數字底座對智能時代的基礎性價值,更通過華為雲在真實場景下的技術攻堅,展現了根技術帶動產業鏈更新的火車頭作用。
為什麼是華為來做這件事?更深一步挖掘原因,會發現在技術創新、人才培養、研發投入,華為做了很多。
技術角度,華為在產業數智化和數智產業化方面,做了大量探索和實踐,可以從自身業務中凝練出更具挑戰性的賽題,讓人才站在巨人肩膀上去探索更前沿的命題,創新領先一步。
人才角度,人才培養是華為一直在做的事情,華為将多年來在 ICT 行業中積累的人才培養标準貢獻出來,聯合教育主管部門、大專院校、教育機構和合作夥伴等各方生态角色,通過建設人才聯盟、融入人才标準等,強化國產化開發生态,同時也通過舉辦產業賽事,全力支持年輕人不設限地發揮創造力。
投入方面,華為毫不吝啬,堅持每年将 10% 以上的銷售收入投入研究與開發,近十年累計投入的研發費用超過人民币 12490 億元,2024 年研發投入達到 1797 億元人民币,約占全年收入的 20.8%。
更務實一點來看,開發者想要參與到 AI 大模型的科創浪潮中,AI 雲服務靈活彈性、按需付費等特點,讓雲平台對開發者的吸引力與日俱增。華為雲重度參與到比賽當中,不僅有助于提高自身的產品競争力,也進一步壯大了華為根生态,成為華為的人才蓄水池,目前已經有超 2000 名軟體精英通過大賽加入華為。
華為雲 CTO 張宇昕在頒獎總結致辭中表示,希望通過大賽找到一群志同道合的人,與華為一起攀登技術高峰,用軟體技術推動科技進步。
這種科技與人才互為表裡的底蘊,是華為引領智能時代變革的核心競争力。
通過一場大賽,為存力強基,為人才固本,為根技術生态培源。年輕人才和元創新,得以源源不斷地生長起來,這正是中國屹立于大模型時代的根源力量。