今天小編分享的科學經驗:面向AI之海,行業智能化需要一座“運力燈塔”,歡迎閲讀。
在 AI 大模型的加速成熟下,AI 時代正在洶湧而來。我們都知道,數字化基礎設施有存、算、網三大支柱。只有在 AI 算力、AI 存力與 AI 網絡運力的緊密配合下,AI 大模型才能夠得到充分的釋放,煥發自身的價值。
面對動辄 " 萬卡集訓 "" 萬裏部署 "" 萬億參數 " 的 AI 大模型,網絡運力是整個智能化體系中不容忽視的一環。而 AI 時代的網絡将如何發展,對整個業界就像探索一片廣袤未知海洋,廣闊卻又無界,需要一個明亮的燈塔指引整個產業發展方向。
不久之前,國家數據局印發了《數字中國建設 2024 年工作要點清單》,其中重點提出,要加快推動數字基礎設施建設擴容提速,尤其是 AI 技術相關的基礎設施,以及先進網絡基礎設施兩大領網域。而巧合的是,滿足 AI 大模型訓練部署需求的數據通信網絡基礎設施,恰好是兩大領網域的交集,堪稱 " 網絡強國 " 與 " 人工智能 +" 兩大國家級行動的時代交匯點。
從企業層面看,網絡基礎設施是 AI 大模型發展的必要條件。
目前階段,AI 大模型訓練開始從萬卡集群向五萬卡、十萬卡集群更新,比如某歐美知名科技公司,最近已經開始在配備 10 萬張高端 GPU 的 AI 集群上進行模型訓練。而大模型所需的數據訓練,對網絡丢包非常敏感,僅有 0.1% 的微小丢包率也可能導致訓練效率降低 50%。而一旦訓練集群出現網絡故障,往往需要花費大量時間進行網絡故障檢測和修復,極大損失了 AI 項目進度。對于企業來説,強大的網絡能力就是 AI 競争力。
從東數西算的整體國家戰略層面看,運力更新是必不可少的基礎設施。
在東數西算所打造的算力網絡體系中,AI 算力需要跨越萬裏,像水、電一樣源源不絕。算力的萬裏調度,模型的萬裏部署,都離不開廣網域網能力的更新。
可以説,無論從企業還是國家戰略的整體視角來看,符合 AI 時代需求的網絡能力提升,都是當之無愧的 " 運力燈塔 "。
那麼,應該如何建立面向 AI 之海的 " 運力燈塔 "?
想要在大風大浪的海邊,建立一座堅固的燈塔,必須實現兩點:地基要牢,棟梁要穩。
帶着這樣的觀點來思考 AI 網絡,會發現其必須具備兩個先決條件。首先是 AI 技術如何與網絡能力充分融合,讓網絡能力實現飛躍更新。這是一個技術層面橫向打通的問題,我們可以稱之為 " 運力燈塔 " 的地基。其次是如何讓 AI 網絡這種全新的模式真正走向應用,滿足現實產業環境中,數據通聯接多樣化、復雜化的智能需求。這是一個產業層面縱向建立的問題,我們可以稱之為 " 運力燈塔 " 的棟梁。
什麼樣的網絡可以兼顧 " 地基 " 與 " 棟梁 "?我們不妨将目光投射到已然成為近期熱點的" 星河 AI 網絡 "。
(華為數據通信產品線副總裁趙志鵬在星河 AI 網絡媒體溝通會上發表主題演講)
華為星河 AI 網絡之所以受到關注與重視,不僅僅因為他是網絡領網域的絕對領導者華為面向智能時代推出的最新網絡方案,而且是因為它真正解決了 AI 時代先進運力的 " 地基 " 與 " 棟梁 " 問題。
所謂地基,是指星河 AI 網絡充分實現了 " 以智賦網 "。其集成了大量 AI 技術,走向了 L4 高階自動駕駛,可以通過網絡大模型來智能識别語言,實現意圖驅動網絡的運維管理。
具體而言,華為星河 AI 自動駕駛網絡可以從一網一圖一腦三個方面來實現意圖網絡。
首先,一網指的是智能網元。網元作為整個網絡的神經末梢,對業務、流量、應用等全量數據進行毫秒級微觀感知,構築全量數據信息。同時,還可以實現小模型邊緣推理,實時下發決策,提升決策效率,讓網絡的實時化控制成為可能。
一圖作為數字孿生底座,實時獲取網絡信息,形成網絡控制、自動化、智能化的基礎。通過實現網絡多維實時可視及優化仿真,為運維人員提供低成本試錯方案、加快創新迭代,同時疊加體驗閉環優化能力,為提高網絡智能運維水平提供基礎。
一腦,則是指星河 AI 網絡大模型應用 Net master,構建了智能學習,自動決策,智能優化的大腦。真正實現通過自然語言精确理解意圖、識别用户意圖,并完成網絡需求轉化,按需調用 AI agent,将要求下發給數字孿生,協同數字孿生層和智能網元層,共同實現端到端網絡的智能化。
舉個例子,在網絡運維管理層面,用户将告别耗費大量人工成本、時間成本的網絡故障檢測。星河 AI 網絡能夠實現分鍾級給出排障步驟,并進行故障自動閉環,分鍾級解除故障,真正實現分鍾級感知網絡異常,90% 根因定位,5 分鍾實現故障自閉環,從而實現網絡的高度自智。
再從業務創新層面來看,星河 AI 網絡打造了網絡數字地圖 +Net Master 加持的智慧助理。它能夠具備智慧客服功能,通過自然語言互動來實現咨詢類問題的自助化解答,從而實現 88% 咨詢問題由智能客服處理,效率提升達到幾十倍。
另一方面,為了搭建運力的棟梁,星河 AI 網絡對整個產品體系進行了更新,并且圍繞數據中心網絡、廣網域網、園區網絡、網絡安全四大領網域,設計了一系列的產品解決方案。
在 AI 大模型的 " 原產地 " 數據中心當中,星河 AI 網絡面向 AI 大模型訓練過程中的一系列痛點,帶來了更加高效、可靠的網絡能力,以及智能化的運維服務。比如説,星河 AI 網絡利用 NSLB 網絡級負載均衡的算法創新,實現了網絡的均衡調度能力,相比業界在 AllReduce 上提升了 10% 的性能,讓每一點珍貴的 AI 算力都發揮出最大價值。
目前,科大訊飛已經利用星河 AI 網絡,實現了 AI 訓練集群由千卡向萬卡過渡,并且訓練時間縮短 17%。華夏銀行則利用星河 AI 網絡,實現了業務上線效率提升 100 倍,實現快速為客户提供更加多樣性的服務。
在 AI 千裏奔騰的廣網域網絡中,星河 AI 網絡可以實現數據更多、更快、更均衡的調度,全面提升網絡運力。這是因為解決方案中增加了智能算力卡,從而實現了流量行為自學習,AI 智能基線監控,出現業務流量異常時,可以秒級故障感知與上報,大幅降低業務風險。同時,星河 AI 網絡還基于全局的網絡調度算法,确保實現基于最低時延的路徑選擇,滿足 AI 時代數據流調度需求。在中信銀行,星河 AI 網絡将網絡的整體運力提升了 30%。
行業智能化的最後一公裏,必然發生在企業園區當中。能夠實現園區網絡的智能化更新,對于 AI 與行業的結合至關重要。在園區網絡方面,星河 AI 網絡優化了天線技術和算法,在保證同等覆蓋的前提下,實現了信号強度和覆蓋較比業界提高 20%。
在澳門科技大學,應用星河 AI 網絡後,學生、教師以及管理層用户的滿意度普遍得到提升。在京東,星河 AI 網絡滿足了對無線網絡體驗與信号抗幹擾性的要求,幫助京東實現了全無線高效辦公的效果。
AI 意味着探索未知,而未知當中不僅隐藏在新的價值,還隐藏着新的安全風險。面向 AI 時代的網絡安全新挑戰,星河 AI 網絡能夠有效應對大量新型的網絡安全威脅。比如面對未知威脅的檢測,星河 AI 網絡的智慧安全大腦内置了自研引擎,可以利用 AI 的泛化推理進行防護,有效識别未知類型的安全威脅。
在雲南交投,應用了相關方案後,實現了 99% 的威脅檢測率,并且還降低了防護解決方案的綜合成本。
把 AI 與網絡的深度互相結合,築成運力燈塔的地基,把對數據通信網絡各大場景與需求的洞察,變成運力燈塔的棟梁。二者結合之下,星河 AI 網絡這座燈塔開始照射出智能化的光芒,照亮 AI 之海的彼岸。
目前,星河 AI 網絡已服務全球 TOP 100 銀行中的 50+ 個,QS100 大學中的 30+ 個,以及 100 多個國家政務骨幹網、全球 TOP20 大型油田,在全球财富 500 強中客户達到 267 個。它所發出的光芒,已經照亮千行萬業的智能航線。
行業智能化,正在依賴這座 " 運力燈塔 " 加速,駛向 AI 之海的彼岸。