今天小編分享的科學經驗:為智算“強心”,為園區“壯體”:新質互聯網駛入标準化快車道,歡迎閲讀。
" 數字中國 " 的宏大藍圖,是靠一個個行業的數字化和智能化編織起來的。很多企業在業務場景中推進技術更新時,總會發現事情沒那麼簡單,算力賣得貴、網絡更新難、數據傳不動、應用進不來……數智化之夢就此擱淺。
數智化更新,高度依賴于一張先進網絡的聯接力。為了滿足產業需求,近年來,數據通信領網域以 " 新質互聯網(Net5.5G)" 作為下一代互聯網的代際和路徑。但有方向還不夠,為了更好地指引新質互聯網的實踐落地,加速產業凝心聚力,還需要一個關鍵環節——标準。
我們知道,标準化工作在網絡建設中至關重要,可以讓不同廠商以同一套指标和語言來研發產品、聚焦創新,确保了網絡性能的一致性。比如無線通信 4G/5G 标準的凍結,就極大地加速了網絡建設進程。那麼數據中心、園區等場景什麼時候才能建立起一套自己的标準,推動網絡更新呢?
最近,我們就看到了新質互聯網在智算數據中心、園區等領網域的标準化曙光。
前不久,由全球固定網絡創新聯盟(Network Innovation and Development Alliance,以下簡稱 NIDA)主辦,中國通信學會算力網絡專業委員會、全球 IPv6 論壇協辦,共熵產業與标準創新服務中心承辦的第二屆網絡創新發展會議上,NIDA 攜手多家產業夥伴共同發布了《高品質萬兆園區網絡技術發展研究報告》和《智算數據中心網絡建設技術要求》兩個關鍵建網标準,為建設下一代互聯網提供指導,推動行業标準的出台。
今天我們就來聊聊,兩個建網标準是如何讓數通領網域凝心聚力,為產業智能化強心壯體。
數據中心、園區的新質互聯網建設,為什麼重要?試想一下,大模型、雲計算、AIoT、物聯網、XR 等新技術,從高大上的科研實驗室和廠商發布會,到真正被各行各業用起來,要經過哪些網絡的關隘?
首先,AI、雲服務、自動駕駛等都需要龐大的算力資源,而盤踞在全國大大小小的數據中心,是算力的心髒,成千上萬張算卡想要泵出更多的算力資源,集群内部的卡間互聯就需要網絡更新,有時一個大模型得好幾個千卡集群一起并行訓練,那麼集群跟集群之間的網絡也得重構。
接下來,泵送出來的算力經過廣網域網傳輸到業務場景,而距離企業最近的園區網絡也要同步更新。而數據中心、園區的網絡更新,由不同行業主體來主導,更新進度不平均、行業認識不統一,簡直太正常了,這就讓企業在引入數智化技術時阻礙重重。
支撐產業智能化,讓企業在智能時代變得更快更強,需要更強大的算力心髒和園區網絡。
但更新網絡,卻面臨标準不統一、概念争議大、方案繁多等局面。标準缺失,給數據通信領網域和產業智能化更新都帶來了副作用:
1. 共識缺失。不同 ICT 廠商會采用各自的解決方案,分開探索,各自試錯,機會成本和時間成本都很高,造成產業進展緩慢。
2. 體驗不佳。不同方案中的定義不同、概念不同、架構不同,導致產品體系互不兼容,影響落地效果,甚至降低了客户對智算、AI 新技術的熱情。
3. 資源浪費。廠商各自為戰,產業鏈上下遊缺乏協作,會導致大量研發資源浪費,力不往一處使,不利于國内 AI 的長遠發展。
綜合這些因素,只有建網标準得以确立,才能最大程度地凝聚數據通信產業共識,為產業智能化鋪設一條快車道。
NIDA 組織将產學研多種力量整合起來,終于在前不久,帶來了數據中心網絡和園區網絡的兩大标準。
智算數據中心是智能世界的算力中樞,正走向超萬卡集群。有報道顯示,xAI 已經完成了十萬張 GPU 卡集群的搭建,未來還計劃将規模翻倍,Meta 也宣布計劃購買 35 萬張 N 卡用于集群建設。
但十萬卡乃至三十萬卡、五十萬卡的集群,不是簡單的算卡堆疊,而要讓數萬張卡像一台 " 超級計算機 " 一樣高效運轉,卡間互聯、集群間互聯,都需要一張高性能網絡,作為基礎性支撐。
這張網絡應該如何組建?此次發布的《智算數據中心網絡建設技術要求》建網标準中,對多種組網架構進行了闡釋。
一是三層 CLOS 架構,也是目前主流的智算網絡架構,對比兩層 CLOS 架構由于增加了 Core 層交換機,需要更多的光模塊,時延與建設成本并非最優,能耗也相對較高。
二是 Groupwise Dragonfly+ 架構,報告中提到的 Groupwise Dragonfly+ 直連架構,可支撐十萬卡以上集群組網,兼顧了組網規模與功耗成本控制。
三層 CLOS 架構都比較熟悉了,那什麼是 Groupwise Dragonfly+ 架構呢?具體來説,就是在兩層 CLOS 架構的基礎上,将 POD 間的 Spine 層互聯,實現了架構的扁平化。
一來,對比兩層 CLOS 架構,可大幅提高組網規模,支撐未來超十萬卡集群的 AI 智算數據中心網絡建設。
二來,對比三層 CLOS 架構,可以在同等集群規模下,大幅減少設備數量和光模塊數量,降低成本和功耗開銷。以 128K 卡的集群為例,同樣使用 128 個 400GE 端口的交換機組網,使用 Groupwise Dragonfly+ 架構比三層 CLOS 架構需要的設備減少了 1024 台,網絡整體能耗降低 20%+。
第三,對比傳統 Dragonfly + 架構,Groupwise Dragonfly+ 架構可避免跨組流量在其他組内設備上下繞行,簡化路由復雜度并提高了系統效率。
未來,《報告》中提到的多種組網架構都有望在智算數據中心落地。十萬卡以上的數據中心網絡建設不僅可以采用三層 CLOS 架構,Groupwise Dragonfly+ 也将是一種新的選擇。
随着《報告》的發布,超十萬卡集群的建網标準也将加速形成共識,推動行業标準的正式出台,加速國内超大規模智算數據中心的建設,真正實現以網強算。
以建網标準化加速智算產業化,讓 " 算力心髒 " 泵出高算力,為產業智能化注入澎湃動力。
如果説數據中心網絡連接的是 " 算力心髒 ",那麼園區網絡則聯接着人、終端和應用,是園區的 " 神經中樞 ",确保園區業務的良好運轉,也是我們日常接觸最頻繁、依賴度最高的網絡層級。
《高品質萬兆園區網絡技術發展研究報告》中指出," 園區覆蓋了絕大部分工作生產場景,80% 以上的 GDP 和 90% 以上的創新在園區内產生 "。所以,產業數智化必須依賴于園區數智化,而園區數智化,網絡更新有着獨一無二的戰略地位。随着 AI、雲服務、遠程移動辦公、高清 XR 等新業務的興起,園區網絡要不斷容納數量更多、數據傳輸量更大、數據結構更復雜的數智應用,正從千兆向萬兆演進。
萬兆園區網絡應該怎麼建?此次寬帶發展聯盟、NIDA、WAA 共同發布《高品質萬兆園區網絡技術發展研究報告》,帶來詳細的技術要求。
具體來説,高品質萬兆園區建網方案應具備萬兆超寬、确定可靠、體驗保障、智能運維、安全防護、綠色低碳六大能力。這些指标聽起來有點繁多,其實只需記住一個特點,新質互聯網代際的園區網絡,與傳統園區網絡的最大區别就是,從 " 以聯接為中心 " 轉變為 " 以體驗為中心 "。
下一代園區網絡不僅關注建得成、連得上,還要連得好,讓用户感受到切切實實的體驗更新。而從用户體驗的視角來看,萬兆園區網絡的以下特點十分關鍵:
一是更大的帶寬。園區用户想要随時随地獲取資訊,業務上雲用數賦智需要大量數據的實時傳輸,移動辦公更加流暢的高清視頻會議,絲滑可靠的自動駕駛 AGV 小車、AIoT 設備等,都需要一張性能強大的無線網絡。
二是更強的體驗保障。報告提到,為了提升業務和用户體驗,需要支持應用可視、應用保障、應用質量檢測、定位,以及 VIP 體驗保障優先能力。此次會議中,來自北京協和醫院信息中心副主任朱雯也帶來了行業的聲音,她説:" 醫療行業提供 7 × 24 小時不間斷服務,醫院的各個業務基于信息系統和網絡運行,特别重要的一點是保證極高的可靠性 "。可以説,一張醫療園區的新質互聯網,可以給患者、醫護人員需要的關鍵網絡服務提供确定性保障。
三是更強的安全防護能力。遠程辦公、業務雲化、海量無線終端接入,這些變化都讓園區網絡的物理邊界逐漸消失,而設備的安全防護能力參差不齊。對此,在新質互聯網主導的下一代網絡代際中,園區網絡将采用了包括 MACsec 安全認證、基于零信任理念的安全防護體系、出口安全防護技術,以及網絡切片在内的多種先進技術,提升整體安全防護能力。
四是綠色節能。響應全球碳中和目标,着眼于園區的可持續發展,園區網絡也通過全新的設備級節能技術,如低功耗設備、智能調速風扇、自動關斷激光器等,網絡級節能技術,如網絡架構優化、資源按需分配、負載均衡等,以及 AI 加持的系統級節能技術,如智能能源管理平台、AI 聚類智能節能等,變得更加綠色。
這些具體可感的價值,正通過一張園區的新質互聯網,被各行各業及用户真實體驗到,而 ICT 產業界已經做好了技術與解決方案的各項落地準備。
無線方面,Wi-Fi 7 是新質園區網絡的顯著特征。業界廠商都已經發布了 Wi-Fi 7 系列產品,帶寬相比 Wi-Fi 6 提升了 2-3 倍,在室内、室外、IOT 等各種用網場景,帶來了最新一代的無線體驗。在應用側,Wi-Fi 7 手機等無線終端普及速度逐漸加快。《報告》中提到的萬兆園區無線 Wi-Fi 技術方案應具備零盲點覆蓋、智能天線調優、智能漫遊切換等能力,正與當下的趨勢高度契合。
有線方面,《報告》中提到,萬兆園區有線組網方案包含經典以太網和以太全光網,其中以太全光網适用于新建園區網絡場景。在教育醫療等房間密集型場景,各廠商也在積極推出高品質的以太全光網絡解決方案。
以智慧課堂為例,采用以太全光技術的產品,可以實現 10GE 全光進入課堂,4K/VR 等多媒體教學也能流暢不卡頓。在消防安全方面,還有無源方案可以選擇,讓校園更加安全。結合網絡管理軟體,可以做到全網可視可調優,AI 智能分析問題,減輕學校的網絡運維壓力。
從上述產業實踐中不難看出,沒有高品質萬兆網絡作為支撐,大量園區的數智化設想都将歸為泡影。
《報告》的價值正在于此,通過共識的凝聚加速标準的形成,從而讓高品質萬兆園區網絡建設駛入快車道。
抓住數字經濟的增長機遇,加速建設 " 數字中國 ",推動各行各業的數智化更新,已經成為我們這個時代的迫切需求。
但新質互聯網不是一天建成的,需要層層遞進,鋪設一條标準化的快車道。
兩份《報告》的發布,讓我們看到了數據中心和園區的新質互聯網建設,已經邁出了關鍵的三步:
第一步,凝聚共識。通過發布權威報告,明确網絡演進的方向和目标,不僅提出了理論指導,還指明了切實可行的技術體系,為產業發展提供清晰的指引,為新質互聯網的建設奠定了堅實的基礎。
第二步,產業化落地。只有将先進的技術方案轉化為實際的產業實踐,才能避免其成為空中樓閣,產業落地是建設新質互聯網的關鍵環節。科技企業在此方面做出了積極的貢獻,通過自主研發和創新,為新質互聯網的建設提供了有力的技術和產品支持。
第三步,标準建立。通過統一的技術标準和規範,可以确保不同廠商和設備之間的互聯互通,提高網絡的兼容性和可靠性,為新質互聯網的長遠發展保駕護航。目前來看,标準化已經駛入快車道。
為智算 " 強心 ",為園區 " 壯體 ",當智算數據中心、萬兆園區在一張新質互聯網上完成飛躍,產業數智化也将變得更高、更快、更強。