今天小編分享的科學經驗:為什麼説MEMS-OXC在智算場景沒有未來?,歡迎閲讀。
智算中心是這一輪科技革命的算力 " 心髒 ",更是國際科技博弈的長期焦點。智算中心建設方案,一直牽動着國人的神經。
近期,OXC 光交換技術在智算場景的應用,走進了大眾視野,這個技術及其解決方案,撐得起智算中心網絡嗎?
深入技術本質、落地實踐、產業進程來看,恐怕都要説一句,"OXC 技術在智算場景其實沒有未來 "。
技術上看,OXC 光交換技術在智算場景中會面臨光電協同、不支持 AI 任務多對多傳輸等技術挑戰,很難有效解決。
實踐上看,當前業界僅谷歌一家商用 MEMS-OXC 設備,而谷歌 TPU 集群用 OXC 的核心目的是解決 Torus 拓撲的可用度問題,但網絡可用度的短板其實是在接入端口,OXC 不解決網絡可用度問題,所以實際上跟自動配線架沒有本質區别。
產業上看,谷歌商用 OXC 全球僅此一家,根據 LightCounting 預測,到 2029 年 OXC 的全球市場空間約為 5 億美元,其中大部分是谷歌,產業規模僅為電交換的二十分之一。
綜合上述維度,不難得出結論,OXC 技術在智算場景中只是配線架,無法真的規模化落地,也支撐不了超萬卡集群智算中心網絡。
接下來咱們就從技術的起點到產業的終點,全面掀開智算場景 MEMS-OXC 的面紗。
簡單來説,OXC 光交換技術就是在不同的光路徑之間進行光信号交換。技術路徑包括 MEMS、DLC、和 DLBS。其中,MEMS 技術是目前最主流的方案,MEMS-OXC 設備也是目前唯一被谷歌這一家所商用的。
但在超萬卡集群的智算中心網絡中,MEMS-OXC 發揮的作用其實就是配線架。
我們先來看看,智算中心組網是怎麼實現的。ODCC(開放數據中心委員會)發布的《AI 數據中心網絡建網》報告提到,AI 參數面網絡有兩層 Spine — Leaf,以及三層 CLOS 架構組網,而在 AI 集群組網實踐中,通過三層組網達到十萬卡以上的組網規模。
目前,Meta、OpenAI、微軟等 AI 巨頭,都是通過從兩層向三層擴展的組網模式,去構建超大規模集群的,也就是在 Leaf 層、Spine 層之外增加 Core 層。其中,兩層組網使用的是電交換機。比如目前業界唯一的 OXC 商用實踐——谷歌也采用的是光電混合架構。
可以看到,智算中心網絡如果采用兩層組網,不需要 OXC;如果是三層組網,MEMS -OXC 設備在 Core 層主要發揮的作用是靈活配線,與自動配線架沒有本質區别。
引入 MEMS-OXC,不僅無法給網絡帶來增益,還可能制造出額外的問題:
首先,光電協同問題。
如果在第三層引入 OXC 光交換機,但數據中心網絡底層用的還是電交換機,這就需要光電之間的協同、通信、配合,對整個數據中心網絡的衝擊是比較大的。
舉個例子,OXC 技術有靈活切換的特征,但對于整網來説,光交換機一會兒連通、一會兒斷開,這就需要整個接入層和 Spine 層,都要随之進行策略調整。
試想一下,智算場景下的大模型訓練大多采用并行訓練,業務流随時變化,如果數據中心網絡随時随地在進行秒級調整,那訓練的可靠性就很難保證了。任何一個大模型研發團隊,恐怕都無法接受訓練的高頻中斷。
其次,OXC 與 AI 業務的适配問題。
OXC 光交換技術是不支持多對多通信的,只能進行純物理的轉發。而在智算場景中,AI 任務是有很多算法和算子的,不同算法的通信模式都不太一樣,可能需要一對多、多對一、多對多等多種轉發方式。這些算法的高效通信,OXC 技術就很難滿足,導致相關智算業務無法開展。
第三大問題,就是 OXC 的耗能問題。
OXC 光交換機的插損很大,也就是信号在光折射的過程中產生了衰減。那麼為了彌補 OXC 的插損,就不得不采用更大功率或更長距離的光模塊,這又會導致能耗上升。此外,插損問題,還會導致光模塊速率無法演進。
由于上述問題的存在,智算中心結合插損、功耗等多方面進行考量,算一筆綜合賬,就會發現 MEMS-OXC 設備還不如自動配線架。
MEMS-OXC 不如自動配線架的另一個關鍵因素,就是商用前景。
我們知道,一項新技術都必須在商業市場中完成閉環,能夠通過使用來回收投資,才能吸引基礎設施的進一步投入,形成良性循環。而 OXC 技術的產業化,良性商業閉環是很難的。
最首要的制約,是成本。
OXC 技術的落地需要光交換機的大量使用,并且所有的相關器件如光模塊都需要進行更新,這會導致前期投資巨大,綜合成本高。
ODCC(開放數據中心委員會)在《AI 網絡光交換機技術報告》中提出,考慮到網絡系統和 OCS(光交換機)本身的挑戰,從端口數量需求、切換時間需求、低成本、高可靠性、拓撲易于管理等維度分析,光交換機還需要優化設計以降低插損和回波損耗,以及探索與電交換機組網方案來降低成本等。
而上述投資,都需要從產業用户身上完成商業回報。但如前所説,受限于光交換技術本身的瓶頸,許多 AI 任務及場景是短期内難以落地的,這就導致 OXC 的商業不确定性強。
這樣綜合考慮下來,就導致業界落地 OXC 的步伐明顯冷靜,基本處于觀望狀态。
技術不是生存在真空之中的,是寄生在人才、資金、產業、實體經濟等多重因素的現實中。
中國智算產業仍處于追趕階段,資源、人才等都相對不足,既要把握發展前景與機遇,也要面對當下生存、商業的現實挑戰,甚至有的還要處理歷史遺留問題。
這種情況下,如果國内智算產業将寶貴的資源,投入并不适合用來組網的 OXC 身上,可能會導致一系列連鎖反應。
比如產業資源的分散,智算中心建設昂貴,而在組網規模、插損、功耗、成本等方面都沒有優勢的 OXC 設備,意味着低效投資,降低科技企業的抗風險能力。
MEMS-OXC 設備在智算集群中的落地效果并不顯著,解決不了網絡可用度問題,引入 OXC 會影響到 AI 算力的傳輸與供給,進而阻礙 AI 訓練、AI 推理等業務的韌性開展。
更需要警惕的是,對 OXC 路線的炒作,可能導致國内智算錯過對其他技術路線的探索,由此帶來的機會成本,是無法估量的。
所以,只能作為自動配線架的 OXC,并不适合成為智算中心組網的選擇,在智算場景沒有未來。眼下,中國智算產業真正該做的,是把自身在成熟交換技術、現有寶貴資源、產業智能化機遇等方面的核心優勢,進一步發揮好。