今天小編分享的财經經驗:AI基建,拉爆不少牛股,歡迎閱讀。
下一個 " 光模塊 "?
字節豆包的出圈,在 A 股又掀起一股圍繞算力基建的投資,應用端的進步和巨額資本開支或逼促國内其他 AI 玩家追趕差距。
而在全球 AI 領網域,随着算力需求突破單個芯片性能更新的速度,一場全新的 AI 基建已經拉開帷幕。博通的入局,令大型科技公司不再臣服于英偉達的芯片霸權。
新一批賣鏟人,開始進場了。
AI 基建 2.0
AI 基建投資并非只停留在堆 GPU 的範疇,還覆蓋了像高速互聯、存儲、光通信、交換機等不可或缺的環節,這些共同組成了算力,存力,運力。
AI 伺服器跟傳統伺服器集群的不同,就是增加了 GPU 模組。從存力的角度,HBM 容量帶寬的增速趕不上芯片算力增長的速率,那就會有内存牆的問題,制約算法的發揮。
從伺服器的角度,算力網絡内部光模塊的用量由集群内 GPU 數量決定,每台伺服器的網絡端口數量同步增加,按照比例推算可知,這會帶來多大的需求量。
這個邏輯,其實在 AI 基建 1.0 版本已經兌現過。國内的光模塊 " 三劍客 ",美國的博通、邁威爾科技,都是受益者。
而如今,邏輯有什麼變化?
首先是超大規模算力集群已經初具雛形。
Meta 此前提出,要在 2024 年底繼續擴大基礎設施建設,包括 35 萬顆 H100 的配置。未來,AI 算力集群的規模上限将遠遠不止百萬顆 GPU。
生成式 AI 的應用往往需要處理和分析大量數據,執行這些任務通常會超過單個計算節點的能力,因此需要跨多個計算節點分攤工作負載,前提是要讓節點之間的通信暢通無阻。
英偉達的做法叫做 Scale up,通過 NVLINK Switch 提升 GPU 之間的通信速率,把多個 GPU 組成一個超級 GPU 節點,縱使單節點的性能已經趨近極限,在高速互聯下張量并行的得以提升。
而實現高速互聯的方案,不再只是光模塊,而納入了銅互聯 。因為在短距離連接的場景裡,相比光互連,銅互聯在成本和功耗上占據優勢。
以英偉達 GB200 NVL72 為例,800G 光模塊的市場平均單價在 430 美金左右,那麼整個機櫃購置光模塊就要花掉 55.7 萬美元,相比之下,使用銅纜互聯節省了差不多 6 倍的成本。
在短距離連接場景裡,高速銅互連方案已經逐漸被海外大型雲服務廠商所采用。
其次,去年 AI 芯片的所有增量幾乎都被英偉達一家所壟斷,但随着以博通 ASIC 為代表的芯片合作方式得到驗證,科技巨頭逐漸加碼了自研算力部署。
因為過去英偉達可以将 GPU 和互聯方案一起打包塞給科技巨頭,但現在巨頭和博通一起搞芯片集群,選擇上更加多樣化,激發了像高速互聯、交換機的配套需求。
亞馬遜在今年 12 月初發布了 Trainium2 推理芯片,其單機櫃可以放置兩台 Trainium2 伺服器,兩個機櫃間就通過有源線纜連接。除此之外,谷歌、X.AI 都在使用定制線纜。
除了業績指引亮眼的博通,數據中心的上遊配套供應商今年終于能看到實際的業績增長。
安費諾是高速率連接器龍頭,英偉達高速銅纜組件的主要供應商。在過去的三季度,公司銷售額同比增長 26%,其中用于 AI 產品的貢獻最大。
Credo 提供的是高速連接線材,近期大火的 AEC 是其主要產品。在月初公布的财報中,公司即表示 AEC 已經在下遊 AI 領網域放量,佐證了科技大廠對于高速線纜的旺盛需求。業績公布後次日,公司市值一天就漲近 50%。
什麼是 AEC?
對于 AI 算力集群來說,最小化能耗和成本是極關鍵的。英偉達的策略是盡可能多地部署高速銅纜,今年推出的 GB200 機架方案中,采用了超過 5000 根銅纜連接 GPU,長度超過 2 英裡。
按照下半年出貨,明年成為主力產品的節奏,市場對銅纜潛在需求量的預期十分樂觀。根據機構預測,僅 GB200 出貨量拉動的銅纜需求,2025 年的市場空間将達到約 64 億美元。未來新產品方案的設計,對于高速銅纜的需求還會不斷進行迭代。
數據中心交換網絡的連接方案包括光模塊 + 光纖、有源光纜 AOC 和直連銅纜 DAC。
銅纜為短距離連接提供高帶寬和性能,是經濟高效的解決方案。而光纜利用光纖并提供更高的帶寬,适合更長的距離,多用于不同機架之間的連接。
想要實現成本最低的高速互聯,且功耗和延遲統統降低,銅互連是性能和成本折中的方案。
DAC 是一種兩端帶有固定接頭的銅纜組件,廣泛用于數據中心的短距離連接,長度通常為 1 至 7 米,傳輸速率最高可達到 224Gps,可以進一步分為有源 DAC 和無源 DAC。
無源 DAC 在電纜端直接連接,通過銅線傳輸,在沒有信号調節時可以進行傳輸。覆蓋距離不超過 3 米,譬如用于系統内的機架連接。
有源 DAC 則包含 ACC(有線銅纜)和 AEC(有源電纜)。
ACC 是通過内部添加了有源信号驅動器芯片,這些有源芯片補償了銅傳輸造成的部分損耗,因此它們可以傳輸比無源 DAC 遠 2-3 倍的距離。
而 AEC 則是在 ACC 基礎上,通過在線纜兩端引入 Retimer 芯片,可以在傳輸開始和結束時清理、去除噪聲并放大信号, 從而進一步延長傳輸距離 。雖然功耗和成本也會随之增加,但仍低于光纜 AOC。
比較來看, AEC 和 ACC 的覆蓋範圍都比 DAC 更長,都适用于為短距離連接提供高帶寬 ,是比較經濟高效的解決方案。
每年要投入上千億資本開支的微軟谷歌們,未來預算投入會将一部分投入到互聯設施中,這是确定無疑的。
因為 NVLINK 技術的存在,再加上機櫃密度足夠高,所以英偉達使用 DAC 和部分 ACC 就已經夠用。但他們現在要圍繞自己的芯片集群配套,整體算力密度不如英偉達的前提下,機櫃内卡離得更遠, 于是就傾向于性能出色的 AEC。
機構大幅度的修正呼應了如今大型 AI 集群對高速電纜需求的積極變化。
根據 Lightcounting 最新報告, 預計未來五年高速電纜的銷售額将增長兩倍以上,到 2029 年将達到 67 億美元 。按照去年的報告,對 2028 年銷售額的估計只有 28 億美元。
除了市場擴容本身,其中主要的變化是,到 2029 年,DAC 将逐漸把市場份額讓給 AEC 和 ACC。
但是不是一定能替代光模塊呢?
如果一些方案本來使用的是有源光纜,可能會被 AEC 替代一部分。但在 1.6T 甚至更高速率的互聯網域,跨機櫃較長距離的連接場景依然首選光模塊,整體方案來看還是會搭配使用。
超大算力集群的競賽不光只有海外巨頭在參與,國内幾個頭部玩家也在持續投入。字節網傳的明年 1500 億元資本開支,以及字節在應用端的出色表現,或倒逼其他國内大廠奮起直追,在國内復制一場 AI 軍備競賽。
對于國内 A 股,投資機會又可能在哪裡? ( 注意:下文提到的上市公司僅是分析說明,并非推薦,讀者需注意風險 )
下一個光模塊?
AI2.0 基建對于高速互聯的需求明确,同時随着自研 ASIC 隊伍的不斷壯大,超大規模 XPU 集群的建設将帶動上遊的光模塊、交換機、PCB、高速線纜等用量的持續繁榮。
來自英偉達的映射最為直接 ,當前 B200 在逐漸上量,供應商安費諾的配套產品線就集結了眾多來自國内的上遊供應商,譬如包括樂庭智聯 ( 沃爾核材 ) 、神宇股份、鼎通科技、奕東科技 等 ( 僅作分析說明,并非推薦 ) 。
樂庭智聯是沃爾核材的子公司,也是安費諾的核心線纜供應商,目前無論是產品線,技術,以及產能,都為承接大量訂單做足了準備,可以預見未來由產能和價值量提升帶來的業績怎增長。
公司在 8 月曾透露,部分單通道 224G 高速通信線產品完成了重要客戶驗證,已接到訂單需求,陸續交付中,目前整體占比較小。
作為核心映射标的,股價從 2 月最低點迄今,市值累計翻了接近 4.5 倍。類似的海外配套供應商還有 精達股份、鴻騰精密 等 ( 僅作分析說明,并非推薦 ) 。
高速銅纜組件由線材和連接器組成,上遊提供材料,下遊是終端客戶。在高速線材 & 連接器市場,國際巨頭通過專利優勢壟斷大量份額。AEC 的主要供應商包括 Astera labs,Broadcom、Credo、Marvell、Maxliner、Point2。
國内企業如鼎通科技、奕東電子生產的組件經過客戶集成其他功能後形成連接器模組,最終供應給下遊客戶。
但 未來随着國内算力建設,下遊客戶對國產化内部器件的需求增長 ,國内供應商有望從細分器件逐步突破海外壟斷。譬如去年上市的華豐科技,在去年上半年已經成功研制 224Gbps 高速背板連接器。
國内來看, 新易盛 在高速 AEC 電纜模塊有所布局; 瑞可達 AEC 系列產品目前相關項目正在推進中; 兆龍互連 已規模化生產應用于傳輸速率達到 400G 的高速傳輸電纜及組件產品,無源銅纜和有源銅纜產品可針對情況提供不同解決方案 ( 僅作分析說明,并非推薦 ) 。
從成本來看,高速銅互連的部門價值量或無法與光模塊相提并論,但随着算力基建在規模量級上的突破,成本和性能将是科技巨頭們不得不去平衡的問題,一些短距離的互聯場景将逐漸被高速銅纜填充。
這意味着,一批新的 " 賣鏟人 " 正在徐徐走進這個賽道,跟光模塊的故事極其相似,預先享受到了估值端提升。
技術路線的迭代只是一個契機,對于國内企業,高速銅纜仍然具備比較高的門檻,從技術研發,產品驗證,到進入供應鏈,收獲業績爆發增長,這個過程仍存在着不及預期的可能性。
格隆匯聲明:文中觀點均來自原作者,不代表格隆匯觀點及立場。特别提醒,投資決策需建立在獨立思考之上,本文内容僅供參考,不作為任何實際操作建議,交易風險自擔。
本文來自微信公眾号 " 格隆匯 APP"(ID:hkguruclub),作者:弗雷迪,36 氪經授權發布。