今天小編分享的财經經驗:英偉達背後的“諸神之争”,歡迎閱讀。
圖片來源 @視覺中國
文|正見 TrueView,作者|岚羽,編輯|TV
2024 年剛開局,AI" 王炸 " 頻現。蘋果放棄長達十年的造車計劃轉投生成式 AI,OpenAI 首個文生視頻模型 Sora 驚豔亮相,号稱比 GPT-4 快 18 倍的大模型 Groq 橫空出世,華為發布首個通信行業大模型……
AI 浪潮已經勢不可擋,AI 芯片作為其發展的底層基石也迎來了前所未有的機遇。據 Gartner 最新預測,到 2024 年 AI 芯片市場規模将較上一年增長 25.6%,達 671 億美元。預計到 2027 年,AI 芯片市場規模将是 2023 年規模的兩倍以上,達到 1194 億美元。
在這樣的背景下," 算力霸主 " 英偉達被捧上神壇,以高達 80% 的占有率幾乎壟斷了市場,賺得盆滿缽滿。英偉達數據中心業務的營收再創新高,帶動 2024 年财年 Q4 季度總營收狂漲 265%。由于這份遠超預期的财報數據,英偉達一夜漲出 2770 億美金市值,相當于:一夜漲出阿裡巴巴 + 百度 + 京東。
英偉達的 " 狂飙 " 也引來了眾多挑戰者。亞馬遜、谷歌、微軟、華為、百度等巨頭積極推動自研芯片,寒武紀、摩爾線程、燧原科技等新銳力量崛起。據外媒報道,英偉達在提交給美國證券交易委員會的檔案中,其中包含 AI 芯片等多個類别裡,首度将華為認定為 " 最大競争對手 "。
理想與狂熱交織下,人們不免好奇:英偉達的 " 鐵王座 " 還能坐多久?為什麼華為被其列為最大競争對手?其他國產 AI 芯片發展如何?
英偉達 " 外患 " 大于 " 内憂 "
與英偉達不斷刷新預期的業績相伴相随的是,越來越多的挑戰。
正如英偉達 CEO 黃仁勳在一次演講中所說:" 我們并不需要假裝公司處于危險之中,因為我們能感覺到公司确實一直處于危險之中。"
英偉達目前最顯著的問題是產能。從去年開始,台積電在先進封裝方面的產能變得緊張,而英偉達芯片依賴于台積電的 CoWoS 封裝技術以及基于 65nm 矽中介層的工藝。雖然台積電已計劃将 CoWoS 封裝產能提高一倍,但需到 2024 年下旬產能才能纾解。
為緩解產能緊張的局面,英偉達與英特爾達成了代工合作意向,初步估算英特爾每月生產 5000 片晶圓,如果全部用于生產 H100 芯片,在理想情況下最多可以得到 30 萬顆芯片,這也意味着英偉達高性能 GPU 的交貨周期将有望縮短更多。
内憂好解,外患卻不容忽視。去年 12 月,AMD 發布了 MI300 系列芯片產品。AMD 首席執行官蘇姿豐稱,MI300X 在訓練大語言模型方面與英偉達的 H100 芯片相當,但推理能力更為出色。目前,MI300 系列產品已開始量產出貨,上個季度推動 AMD 數據中心 GPU 總收入超過 4 億美元。
英特爾也在發力謀求在市場中更大的話語權。新一代的 Gaudi 3 将采用先進的 5nm 制程工藝,配備最高達 128GB 的 HBM3e 内存,大幅提升 AI 的學習和訓練性能,可對标英偉達的 H200 芯片。
除了上述兩個直接競争對手的 " 步步緊逼 ",英偉達還面臨多家科技大廠的挑戰。微軟發布了其首款定制化 Maia 100 GPU 和 Azure Cobalt CPU100,以降低 AI 服務成本。亞馬遜和谷歌已經使用了自研芯片,并部分產品向客戶提供。OpenAI的 7 萬億芯片計劃和孫正義的 1000 億 " 豪賭 " 也在試圖分一杯羹。此外,MLIR、谷歌等都在轉向 " 以 Python 語言為基礎的編程層 ",以使 AI 訓練更加開放,逐漸擺脫對英偉達 CUDA 生态的依賴,建立起自己的護城河。
與此同時,受出口管制影響,英偉達在中國市場的收入暴跌。根據英偉達最新的财報數據,中國區 2023 年第四季度的營收下滑到個位數比例。如何在美國政府管制、中國客戶需求間保持平衡成為英偉達的一道關鍵課題。
在專門為中國市場特供的 A800 和 H800 也被禁售後,英偉達推出了新款 H20,但該產品性價比并不高,性能縮水為 H100 的四分之一,阿裡巴巴、騰訊、百度等中國企業明确表示今年會大砍訂單量,英偉達在中國的營收恐不樂觀。
華為 AI 芯片的自研苦旅
英偉達在曾提交給美國證券交易委員會的檔案中,把華為列為最大競争對手。近日在接受美國科技雜志《連線》采訪時,英偉達 CEO 黃仁勳再次表達了對華為的重視,點贊 " 華為盡管受到現有半導體處理技術的限制,仍然可以通過将許多芯片聚集在一起來構建非常強大的系統。"
這不僅是對華為技術實力的認可,更是對整個 AI 芯片行業競争格局的一次重新評估。申萬宏源的研究報告顯示,從 2023 年上半年的數據看,華為 AI 伺服器出貨量已成為國產品牌第一,僅次于英偉達,且仍在快速增長。
華為的崛起并非是 " 忽如一夜春風來 "。2017 年,華為發布全球首款移動端 AI 芯片麒麟 970,内置獨立 NPU,相比 CPU 獲得了約 50 倍能效和 25 倍性能優勢。這意味着,麒麟 970 芯片可以用更少的能耗更快地完成 AI 計算任務。
一年後,華為又發布麒麟 980,憑借 7nm 制程工藝、雙核 NPU 加持等特性,麒麟 980 打破了多項世界第一。但是,沒有一蹴而就的成果。麒麟 980 歷經了 36 個月的研發,才完成定制特殊基礎單元構建高可靠性 IP 論證,再加上 Soc 工程化驗證的時間,留給量產的周期僅半年左右。
根據這個時間表,麒麟研發團隊實際上只能允許一次投片修正,否則就會影響芯片的正常流片、量產和終端适配,造成產品延期上市甚至是項目失敗。經過 2 個大版本的迭代,5000 多次的工程驗證,花費了數億美元,最終麒麟 980 成功量產。
麒麟 980 成為華為在手機端 AI 芯片布局的一個重要裡程碑。在此基礎上,華為試圖覆蓋雲、邊、端各種場景,形成從應用到系統到芯片的閉環。
2018 年 10 月,華為在其全聯接大會上首次提出全棧全場景 AI 解決方案,并 " 祭 " 出了兩顆 AI 芯片:華為昇騰(Ascend)910 和 310。從算力上看,昇騰 910 表現非常出色,半精度(FP16)算力可達256TFLOPS,整數精度(INT8)算力可達612TOPS。2023 年最新發布的昇騰 910B 是昇騰 910 的更新款,算力已達到英偉達 A100 的性能水平。
由于其卓越的性能表現,加上美國對英偉達芯片的出口禁令限制,國内企業紛紛轉投昇騰系列的懷抱。據悉,2023 年華為從中國主要互聯網公司獲得了至少 5000 顆昇騰 910B 芯片的訂單,這對英偉達在 AI 芯片市場的主導地位構成了嚴峻的威脅。
算力比拼僅是一方面,生态建設方面,英偉達最寬的護城河 CUDA 也正遭猛烈進攻。CUDA 最大的特點就是,軟硬結合大幅提升了 GPU 的并行計算效率,具備低成本、低門檻、廣生态等優勢,兼容 CUDA 生态對于開發者與客戶來說更友好。但同時,兼容也會成為限制產品發展的 " 天花板 ",追随英偉達生态難以實現突圍,自研生态才有望實現自主可控破局。
華為以自研 CANN 框架對标 CUDA,要直面英偉達用戶粘性的巨大挑戰。CUDA 推出至今,擁有超 400 萬開發人員和超過 3000 個應用程式,建立起了龐大的用戶群體與開發者社區。
雖然 CANN 起步較晚,離 CUDA 還有很大差距,但華為也在努力追趕。目前華為 CANN 平台已經到了 7.0 版本,支持 50+ 主流大模型,同時兼容主流加速庫及開發套件。此外已經支持 Pytorch、Tensorflow 等主流框架,PyTorch 2.1 版本已同步昇騰 NPU,意味着開發者可直接在 PyTorch 2.1 上基于昇騰進行模型開發。
伴随着 " 日拱一卒 " 的演進,華為 AI 芯片終于實現 " 從 0 到 1" 的突破,走向了巨頭的談判桌。但 " 從 1 到 100" 仍需企業和產業鏈上下遊共同完善生态,剩下就交給時間。
國產 AI 芯片的 " 繁花 " 時代
目前國產 AI 芯片主要可以分為三類:其一是華為、阿裡等大型科技企業自研的 AI 芯片,二是海光信息等國資背景的科技公司,三是寒武紀、壁仞科技、摩爾線程、燧原科技等創業型芯片公司。
華為作為 ICT 運營商,積累了完整的雲技術生态和渠道銷售能力。在各省級行政區建立代表處、派駐城市總經理的戰略打法,還一度被騰訊雲和阿裡雲效仿。
阿裡平頭哥
成立于 2018 年的平頭哥,由中天微和達摩院自研芯片業務整合而來,依托中天微多年技術積累,結合阿裡基礎設施事業部和達摩院的前沿算法研究,技術儲備深厚。
2019 年 9 月,含光 800 問世,這是平頭哥第一款通用 AI 推理芯片。含光 800 采用了自研的芯片架構,通過軟硬體的協同設計實現性能突破。在業界标準的 ResNet-50 測試中,含光 800 推理性能達到 78563 IPS,比當時業界最好的 AI 芯片性能高 4 倍;能效比 500 IPS/W,是第二名的 3.3 倍。
含光 800 已經大規模應用在阿裡内部核心業務中,雖然不對外售賣,但可以通過阿裡雲對外輸出 AI 算力。阿裡雲去年 4 月推出的大模型 " 通義千問 ",就使用了含光 800 芯片。
海光信息
主要從事高端處理器、加速器等計算芯片產品和系統的研究、開發,是少數幾家具備高端處理器研發能力的企業之一。海光信息的產品采用 X86 架構,分别有海光通用處理器(CPU)和海光協處理器(DCU)。
海光的 " 深算一号 " 是公司 DCU 系列的主要在售產品,目前廣泛應用于數據中心、互聯網企業,在大數據處理、人工智能、商業計算等領網域,已經商業化應用數十萬片。" 深算一号 " 具備大模型運行能力,但它的水平只相當于英偉達 P100 的水平。2023 年第三季度海光推出了 " 深算二号 ",據透露其性能翻了一番。不過和英偉達產品相比,仍有一定差距。
燧原科技
專注于人工智能雲端算力產品,提供自主創新、全棧自研、具備完全自主知識產權的通用 AI 訓練和推理產品,可廣泛用于雲數據中心、超算中心、泛互聯網、傳統行業及智慧城市等多樣化場景。
成立五年多,燧原科技已推出燧思系列芯片、雲燧訓練和推理加速卡以及雲燧智算機的全系列算力產品線。基于燧原科技的自主創新芯片架構,采用 12nm 工藝制造的新一代燧思 AI 推理芯片計算能力與業内 7nmGPU 相當。
伴随着大模型和生成式 AI 的興起,缺芯正從一個行業季節性的常态,演變為全球各行各業的痛點,催促更多的國產 AI 芯片企業努力追趕甚至超越。
市場、企業、技術、產品都在變化,新的格局正在孕育當中,國產 AI 芯片亟需找準戰略規劃的前行方向,才能避免在這副生存角逐的棋局中被碾壓踢出。