今天小編分享的科技經驗:AMD發起AI芯片挑戰,但英偉達依然獨孤求敗,歡迎閱讀。
争做 AI 淘金時代的賣鏟人。
作者|趙健
英偉達 CEO 黃仁勳正在試圖給行業建立一種印象—— AI 等于英偉達。
在 AI 大語言模型爆發的今天,要想完成對算力要求極高的 AI 訓練,英偉達針對人工智能的 GPU 芯片幾乎是唯一的選擇。
這種供需的極度不平衡讓英偉達的 GPU 一芯難求,就連 OpenAI CEO 山姆 · 奧爾特曼也在抱怨芯片短缺已經影響到了 ChatGPT 的發展。
黃仁勳對此一定喜聞樂見。2023 年,在 AI 需求的推動下,英偉達的市值衝破萬億美元。
不過,有人正在試圖打破英偉達在人工智能領網域 " 獨孤求敗 " 的狀态。
本周三,AMD(超威半導體)在其首次 " 人工智能與數據中心 " 產品發布會上,正式發布了年度旗艦芯片 Instinct MI300,一款可以對标英偉達 Grace Hopper 系列的超級芯片。
Instinct MI300 有兩個版本:MI300X 僅有 GPU,專為 AI 模型訓練設計,封裝了 1530 億顆晶體管;MI300A 則是集多個 CPU、GPU 和高寬帶内存于一身的 APU(AMD 在 2011 年時提出的產品概念),封裝了 1460 億顆晶體管。
Instinct MI300 的發布意味着,英偉達不再是 AI 公司對算力的唯一選項。AMD 确實也成功吸引到了一些 AI 明星獨角獸,比如 Hugging Face,AMD 将為其 CPU、GPU 和其他 AI 硬體優化模型。
Instinct MI300 承載着 AMD 在人工智能領網域的野心。AMD CEO 蘇姿豐近期曾表示:" 如果放眼五年,你會在 AMD 的每一款產品中看到人工智能,它将成為最大的增長動力。"
AMD 是英偉達的老對手,兩者在 GPU 市場的競争已經持續了 17 年,大部分時間都以英偉達的勝利而告終。
而這一次,已經在 CPU 市場證明過一次的 AMD,能否把成功經驗復制到 GPU 市場?
1.AMD 想要英偉達的 AI 皇冠
AMD 是全球知名的老牌半導體公司,成立于 1969 年。在今年 Gartner 發布的全球半導體公司的排名數據來看,AMD 位列第七。
CPU 是 AMD 的發家業務。1981 年 AMD 獲得了英特爾 X86 系列處理器的授權,在 PC 時代的紅利期一舉做到了行業第二,而這個行業老二,一做就做了幾十年。
在 CPU 之外,AMD 又通過不停地并購,逐步建立起 "CPU+GPU+DPU+FPGA" 完整的芯片布局。
其中比較重要的并購事件包括:
2006 年 7 月,AMD 斥資 54 億美元收購當時的 GPU 行業老二 ATI,正式與英偉達展開 GPU 的競争;
2022 年 2 月,AMD 斥資 498 億美元完成對 FPGA 廠商賽靈思的收購,加強在數據中心業務的布局;
2022 年 4 月,AMD 宣布以 19 億美元收購 DPU 芯片廠商 Pensando,繼續擴大數據中心業務。
AMD 的業務構成分為四大板塊:數據中心、客戶端、遊戲與嵌入式業務。
數據中心包含 AMD 所有的伺服器相關的收入;客戶端收入主要涉及台式機與個人電腦,曾經是 AMD 最核心的業務之一,現在收入占比已經不高;遊戲業務主要涉及 GPU 產品線,索尼、微軟是穩定的大客戶;嵌入式業務則主要來源于原賽靈思的業務。
随着人工智能成為一種趨勢,數據中心成為各大雲巨頭高度重視、大力投入的業務,也是英偉達、英特爾與 AMD 的兵家必争之地。
在此前的 2023 年 Q1 财報會上,AMD 強調 AI 為目前公司的第一戰略重點,AMD 正致力于構建更加多元的 AI 產品矩陣。
而昨天 AMD 的產品發布會,就是首次以 " 人工智能與數據中心 " 為主題。蘇姿豐在發布會上強調,在大型語言模型的推動下,人工智能的市場機會越來越大,到 2027 年市場潛力可能從目前的 300 億美元增加到約 1500 億美元。
AMD 不想錯過這場 AI 盛宴,但英偉達是橫亘在眼前的不得不翻越的大山。
在最新一季的财報中,AMD 的數據中心業務營收 12.95 億美元,同比上一季度的 12.93 億美元,基本沒有增長。反觀英偉達,今年第一季度的數據中心業務營收創歷史新高,同比增長 14% 至 42.8 億美元,是 AMD 的三倍多。
而根據量化對衝基金 Khaveen Investments 測算,英偉達數據中心 GPU 在 2022 年的市占率高達 88%,AMD 和英特爾瓜分剩下的部分。
雖然 AMD 是 GPU 市場的老玩家,但其過去的 GPU 系列產品主要應用于影像處理及 AI 推理領網域,而對于并行計算要求更高的 AI 訓練卻入場較晚。
而 Instinct MI300 的發布,意味着 AMD 試圖在 AI 訓練市場,改變英偉達一家獨大的局面。
2. 進軍 AI 訓練
Instinct MI300 是第一款面向數據中心的高性能 "APU" ——一個由 AMD 獨創的概念。
2011 年(AMD 收購 ATI 的第五年),AMD 在產品構想中以 CPU 和 GPU 分别類比人類左右腦,并基于此提出了 "CPU+GPU" 的異構產品策略,并将其命名為 APU。
類比人腦,AMD 認為左腦更像 CPU,負責對信息的邏輯處理,如串行運算、數字和算術、分析思維、 理解、分類、整理等,而右腦更像 GPU,負責并行計算、多模态、創造性思維和想象等。
圖片來自華泰研究
不過,2011 年的 AMD 正處在 " 失去的十年 " 谷底期,無論是在 CPU 線還是 GPU 線,都沒能拿出足夠優秀的產品,APU 的發展不盡如人意。
時間來到 2020 年 3 月,AMD 發布了新的微架構版本 CDNA,專門針對數據中心的高性能計算、AI 計算而設計。在此之前,AMD 的 GPU 是用同一套架構同時解決遊戲與計算場景需求,自然不利于不同場景的優化。
Instinct 系列產品,就是專為 HPC 高性能計算、AI 計算而生的。而最新發布的 MI300,在規格及性能方面都全面追擊英偉達的 Grace Hopper。
Instinct MI300 采用了台積電 5nm 工藝,有兩個不同的版本:MI300X 僅有 GPU,專為 AI 模型訓練設計,封裝了 1530 億顆晶體管;MI300A 則是集多個 CPU、GPU 和高寬帶内存于一身的 APU,封裝了 1460 億顆晶體管。
AMD 聲稱 Instinct MI300 比上一代產品 MI250 的 AI 性能高 8 倍,它可以将 ChatGPT 和 DALL-E 等超大型 AI 模型的訓練時間從幾個月減少到幾周,從而節省數百萬美元的電費。
AMD 在發布會現場演示了 MI300x 運行 400 億參數的 Falcon 模型,讓它寫了一首關于舊金山的詩。蘇姿豐表示:" 模型對容量的要求越來越大,你實際上需要多個 GPU 來運行最新的大型語言模型。" 她指出,随着 AMD 芯片上内存的增加,開發人員将不需要那麼多 GPU。
AMD 尚未公布 MI300 定價,但管理層在 FY23Q1 财報電話會中表示數據中心產品将延續往日的高性價比定價風格,重點先把市場打開。
AMD 預計 MI300 将于今年底前推出,并将搭載于勞倫斯利弗莫爾國家實驗室的百億級超級計算機 EI Capitan 及其他大型雲端客戶 AI 模型中。
大摩分析師 Joseph Moore 給出樂觀指引稱,AMD 已看到來自客戶的 " 穩定訂單 ",公司 2024 年的 AI 相關營收有望達到 4 億美元,最高甚至可能達到 12 億美元——這一預期是此前的 12 倍之多。
不過,盡管 AMD 幾乎是唯一一個有能力對英偉達帶來挑戰的公司,但這必然是一個非常艱難的過程。
3. 英偉達的護城河
在 AMD 的產品發布會之後,資本市場對此反響平平,AMD 的股價下跌了 3% 以上,反而是英偉達的股價又上漲了 3.9%,市值再次超過一萬億美元。
在投資人眼裡,AMD 的年度芯片 MI300 似乎仍然難以撼動英偉達的根基。
比如,AMD 沒有在發布會上透露它的年度芯片獲得了哪些大客戶的支持。TIRIAS Research 首席分析師凱文 · 克雷韋爾(Kevin Krewell)表示:" 我認為,沒有(大客戶)表示将使用 MI300X 或 MI300A,這可能會讓華爾街感到失望。他們希望 AMD 宣布已經在某些設計方面取代了英偉達。"
目前透露的客戶僅有開源大模型獨角獸 Hugging Face,以及更早之前透露的勞倫斯利弗莫爾國家實驗室。但兩者與對數據中心芯片有更大需求的雲巨頭而言不在一個數量級。
從芯片本身的性能而言,雖然 MI300 在一些參數上超過了英偉達,比如晶體管數量要高于 A100 的 540 億個,但是英偉達可能很快就會通過產品的迭代來彌補。
實際上英偉達已經在這麼做了。5 月 29 日,在 AMD 發布會之前兩周,英偉達在 COMPUTEX 2023 展前發布會上,正式發布了全新的 GH200 Grace Hopper 超級芯片,擁有 2000 億個晶體管,比 MI300 還要高。
更重要的是,英偉達同時宣布了谷歌、微軟和 Meta 将是首批采用這一超級芯片的大客戶。
除了產品本身過硬之外,英偉達另一個銅牆鐵壁一般的護城河,就是它的 CUDA 生态。
英偉達于 2007 年發布 CUDA 生态系統。通過使用 CUDA,開發者可以将英偉達的 GPU 用于通用的計算處理,而非僅限于圖形處理。
CUDA 提供了一個直觀的編程接口,它允許開發者使用 C,C++,Python,以及其他一些語言來編寫并行代碼。
AI 大神吳恩達曾對此評價:"CUDA 出現之前,全球能用 GPU 編程的可能不超過 100 人,有了 CUDA 之後使用 GPU 就變成了一件非常輕松的事情。"
AMD 在 2016 年推出了 ROCm,目标是去建立可替代 CUDA 的生态。2023 年,CUDA 的開發者已達 400 萬,包括 Adobe 等大型企業客戶。用戶越多,粘性越好,起步就晚的 ROCm 要想構建開發者生态還需要時間。
Moor Insights & Strategy 分析師 Anshel Sag 表示:" 盡管 AMD 在硬體性能方面具有競争力,但人們仍然不相信 AMD 的軟體解決方案能與英偉達競争。"
這是屬于英偉達的獨一無二的護城河。AMD 要想打破,極具挑戰。
4.AMD 的成功,可能難以復制
對于 AMD 來說,或許最不怕的就是面對挑戰。
從 2006 年到 2016 年,這是 AMD" 失去的十年 "。這一時期,AMD 的兩個最大的競争對手英特爾和英偉達,正在摩爾定律的驅使下進行產品迭代。
英特爾踐行着 "Tick-Tock 鍾擺策略 ",每兩年做一次大的產品迭代更新(一年工藝制程、一年微架構設計);英偉達則在黃仁勳提出的 " 黃氏定律 " ——顯卡每 6 個月性能提升一倍——的指引下,每半年将產品更新一次。
AMD 沒能跟上兩個行業老大的產品更新節奏,公司發展一度瀕臨崩潰,直到 2014 年蘇姿豐作為 AMD 第五任 CEO 接手。
蘇姿豐剛接手的 AMD 是一個爛攤子,它的筆記型電腦市場被英特爾占據,新興的智能手機市場被英偉達、高通和三星瓜分,伺服器市場份額也從原來的 1/4 縮水至僅 2%。AMD 不得不解雇了大約四分之一的員工,股價徘徊在 2 美元左右,分析師直稱 " 已無法投資 "。
當時英特爾 CEO 柯再奇如此評價 AMD:" 這家公司永遠不會再回來了,所以不要再介意把重點放在新的競争對手高通身上了。"
但後來的故事大家都知道了。在蘇姿豐的帶領下,AMD 在 CPU 市場打了一場漂亮的翻身仗,不僅一步步蠶食了英特爾的市場份額,股價也在 2022 年 2 月歷史性地反超了英特爾。
AMD 之所以能夠在 CPU 市場突圍,很重要的原因在于抓住了對手英特爾的戰略失誤。
在芯片制造這一環節,AMD 與英特爾選擇了不同的路線。AMD 在 2009 年剝離了旗下的芯片制造業務,合資成立了獨立的晶圓代工廠格芯,而自身只專注于芯片設計(Fabless),這讓 AMD 可以選擇獨立的第三方晶圓代工廠(Foundry)。英特爾則從成立以來一直是集芯片設計與芯片制造于一身(IDM)。
在半導體產業發展的早期,像英特爾這樣高度垂直整合的 IDM 才是更主流的模式。AMD 聯合創始人 Jerry Sanders 還說過一句名言:" 有晶圓廠才是真男人(Real men have fabs)。" 不過諷刺的是,AMD 正是因為後來剝離了晶圓廠才有機會完成逆襲。
2014 年之後,英特爾的芯片制程遭遇技術困難,10nm 芯片(相當于台積電 7nm)良率不佳,導致原定于 2016 年下半年的 10nm 量產多次推遲,最終到 2019 年下半年才發布。此前英特爾一直堅持的 Tick-Tock 策略也因制程技術原因而放棄。
英特爾創始人戈登摩爾提出了摩爾定律,但英特爾現在卻遭遇了 " 摩爾定律的詛咒 "。這讓 AMD 抓住了反超的機會。
2018 年,AMD 先是與格芯合作,推出 12nm 制程的 Zen+ 架構,首度在制程上超越了 14nm 的英特爾。随後在 2019 年,AMD 與台積電合作,推出了 7nm 制程(相當于英特爾 10nm)的 Zen 2 架構,領先英特爾。自此之後,英特爾一直在制程上落後 AMD 一拍,直到現在仍然沒有改善。
今天,類似的 " 老二挑戰老大 " 的劇本似乎在重新上演,只是戰場從 CPU 換成了 GPU。雖然 AMD 還是 " 蘇媽 " 帶領的 AMD,但黃仁勳帶領的英偉達,卻比當年的英特爾風頭更盛。
在矽谷,黃仁勳被稱為好鬥的男人,愛穿黑色皮衣,時刻做好反擊的準備,股價漲到 100 美元時還把英偉達 logo 文到胳膊上。
2016 年黃仁勳還不把 AMD 放在眼裡,他直接評價說英偉達跟 AMD 是 "9 跟 0" 的差距。2019 年初 AMD 搶在英偉達之前首發 7nm 顯卡,黃仁勳表面上似乎也毫不在意,直稱 " 這顯卡很一般 "。
而今天,AMD 再一次用更好的產品向英偉達發起挑戰。一邊是躊躇滿志的 AMD,一邊是獨孤求敗的英偉達,一場關于人工智能的 GPU 大戰,現在才剛剛開始。
END.
受微信改版影響,沒有标星的朋友可能會錯過「甲子光年」的推送或是看不到封面,歡迎各位新老朋友給「甲子光年」點個星标⭐️,以便及時收到我們的每篇新推文。
>