今天小編分享的互聯網經驗:華人内卷大模型,歡迎閱讀。
圖片來源 @視覺中國
文 | 最話 FunTalk,作者 | 何伊然,編輯 | 劉宇翔
北京時間 3 月 23 日晚間,TikTok CEO 周受資出席了美國眾議院能源與商務委員會聽證會,聽證會持續了超過 5 個小時,周受資回答了來自美國議員們的多個尖銳問題。
那場聽證會備受全球矚目,某種程度上影響着 TikTok 的命運。但如此重要的聽證會,字節跳動創始人張一鳴卻 " 缺席 " 了。有圈内人告訴《最話》,當時張一鳴也在美國,但不是在華盛頓,而是在西海岸,幾乎與聽證會同一時間,張一鳴沒看直播,專心在挖角 OpenAI 的頂尖華人工程師,開出的價碼是 " 一億現金 + 股權 "。
這則消息尚未交叉證實,也不清楚天價的價碼最後能否挖到心儀的工程師,但圈内人都知道張一鳴對生成式 AI 有多 " 痴迷 "。
幾乎全世界的科技大廠都在重注生成式 AI,不但頂尖工程師的價碼水漲船高,就連算力的底座 GPU 也供不應求。
今年 3 月,已經擁有超強算力的微軟宣布已幫助 OpenAI 建設了一個新計算中心,配置了數萬塊 A100。5 月,Google 推出了一個擁有 2.6 萬塊 H100 的計算集群 ComputeEngineA3,服務想自己訓練大模型的公司。在中國,國金證券根據產業鏈信息,字節跳動今年已訂購了超過 10 億美元的 GPU,字節到貨和沒到貨的 A100 與 H800 預計有 10 萬塊。另一家大公司今年以來的訂單量也達到了萬卡級别,金額至少超過 10 億元。而騰訊發布的騰訊雲新版高性能計算服務中心也采用了上萬塊 H800 芯片。
這些 GPU 都來自英偉達。僅字節一家公司的采購量,可能會超過去年全年英偉達在中國銷售的商用 GPU 的總和。
AI 大模型對于 GPU 芯片有着巨大需求,現在在行業内外,GPU 等同于英偉達的觀念已經深入人心。在 AI 浪潮中,GPU 行業逐步走向了 " 一超多強 " 格局。英偉達創始人、CEO 黃仁勳赢麻了。
但有赢家就有輸家。遊戲時代,N 卡與 A 卡孰優孰劣一直是玩家們争吵不休的話題,而在 AI 時代,由美籍華裔蘇姿豐擔任的 AMD 卻似乎掉隊了,不但缺少對标產品,在股價上英偉達市值萬億美元,而 AMD 只有 1760 億美元,兩者差距巨大。
AMD 就真的門庭冷落,再也沒機會了嗎?
反擊
" 在大型語言模型的推動下,人工智能的市場機會越來越大,到 2027 年市場潛力可能從目前的 300 億美元增加到約 1500 億美元。"
當地時間 6 月 13 日,AMD 在美國舊金山召開了 2023 年數據中心與人工智能技術新品發布會。
打扮幹練的蘇姿豐帶着自信的神情登台,一口氣介紹了多款新品。
在 " 蘇媽 " 平靜的臉色下,或許也有着對 AMD 未來發展的擔憂。
踩在生成式 AI 的大潮上,英偉達今年股價漲幅 200%,是資本市場當紅香饽饽。相比之下,AMD 同期漲幅僅為英偉達的 50%,雙方差距在半年時間被明顯拉大。
根據 2023 年一季度财報,AMD 營收為 53.53 億美元,同比下降 9%,這是公司自 2019 年以來首次營收出現下滑。适用于 PC 產品的 Ryzen 處理器銷售額僅是 2022 年同期的三分之一,足以看出消費電子在近兩年的窘迫處境。AMD 預計,第二季度營收約仍會有 19% 的同比下滑。
目前,AMD 的業務分為四大板塊:數據中心、客戶端、遊戲與嵌入式業務。數據中心包含 AMD 所有伺服器相關收入;客戶端收入指的是台式機與個人電腦,曾是 AMD 最核心業務;遊戲板塊涉及 GPU 產品線,索尼和微軟的遊戲主機是其穩定客源;嵌入式業務主要由 2020 年收購的賽靈思業務線構成。
在消費電子大起大落後,AMD 在近兩年旗幟鮮明地選擇了數據中心和嵌入式業務優先的戰略,強調人工智能是公司 " 最大、最具戰略意義的長期增長機會 "。
蘇姿豐介紹了 " 面向 AI 和高性能計算的全球首款 APU 加速器 " MI300A,該產品将多個 CPU、GPU 和高帶寬内存封在一起。在 GPU 和 CPU 領網域都是 " 二把交椅 " 的 AMD 充分利用自己雙邊優勢,搞起了互補開發。
根據芯片參數,該 APU 加速卡擁有 13 個小芯片,總共包含 1460 億個晶體管:24 個 Zen 4 CPU 核心,1 個 CDNA 3 圖形引擎和 128GB HBM3 内存。
本次發布會最重要的產品當屬 AMD 針對大語言模型發布的 MI300A 優化版本 MI300X。
" 當你将 MI300X 與競争對手進行比較時,你就能發現,MI300X 提供了 2.4 倍的内存和 1.6 倍的内存帶寬,有了這些額外的内存容量,我們對 LLM 是有巨大優勢的,因為可以直接在内存中運行更大的模型。"
作為大模型的最佳算力發動機,GPU 對生成式 AI 有着不可替代的支撐作用。目前,英偉達憑借 83.7% 的市占率領跑 GPU 市場,A100 芯片價格在近期節節攀升,產量上也供不應求。2023 年第一季度,英偉達GPU 出貨量下降了 15.2%。
ChatGPT 爆火後,行業内對 GPU 飛漲的價格充滿怨言。
OpenAI 創始人山姆 · 奧爾特曼近期表示,降低成本是 ChatGPT 當前首要目标。奧爾特曼透露,受到 GPU 資源的限制才導致 ChatGPT 目前難以開放更長的上下文視窗、提供微調 API 等服務。他也承認,多數企業根本養不起大模型。
據報道,OpenAI 已經花費了微軟雲超 12 億美元。由于将計算資源集中指出 ChatGPT,微軟其他部門可以使用的伺服器受到了限制。此外,GPU 訓練大模型需要大量的電力來保證這些資源的供應,這就導致了 GPU 的高能耗,成為了 " 電老虎 "。
在國内市場,華為、京東、百度的高管也都公開抱怨大模型訓練高達千萬元一次的訓練成本。
發布會上,蘇姿豐強調随着 AMD 芯片上内存增加,開發者有望減少 GPU 使用數量,從而節省成本,這顯然迎合了市場的需求。
蘇姿豐特意在單個 MI300X GPU 演示運行了擁有 400 億個參數的 Falcon-40B 大型語言模型,并讓它當場實時創作了一首關于舊金山的詩歌。
" 夢想之城,總是讓你渴望更多。" 或許,蘇媽在用 AI 表達自己的心聲。據介紹,Instinct MI300X 将在今年第三季度向部分用戶交付使用,第四季度正式面世。
現場,AMD 請來了 Meta 等公司人高管現場 " 背書 ",強調人工智能開發者使用免費工具有利于人工智能芯片從 " 單一主導廠商 " 轉向更多種方案。
AMD 擺明了是想挖英偉達的牆角。
差距
不過,資本的走勢才是市場最真實的反饋。
發布會後,英偉達的市值仍保持上漲态勢,AMD 反倒出現了小幅度下降。捂着不肯公布新款產品的定價,也沒有官宣合作大客戶,或許讓市場對 AMD 的雄偉藍圖難以充分信任。
在 OpenAI 的 " 帶貨 " 下,英偉達GPU 已經和生成式 AI 深度綁定。龐大的前期投入帶來了過高的沉沒成本,多數企業很難切換到其他替換芯片產商。AMD 即便能夠找到合作方搭建起基于 AMD 架構的大模型算力中心,以此打開新的市場,也很難更改多數公司已做出的決定。
在大模型專用 GPU 業務上,英偉達有着明顯先發優勢。從業人士普遍認為,現有競争對手短期内無法追趕英偉達的產品,即便在硬體上縮小了差距,但在軟體服務上也很難相提并論。
英偉達首席科學家戴維 · 柯克很早就意識到算力的潛力,堅持要把給遊戲業打造的 3D 繪圖渲染 GPU 算力變得通用化,使之轉變為通用算力中心。
早在 2007 年,英偉達就推出了革命性的 GPU 統一計算平台 CUDA,開始基于 CUDA 持續積累算法和軟體生态。等到深度學習算法流行之後,GPU 取代了 CPU,CUDA 變得勢不可擋。
既然英偉達跑通了路徑,那麼 AMD 也在復制這一路徑,提升自己的軟實力。
發布會上,AMD 披露了全新更新版 AI 軟體生态系統開發體系理念—— Open(software approach)、Proven(AI capability)和 Ready(support for AI models)。AMD 現場展示了用于數據中心加速的軟體棧工具 AMD ROCm 系統。 該系統不僅兼容 CUDA,更要打造成開放平台并完善生态。
2022 年,AMD 主管數據中心業務副總裁有些自嘲地承認,英偉達構建了豐富的軟體生态系統,在芯片領網域做的很全面,AMD 不可能復制英偉達的成功之道。
但蘇媽顯然不會放棄," 我們仍處于 AI 生命周期的非常非常早的階段!"
發布會上,蘇姿豐屢屢強調生成式 AI 給行業帶來的衝擊仍只是起步階段,各家企業仍處于調整期。當前的領先者不一定就是未來十年的領先者,帶領 AMD 不斷打仗、闖出新生之路的蘇媽,她說這番話還是有幾分說服力的。
五十四歲的蘇媽沒有休息的意思,為了繼續復興 AMD,她需要再赢一次。
賽跑
身為 AMD 歷史上第一位女性 CEO,蘇姿豐是一位非常成功的職業經理人。
擁有麻省理工的博士學位,先後當選美國國家工程院院士和美國藝術與科學院院士的 " 蘇媽 " 是一位不折不扣的 " 學霸 + 卷王 "。
在她接任 CEO 職位的時候,AMD 深陷泥潭之中,公司市值僅剩不到 20 億美元,外界一度認為這家老牌企業将要不行了。
短短八年時間,通過擁抱遊戲主機廠商,和台積電開展深入合作,加碼研發投入,蘇姿豐用超強的執行力确保 AMD 每一款新品都能保質保量問世。與此同時,競争對手英特爾卻屢屢跳票,AMD 逆轉了不利形勢。
2022 年初,AMD 市值第一次超越了英特爾。不到十年,蘇姿豐帶領 AMD 市值翻了 90 倍,她也成為世界上薪水最高的女性 CEO。
國内外媒體常常将黃仁勳與蘇姿豐放在一起讨論。
兩個人都是出生于中國台灣省台南地區的 "60 後 ",都在幼年時代移民美國,都是常春藤名校畢業的工科生,都是工作中專攻研發創新的 " 拼命三郎 " ……還有消息稱,兩個人有遠親關系,從輩分上說,黃仁勳是蘇姿豐的表舅。
說起來也有趣,黃仁勳和 AMD 的緣分比蘇姿豐還悠久。1983 年,黃仁勳大學畢業後的第一份工作就是在 AMD 擔任芯片設計師,在職期間還拿下了碩士學位。
這段經歷,黃仁勳提及的不多,只說是一段快樂的日子,離職後他從對技術的崇拜中走出來,更加意識到市場和管理的重要性。
雖然是同行,黃仁勳和蘇姿豐同台的次數極少,外界并不知道兩人的私交如何,但在商業場上,二人頻頻用溫和的言語上演針尖對麥芒的正面碰撞。
2019 年初,黃仁勳調侃 AMD 推出 Radeon VII 顯卡不夠出色,說道," 這是一次奇怪的發布會,也許 AMD 的人今天起床也是這麼想的 "。蘇姿豐則在采訪中回應稱:" 我猜他應該還沒有見過這張卡吧!"
不知道黃仁勳會不會真正重視 AMD 的 MI300X,但除了產品,無論是黃仁勳還是蘇姿豐都面臨着一個棘手的市場難題,那就是:他們的產品是否還能賣到世界第二大市場。
6 月 27 日,有媒體報道 " 拜登政府考慮擴大對華芯片限制 ",根據報道," 美國商務部最早将于 7 月要求停止向中國客戶提供英偉達和其他芯片公司生產的芯片產品。"
對此,英偉達首席财務官科萊特•克雷斯很快表态稱,雖然限制對華出口人工智能芯片不會立即產生重大影響,但這 " 将導致美國產業永久喪失機會 "。他說," 從長遠來看,如果實施禁止向中國出售我們的數據中心圖形處理單元(GPU)的限制措施,将導致美國產業永久喪失在全球最大市場之一競争和領先的機會,并對我們未來的業務和财務業績產生影響。"
去年 9 月,美國就曾要求英偉達停止對華出口兩款用于人工智能的頂級計算芯片。為滿足出口管制規定,幾個月後,英偉達向中國市場推出了專門的 " 降級版 " 芯片。雖然這次美國尚未公布具體細節,但 " 延期豁免 " 應該是意料之中的事。
但無論如此,為了建設大模型的算力底座,除了花費重金挖頂級人才,中國的科技大廠們都希望能早點拿到芯片,最壞的情況是:人才沒挖到,芯片也沒拿到,那麼大模型競賽勝利的天平就傾斜到手裡已經有足夠多芯片的一方。
對于客戶的急需,英偉達、AMD 估計不會視而不見,而會搶市場,如果英偉達的產能跟不上,AMD 多少還是有些機會的。
這是黃仁勳和蘇姿豐又一次比拼執行力的時候。
更多精彩内容,關注钛媒體微信号(ID:taimeiti),或者下載钛媒體 App