今天小編分享的科技經驗:瘋搶AI芯片:機房拆舊貨,一片賣10萬,歡迎閱讀。
作為算力基礎設施,競購英偉達高端顯卡芯片已經成了一種 " 搶跑遊戲 "。而決定 AI 大模型創業公司成敗的要素之一," 就是你到底有沒有能力調動最起碼 100 張以上的英偉達顯卡。" 一家 AI 創業公司負責人對「市界」表示。
作者 | 董溫淑
編輯 | 李 原
運營 | 劉 珊
像賣愛馬仕一樣賣芯片
今年以來,大模型和 AI 2.0 既是最火熱的創富夢,也越來越成為一個昂貴的 " 權力的遊戲 "。在技術、資本、人才等構建出的種種門檻中,還有一張重要的入場門票——你有沒有 " 門路 " 能搞到足夠的英偉達高端顯卡。
王非是華東地區一家伺服器定制企業的銷售部經理,他向「市界」描述了最近英偉達顯卡的緊俏程度:" 需求太火爆,有些人從機房裡把芯片禁運政策生效前購買的 A100 80GB 拆出來倒賣。" 這些舊芯片不只沒有保修,相比于去年 8 月前後 8 萬多元的單價,價格還漲到了 10 萬多元。
即便已經舊貨拆賣、物盡其用,顯卡的供應還是嚴重不足。" 需要拿現款去,對方才願意賣給你。" 而相對顯存較小、訓練效率低的 A100 40GB 即便有全新的,也乏人問津。" 詢價的多,成交的少。"
具體而言,這批搶手的顯卡指的是英偉達旗下的 "Tesla" 系列產品。在訓練 AI 大模型時,比傳統 CPU 更高效的 GPU(圖形處理器,又稱顯示芯片),尤其是高端 GPU 一芯難求。
2020 年和 2022 年,英偉達先後推出了 A100 芯片、H100 芯片,其中 A100 顯卡又提供 80GB、40GB 兩個顯存版本,H100 則提供 80GB 顯存。顯存越大,所能運行的神經網絡也就越大。
2022 年 9 月開始,美國禁止英偉達等向中國出口高端 GPU 芯片。為應對禁運政策,英偉達又在 2022 年和 2023 年分别推出了特供中國版的顯卡 A800 和 H800。
不過如今,在政策允許範圍内的 A800 芯片,在市場上也出現了供貨周期拉長、價格上浮的現象。王非透露:" 在大模型火爆之前,A800 大概兩周即可到貨。但現在我跟客戶保守估計要在 8 周内,即便是最樂觀的情況,也需要 4-6 周。"
供職于北京一家顯卡分銷企業的郭麗婕對「市界」表示:現在公司的 A800 單卡報價為 8.75 萬元,已經超出了 A800 在 2022 年 11 月時 8 萬 -8.5 萬元的價格區間。而且,8.75 萬元只是實時報價,顯卡還有繼續漲價的趨勢。" 我告訴客戶确定要了再找我聊,現在的庫存也不多。"
另一家位于深圳的顯卡供應商,則給 A800 開出了 8.95 萬元的報價——更高的溢價意味着等待時間較短,需要大約兩周的貨期。
作為算力基礎設施,競購英偉達高端顯卡芯片已經成了一種 " 搶跑遊戲 "。而決定 AI 創業公司成敗的要素之一," 就是你到底有沒有能力調動最起碼 100 張以上的英偉達顯卡。" 一家 AI 創業公司負責人對「市界」講到。
他透露:" 在去年 8 月之前,通過國内正規渠道,還能買到 A100 顯卡,也可以采購海外版 A100。在此之後,國内 A100 被切斷了貨源,從海外采購海關也不會放行。"
不過那些允許被特供中國的 A800 和 H800 芯片對于緊缺算力的 AI 中小公司而言,同樣是遙不可及。
王非透露:" 一般來說英偉達的貨先到國内總代,再被我們這類廠家分走,銷售給做 AIGC 項目的客戶。目前 H800 雖然已經發售,預計單卡售價會在 20 萬起,也沒有進入我們這一級市場。現在能拿到 H800 的,應該只有阿裡雲、騰訊雲這種有資格從英偉達原廠直接采購的大廠商。"
在市場緊俏的背景下,H800 等高端芯片已經提前被大廠包攬。目前,國内僅有騰訊雲官宣 " 用上 " 了 H800。4 月 14 日,騰訊雲發布了基于 H800 的大規模算力集群,并将其定義為 H800 的 " 全國首發 "。
據《晚點 LatePost》了解,字節今年向英偉達訂購了超過 10 億美元的 GPU,僅字節一家公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU 總和。大公司的合作方式主要是和英偉達原廠直接談采購,能否搶到卡,更多是看商業關系,比如以往是不是英偉達的大客戶。
而在龐大的需求面前,據傳英偉達甚至開始學起了愛馬仕,在購買搶手的 GPU 時,也需購買其它產品作為取得優先供應權的 " 配貨 "。
在這場大模型研發競速賽中,相比超級大廠,更多小玩家只能先把名字寫進等待名單。而無論哪一方歷經蕩滌、最終勝出,作為算力供應者的英偉達都能穩拿訂單,笑到最後。
黃仁勳的運氣有多好?
在商界一直有一種說法:當淘金者蜂擁而至時,獲得财富就變成了小概率事件。最後掙到錢的,更可能是站在淘金者身邊 " 賣鏟子 " 的人。
一位科技賽道的投資人對「市界」回憶:在前幾年的 AI 行業資本寒冬中," 泡沫破滅時,投資人和企業突然意識到,(算法創業)成本極高,都是在虧錢,反而讓上遊賺錢了。"
而在 AI 這個近年來最大的科技風口面前,英偉達便是那個第一批站在上遊、得以幸運 " 起飛 " 的公司。
在今年 5 月舉辦的英偉達業績電話會上,英偉達創始人、總裁兼 CEO 黃仁勳直言:今年 1 月以來出現的新產品需求 " 不可思議地陡峭 ",公司訂單 " 多到難以置信 "。
不僅市場對英偉達產品瘋狂競逐,資本也展現出了慷慨的态度。5 月 30 日,英偉達成為全球首家市值突破萬億美元的芯片設計商。
▲ ( 2015 年至今英偉達股價走勢圖 )
當有記者向黃仁勳提問:"(在新一輪 AI 浪潮中)英偉達獲得的豐厚回報是因為運氣,還是因為有先見之明?" 黃仁勳并不諱言英偉達人氣暴漲的 " 運氣 " 成分:" 我們只是相信總有一天會有新的東西發生,其餘的需要一些偶然性。"
如今已經無人在意,短短一年之前,英偉達還陷在營收不及預期、股價滑坡的漩渦之中。如果沒有 AIGC 的 " 天降神力 ",看上去這将是一個已發生過無數次的 " 商業先行者 " 遺憾折戟的故事。
過去數年間,英偉達的高端顯卡更多被用于 PC 遊戲和虛拟貨币 " 挖礦 " 之上。疫情之下,受益于消費電子需求暴增,英偉達股價也随之連番上漲。2021 年,英偉達股價最高升至 300 多美元,創歷史高點。
但進入到了後疫情時代,随着遊戲市場遇冷,疊加虛拟貨币持續波動,2023 财年的前三個季度中,英偉達營收連續下滑,淨利潤大幅縮水。與之相應的,公司股價在 2022 年 8 月,跌至了年内最低的每股 108 美元。與 2021 年高點相比,市值僅餘三分之一。
不過,到了 2022 年底,随着 ChatGPT 橫空出世,英偉達一舉扭轉頹勢,成為了被全球追捧的明星。截至 6 月 23 日美股收盤,英偉達股價已升至 422.90 美元。
在英偉達一飛衝天的同時,人們開始追溯,這是否是一個關于決策者 " 深謀遠慮 " 的故事。而黃仁勳本人對此的定義是:" 這不是先見之明。先見之明是加速計算。"
因為在某種程度上,用 GPU 訓練 AI 模型的歷史正是由英偉達開啟的。
2010 年,據媒體報道,英偉達首席科學家兼高級研究副總裁 Bill Dally 與其好友、全球 AI 領網域權威學者吳恩達某天在咖啡店裡共進早餐。彼時,吳恩達正在谷歌進行 AI 研究,但在推進課題過程中遇到了算力不足問題。
如果想要補上吳恩達團隊面臨的算力缺口,谷歌需要新購置約 1.6 萬塊 CPU(中央處理單元)。以英特爾在 2010 年發布的伺服器 CPU 產品至強 X5680 為例,後者當年的單價約為 1666 美元,1.6 萬塊合計需要約 2700 萬美元。
這筆預算足夠讓吳恩達的研究胎死腹中。據數據分析機構 "PitchBook" 調研,2010 年全球 AI 和機器學習領網域獲得的風險投資還不足 5 億美元。
Bill Dally 聽說了吳恩達的煩惱後,建議他用英偉達的 GPU 替代 CPU 來進行 AI 訓練。由于 CPU 采用串行計算方式,更擅長邏輯控制,但數據處理效率較低。而英偉達的 GPU 產品采用了其自研的并行計算架構 "CUDA",能夠将任務分解成若幹部分同時解決。最終,吳恩達團隊果然僅用 48 塊 GPU 并聯,就解決了問題。
在此之後,越來越多的研究團隊開始将英偉達芯片用于 AI 訓練使用。而黃仁勳也在看到 AI 市場的巨大機遇後,從 2012 年開始,将 AI 列為了重要的發展方向。
某種程度上,在 10 年前 AI 落地應用還是模糊一片的背景下,便在深度學習層面開始布局,确實代表了黃仁勳的 " 先見之明 "。
就職于矽谷某 AI 芯片獨角獸公司的 Lee 對「市界」講到:對芯片企業而言,在 2012 年投入深度學習的計算是一個非常難得的選擇。據他回憶:"2012 年是大數據時代的巅峰,最賺錢的市場是互聯網數據庫、檔案系統等等,做深度學習可以說是’冷板凳’。而且英偉達是圍繞着深度學習的主題進行全方位、點點滴滴的下注,包括完善語言設計、開發者工具等周邊軟體工具。"
國產 GPU 奮力追趕
對于英偉達的成功原因,黃仁勳曾這樣總結:" 我們很早地,大約在 10 年前就發現,(AI)這種制作軟體的方式可以改變一切。我們從底層一直到頂層,從各個角度改變了公司。"
從 2016 年開始,英偉達旗下的加速計算 GPU 產品線(代号 "Tesla")開始專門針對 AI 訓練任務進行設計。這一年推出的芯片型号為 P100,同時配備有英偉達新研發的高速互聯技術 "NVLink"。而 NVLink 能夠允許 CPU、GPU 芯片間進行高速互動,進一步提升了運算效率。
從底層到頂層搭建起的軟硬體產品生态,也是英偉達在這輪 AI 風口,因其長期布局和最大的确定性,得以受到資本熱捧的原因。但從市場、技術等角度考慮,英偉達當下構建的 " 算力帝國 " 也還遠遠談不上固若金湯。
根據 2023 财年财報顯示,中國是英偉達的第一大目标市場,英偉達在中國市場實現的營收占其全球市場營收的 47%。而在政策限制下,英偉達難以向中國市場銷售 A100、H100 高端芯片,無疑将對其營收造成重擊。
黃仁勳個人,從不掩飾對于中國市場的期望。5 月底他在接受《金融時報》采訪時,抱怨美國政府對于半導體技術的出口限制使得英偉達束手束腳,警告持續更新的中美芯片戰将令美國科技業面臨遭受 " 巨大損害 " 的風險。" 如果失去了中國市場,我們并沒有應急計劃。因為世界上沒有其他中國,中國只有一個。"
但在英偉達高端顯卡出口受阻的态勢下,許多中國客戶不得不轉向其他選擇。而細細數來,市場中英偉達的挑戰者并不少。
王非告訴「市界」:" 我一些做 AIGC 項目的客戶選擇了海光的國產顯卡 DCU Z100L。據我所知,海光的產品目前已經用到了多個國產大模型裡。"
另一位大模型應用層的創業者則透露,由于買不到 A800,其所在的團隊緊急購置了一批英偉達的消費級顯卡 GeForce RTX 4090," 未來會考慮其他選擇,或者更多配置雲計算資源 "。
在供應端,天數智芯、摩爾線程等國產 GPU 廠商已經開始積極推動產品落地于大模型訓練領網域。
6 月 10 日,天數智芯對外宣布,經過驗證,其研發的國内首款量產的通用 GPU" 天垓 100" 具備支持百億級參數大模型訓練的能力。據稱,在天垓 100 加速卡的算力集群支持下,北京智源研究院 70 億參數的 "Aquila" 語言基礎模型完成了參數優化工作。6 月上旬,摩爾線程則宣布其已經完成對智源研究院 " 悟道 · 天鷹 " 大模型的推理兼容适配,整個适配過程僅花費不到 6 小時時間。
除了國產 GPU 玩家,"AI 芯片第一股 " 寒武紀、阿裡巴巴旗下芯片企業 " 平頭哥 " 的產品同樣可以用于運行 AI 相關任務。
6 月 19 日," 國產 CPU 第一股 " 龍芯中科在投資者交流平台公開表示,其已完成通用 GPU 相關 IP 設計,預計第一個集成自研通用 GPU 核心的 SOC 芯片(系統級芯片)計劃于 2024 年 Q1 流片,在此基礎上将研制兼顧顯卡和計算加速卡功能的通用 GPU 芯片,計劃于 2024 年下半年流片。
伺服器廠商南京坤前計算機的一位客戶經理總結道,在 AIGC 等大模型應用領網域中,國產產品已經可以部分滿足客戶需求。他講道:" 不僅是現在,在未來的一段時間内英偉達 GPU 供不應求也是可預見的,但我認為不必過于追求英偉達。只要算力集群足夠大,國產卡也夠用,就算國產卡帶寬少一點,運算的時間多一點,起碼可以實現自主。"
此外,從 6 月上旬開始,市場便不斷傳出知名資管機構與大股東對英偉達的減持計劃。實際上,英偉達 " 算力帝國 " 的縫隙也已經開始顯現。
6 月 6 日,背後站着老牌歐洲金融世家羅斯柴爾德家族、管理資產近 900 億美元的愛德蒙得洛希爾資產管理公司透露,已經将部分英偉達頭寸獲利了結。主要原因是:AI 估值太高,越來越不确定。如果估值繼續上漲,機構會變得謹慎。知名投資估值專家 Aswath Damodaran 也表示,賣掉了英偉達的股票,因為 " 這輪上漲太驚人 "。
事實上,黃仁勳自己便可能是矽谷最具危機感的企業家,他曾多次公開提到:" 我一直認為我們距離倒閉只有 30 天的時間。" 最近,他也在采訪中表達了擔心:認為在英偉達因政策而 " 缺席 " 的這段時間,中國的 GPU 初創企業會很快追趕上來。
(文中王非、郭麗婕為化名)
© 市界原創出品,未經授權,請勿轉載