今天小編分享的科技經驗:夾縫中的英偉達中國,歡迎閱讀。
作者 | 楊逍
編輯 | 蘇建勳 楊軒
穿着大花襖,轉着紅手絹,入鄉随俗的英偉達 CEO 黃仁勳脫下他标志性的黑色皮衣,在全體上海員工的哄鬧中,跳起了東北大秧歌。這是時隔 4 年,黃仁勳再度光臨英偉達中國年會。
在英偉達内部,黃仁勳此次 " 訪華 " 是高度機密," 當主持人說有請我們最親密的家人後,很多人都在猜測是誰 ", 英偉達内部員工告訴 36 氪," 直到老黃出現,全場沸騰,完全沒想到他會來。"
黃仁勳在年會上扭秧歌(來自網絡截圖)
英偉達的員工大多視黃仁勳為偶像。他的到來将年會氣氛推向頂點,也給英偉達中國員工和合作夥伴吃了一顆定心丸。5 天時間,他連趕了 3 場年會。
美國的芯片禁令,讓這家芯片巨頭過去一年,在中國市場舉步維艱,黃仁勳 2023 年 6 月原定的訪問中國大陸的行程取消後,甚至有員工在視頻會上問道:" 你還能來中國嗎?"
但黃仁勳的意外光臨,打消了員工的疑慮,也在這個充滿寒意的冬天,向整個英偉達中國員工傳遞出了積極的信号。
英偉達無疑是 2023 年全球最受矚目的公司。大模型火爆帶來的芯片需求激增,讓它在這年賺得盆滿缽滿,前三個季度總營收達到 388 億美元,同比增長 85.5%。
英偉達股價更是水漲船高,一年時間翻了 3 倍,截止 2024 年 2 月 2 日收盤,英偉達股價已突破 660 美元 / 股,有望成為又一家突破 2 萬億美元市值的科技巨頭。
英偉達員工 " 靠股票致富 " 一度成為行業熱聞,令人豔羨。但在中國,英偉達所面臨的局面卻頗為尴尬。
顯卡兩次被禁售,一度讓英偉達在中國幾乎無貨可賣,業績遭遇了巨大下滑。公司新改良的 PCIe L20(面向中國市場的用于 AI 推理特供版 GPU,以下簡稱 "L20"),在大模型訓練市場銷售艱難。
黃仁勳訪華後僅 10 天,市場上便立刻傳出 HGX H20(面向中國市場的用于 AI 訓練特供版 GPU,以下簡稱 "H20")的消息。但 H20 僅面向大客戶開啟預定,至少等到 2024 年下半年才能到貨。接近英偉達的人告訴 36 氪,銷售們都表示中國市場四季度 " 廢 " 了。
英偉達主要通過代理商出貨,其官方合作夥伴的員工管業曾私下透露," 第一次被禁後,我們衝了一波業績,但第二波被禁後,英偉達幾乎全系列數據中心的卡全部砍了,我們每天問老板,可以賣什麼?"
無事可做,也讓英偉達部分員工,尤其銷售和客戶服務相關部門產生了巨大的隐憂。部分企業端的銷售開始賣起了軟體和 InfiniBand 網絡產品(用于伺服器間互聯的通信產品,以下簡稱 IB 網絡),但這聊勝于無。
核心產品兩次被禁後,一次視頻會議上,英偉達中國員工向黃仁勳發問," 你會裁員嗎?"
這是夾縫中的英偉達中國員工最真實的情緒反應,他們擔心自己的前途,盡管黃仁勳一再強調 " 不會裁員 ",但當時代的重錘落下,英偉達中國就如同兩個大洲板塊碰撞下的邊界,除了承受擠壓,别無他法。
" 無卡可賣 " 的 2 個月
在英偉達生态圈多年,管業(化名)從未經歷過如此艱難的時刻。
2023 年 10 月底,美國對中國發起了第二次 AI 芯片出口管制,除了此前已被禁的 A100 和 H800,專為中國市場推出的改良版芯片 A800、H800 芯片被列入名單,就連消費領網域的 4090 卡也成為犧牲品。
這讓作為英偉達合作夥伴的管業感受到了一絲絕望。因為只賣英偉達產品,管業所在公司的一切業績都系英偉達之上。
可如今英偉達企業端根本沒卡可賣,"當時嫌棄 A800 難賣, 現在我們每天都得問老板,還能賣什麼", 管業感慨道。
一時之間,整個產業哀鴻遍野。在當下最火熱的大模型訓練市場,英偉達的伺服器是最重要和幾乎唯一的算力武器。買不到英偉達,就意味着沒法訓練大模型,在這場百模大戰中失去先機。
為了縮小損失,第二次禁令到來後,英偉達内部立刻行動起來,更改符合規定的產品。
" 大家幾乎一夜之間從床上爬起,把產品重新翻新一遍,軟體、硬體部門忙着重新配置 GPU,後端忙着對硬體進行穩定性測試,完全是新品發布會前最忙的節奏。" 一位英偉達員工回憶道。
不到 2 個月時間,英偉達便迅速推出了面向中國遊戲市場的特供版本 4090D,補上了市場的空缺。
英偉達 4090D 顯卡 (來自淘寶截圖)
比起遊戲業務,數據中心業務的路無疑難了很多。被禁一個月後,產業便出傳英偉達會為中國市場再推出三款改良版的企業端 GPU 芯片—— HGX H20、L20 PCle 和 L2 PCle 的消息。
具有推理功能的 L20 PCle 卡迅速在市場上推出,但能用于大模型訓練的 H20,直到黃仁勳訪華 10 天後的 1 月 29 日,才在市場上開始預定,但僅有大客戶具有預定資格。
A800、H800 被禁後的 2 個多月裡,多位從業者告訴 36 氪,英偉達中國市場幾乎所有數據中心顯卡都被禁,目前能賣的 GPU 只有 L20。
這是一款推理芯片,它的顯存容量和訪存帶寬與被禁的 L40S 幾乎沒有差異,價格還便宜了一半,很适合用在 AI 的搜索、推薦等模型。接近英偉達的人士林瓊稱,第一批 L20 到貨後很快就被字節、百度、騰訊等大廠分完了。
只要不用在大模型推理市場,L20 就有着極高的性價比。可當英偉達中國不得不用它打大模型市場時,一切就變得艱難。
" 我們做了很多測試來證明 L20 可以用于訓練,但客戶根本不買單 ",英偉達内部員工馮元夏滿懷無奈。
英偉達的員工很少會遇到如此艱難的時刻。這家芯片巨頭一手發明了 GPU 產品,質量又向來過硬,員工銷售時一向底氣十足,很少有心裡發虛和郁悶的經歷," 明明是豪華車,卻不得不跑在經濟車賽道 ",一位英偉達員工頗為無奈。
"A800、H800 至少還能用,L20 的性價比實在太低了。" 一位對芯片需求較為了解的算力供應商周毅明告訴 36 氪。就連頭疼賣什麼的管業也表示:" 見客戶根本不說這個,沒意義,他們只關心算力。"
除了算力性能不達标,L20 卡推薦的是 4 卡機的方案,一台伺服器只能放 4 張卡,這意味着要達到同等算力,它需要更多的機櫃、更多的電和更多的場地,運營成本會更高。
管業苦笑,英偉達銷售說這些成本用買卡省下來的錢就都抵消回來,不過是沒東西可賣、不得已而為之的說法。
黃仁勳訪華後才姗姗來遲的 H20 顯卡,雖具有大模型訓練功能,但現在完全沒貨,最早可能要 6 月份才能交付客戶。" 產能有限,肯定是生產最賺錢的產品 ", 接近英偉達的人士林瓊感慨。
無奈之下,中國的客戶們開始了另一種選擇——購買非官方渠道的英偉達 GPU。
周毅明告訴 36 氪,在第二次禁售之前,國内客戶都還老老實實購買為中國市場準備的 A800、H800,但二次禁令後,大家索性放開了,直接購買 H100 產品。
" 很多公司跑到海外,向國内賣英偉達 GPU,每個月通過不同渠道都有 H100 進入中國。"
微信群裡售賣英偉達伺服器的消息(作者截圖)
買不到貨的客戶也開始考慮起在海外建立數據中心,解決買卡難問題。AI 領網域從業者金傑表示," 很多人找我詢問,有沒有在海外建數據中心的合作夥伴資源。有大規模訓練需求的公司可能不敢出海訓練,但零散訓練需求的企業,還是願意試水。"
辦法總比困難多,但無論是在海外購買的英偉達 GPU,還是可能從中國走出去的數據中心客戶,其業績都将不再屬于英偉達中國。
英偉達中國能做什麼?
面對這種被動場景,英偉達中國能做的卻十分有限。
最直接的,在何時推出、推出何種合規 GPU 這件事上,英偉達中國沒有任何話語權,只能被動等待與美國總部的溝通。原本英偉達計劃 H20 與 L20 一同在 11 月發布,但由于美國政府的限制,英偉達不得不調整計劃,将 H20 的發布時間推遲。
哪怕不是這一特殊事件,英偉達中國的自主權和決策權也相對較弱,這從它的組織架構便可窺見。AMD 有大中華區總裁,英特爾和高通有中國區董事長,但英偉達中國沒有一個能代表中國區與美國總部進行溝通的總負責人。
嚴格意義上,英偉達中國并非獨立閉環的組織,它的各個業務是總部各職能部門的延伸,每個業務都向總部職能線負責人匯報,一個僅十幾個人的小團隊也不例外。如果将各職能部門都視作八爪魚的一腳,英偉達中國則更像是每個腳上的觸須。
在這種架構下,英偉達中國更多承擔的是執行功能,不具有決策權。一位英偉達中國早期員工告訴 36 氪,"很多事情都是有結果了才會通知中國,決策正确與否,全靠總部想明白。"
以商務為例,哪怕中國大陸已占到英偉達營收的 20% 左右,是其全球第二大市場,英偉達中國也沒有一個商務總負責人,其消費業務和企業卡業務等條線銷售負責人,都要匯報給亞太區的副總裁。換句話說,在中國,商務條線的高管只在業務負責人級别。
因為業務需求的暴增,英偉達北京辦公室的員工相比 2021 年的約 230 人擴張了一倍,這其中很大一部分是銷售和解決方案團隊等前端員工。
" 但在申請擴招時,英偉達總部很難理解,為什麼需要這麼多人?" 英偉達内部員工很苦惱。銷售們也經常在溝通中自嘲,自己在公司沒有價值。
此外,商務在日常工作中的自主權也有限。英偉達的產品是統一定價,商務不能對產品打折,甚至他們在籤單時也不能保證到貨期,也只能向總部申請貨源。
這種自主權缺失的問題,在市場營銷等部門同樣常見。
有英偉達前員工抱怨," 有時候想做一點本土化營銷的東西,如微博營銷、節慶等,總部并不認同。他們所做的亞馬遜電商活動又不符合國内閱聽人胃口。" 盡管很多國外巨頭在中國區都存在類似的問題,但英偉達無疑是其中對權限收縮較緊的。
" 其實這就是一家硬體公司,市場、銷售這些都是錦上添花,重要的還是產品夠好或者夠便宜。" 一位英偉達前員工告訴 36 氪。
與市場、商務等業務相比,研發是這家公司的人才核心。英偉達中國曾被寄予厚望,總部一度将重要的芯片放在中國研發。
上海團隊成立不到 5 年時,英偉達正研究全球第一款 40nm GPU 芯片,當時便将數字後端工作交給了中國團隊。這也是英偉達在 40nm 制程的第一顆芯片,有着特殊性。不過這款芯片的研發并不順利,當時台積電 40nm 工藝難產影響了芯片研發進程,就連已退休的張忠謀也不得不回到公司解決工藝問題。
" 但總部給了機會,這件事在英特爾、AMD 是不可能發生的。" 莫風鳴表示。
英偉達願意給中國團隊機會,但在海外法律等限制因素影響下,總部不得不思考哪些業務可以放在中國,英偉達中國也很難參與 GPU 最核心的架構設計和研發,這也讓部分員工因 " 只能做邊緣工作 "、" 只能當螺絲釘 " 等原因離職。
據莫風鳴介紹,英偉達中國部分員工曾有機會參與高端 CPU 的研發,但被美國政府關注到後該業務作廢,重新收回美國總部。
發展到最後," 前端越靠前的越在美國,我們參與後端。" 莫風鳴表示。
如今,英偉達上海的後端團隊也是英偉達最大的後端設計團隊,幾乎英偉達每一款芯片等流片都需要中國後端測試、驗證團隊的參與。英偉達中國也有一些獨特性的業務職能,在總部退出視頻編解碼業務後,英偉達中國成為公司内部唯一擁有完整編解碼人員配置的團隊。
何去何從?
兩次產品被禁,英偉達中國的員工都問了黃仁勳同一個問題," 你會裁員嗎 ?"
英偉達的產品不在中國生產,卡全靠進口。一位内部員工擔憂道," 如果哪天老黃舍得放棄中國市場,當場關閉,就什麼也沒有了。" 在代理商看來,英偉達減少部分員工也并不影響其運轉," 他們即使只做大客戶的生意,也有很大訂單。"
在 2023 年,裁員一直是科技大廠避不掉的話題,AMD 、英特爾、高通、德州儀器等公司接連裁員。如 AMD 對 RTG 部門,即負責 GPU 的設計開發的團隊進行優化;德州儀器則裁撤了中國區 MCU 研發團隊,将 MCU 產品線遷往印度。有 " 英國英偉達 " 之稱的人工智能 ( AI ) 芯片獨角獸 Graphcore,也裁減了大部分中國員工,退出中國。
面對如此復雜的局面,黃仁勳給出的答復卻是 " 不會 ",且表示公司仍将擴招。
他的态度罕見地鮮明、直接。對比 2018 年美國總部問是否會裁員時,當時黃仁勳并未給出直接答復,只是舉例不會輕易裁員,2008 年金融危機時也是通過全員降薪度過的危機。
這的确安撫了人心,尤其是研發人員。一位英偉達的研發告訴 36 氪,禁令後大家很擔憂裁員," 但現在安全感挺高,老黃在公司說話非常有分量。" 研發所從事的產品軟硬體開發,通常以項目制為周期,其工作目标不以業績為導向,產品面向全球,所受影響其實相對較小。
最焦慮的是與客戶接觸最多的銷售員工。" 他們只有打底層開發的軟體工程師不會擔憂,像商務和 SA 都非常焦慮。" 管業告訴 36 氪。
SA 是英偉達與商務配合的部門,幫忙推廣產品、測試產品性能等。" 他們的工作和本地客戶聯系非常緊密,如果沒有芯片可賣,工作會受到影響。" 一位英偉達内部員工告訴 36 氪。有的銷售員工則擔心 " 明年我還在不在都是問題 "。但沒人知道答案。
禁售後,原本 " 事無巨細,半小時沒回復客戶消息就會投訴你 " 的英偉達商務們,陷入了迷茫。當代理商詢問產品消息、情況,得到的都是 " 不要問我 "、" 等官方回復 "、" 問我們市場同事 " 的回答。
在此之前,他們完全是另一個狀态——每天行程安排很滿," 哪怕幹到夜裡 3 點,第二天早上照樣 8 點起來、回復工作消息。"
這種焦慮的情緒,在可用于訓練市場的 H20 卡開啟預定後,得到了一定的緩解。
1 月 29 日,黃仁勳訪華 10 天後,新華三宣布将為東方國信首批提供 H20 GPU 系列算力伺服器。這是首個關于 H20 預定的消息,也意味着,在不遠的将來會有更多中國客戶可以訂購到 H20。
不過,H20 在算力上還是進行了壓縮。H20 的峰值算力僅英偉達 H100 的 15%,但顯存帶寬維持不變。
" 老黃非常想保住中國市場,每生產一塊 H20,就意味着少生產一塊 H100。H20 的價格相比 H100 非常有誠意,現在可以說是賠錢保市場。" 一位英偉達的員工表示。
市場對 H20 的态度還算積極。一位行業人士告訴 36 氪,此前大家對于 H20 的預期就很低,但這個卡價格上劃算,相較國產芯片重新适配 CUDA 生态和做無數次的大規模測試,H20 的成本是可控的。
不過即使能買到,禁令和合規也會像達摩克利斯之劍一樣垂在英偉達中國和國產廠商的頭上。"合規卡的生命可能在 18 個月左右,之後會被新的合規卡取代",上述行業人士表示。
兩年兩禁,也徹底打破了國内客戶的幻想。接近需求端的從業人士宮浩滿懷不滿和無奈,"今日割 5 城,明日割 10 城,總不能别人限制什麼我們用什麼 "。如今,客戶紛紛開始嘗試國產 GPU 產品," 哪怕不好用也要用起來 "。
更換國產 GPU 是一件成本很高的事情,CUDA 生态是英偉達強大的壁壘,企業和 GPU 公司駐場團隊要磨合至少半年,開發算子和打磨產品都需要時間。如今,有國產 GPU 公司已經開始與互聯網大廠合作,為其寫算子庫,讓 GPU 顯卡能變得好用起來。
随着市場轉向,國產 GPU 卡的租賃和購買價格也水漲船高。AI 領網域從業者金傑告訴 36 氪,華為 GPU 卡的算力租賃價格已經跟 A100、A800 相差不大。
為了搶奪可能失去的市場,一位接近英偉達銷售的合作夥伴透露,H20 的降價可能會很快到來,這在之前的英偉達,是很少出現的情況。
除了在風雨中飄搖着的 GPU 卡,如今,商務們也正努力尋找新故事和潛在用戶。為了尋求自救,英偉達商務也開始宣傳起了 IB 網絡和 SDK 等軟體。
網絡傳輸能力是英偉達的一大技術優勢,英偉達如今将 IB 網絡拿出來單獨售賣。網絡傳輸有以太和 IB 組網兩種產品,在做大模型訓練時,采用 IB 組網能有更快的數據傳輸效果。但大部分客戶,都傾向于采用以太網絡。英偉達這項業務的營收非常少," 九牛一毛 ",很難養起一家公司。
除了 IB 網絡,軟體產品也是英偉達的商務們今年發力的重點方向。
售賣軟體是英偉達的一項新業務。2022 年英偉達第一次被禁前後,英偉達開始将軟體產品作為一項獨立產品售賣,到 2023 年 8 月左右,英偉達還對軟體產品進行了調價。
接近英偉達的人士告訴 36 氪,2023 年英偉達的合作夥伴做了很多小型峰會來推廣軟體產品。如具有在線協同工作功能的 NVIDIA Omniverse 等。不過由于售價太高,推起來難度也較大。
現有市場之外,英偉達中國也開始找尋新的發展方向——自動駕駛。
這是英偉達投入已久的潛力業務,英偉達的自動駕駛芯片 Orin 一直聲名響亮,在高端智能駕駛市場幾乎獨占鳌頭,但其整體解決方案一直在業内被人诟病。此次在中國部署的自動駕駛團隊,主要就是從事量產及解決方案業務。
2023 年 12 月,加入英偉達不足 4 個月的吳新宙,火速帶着數個部門 VP 回國,加速自動駕駛業務招聘事宜。如今其招聘已取得初步成果, 2 個月時間,英偉達便招募了超 100 名員工。
一位獵頭告訴 36 氪,他們的招人策略也從以往的看綜合素質,到要求快速進人,補齊團隊空缺,更具體的是具有量產服務經驗、能打仗的團隊,很多團隊為了進人甚至放寬了對英語的要求。
" 卷 ",是對自動駕駛團隊的核心要求,這跟英偉達此前的文化截然相反。現實也的确如此。在一向以 WLB ( 生活、工作平衡 ) 的英偉達中國,他們開始了周六、周日加班的節奏。
賣軟體、解決方案、IB 網絡,加強自動駕駛領網域重要性,都是英偉達中國對抗 GPU 市場下沉的努力,因為它懂這種經歷将帶來何種打擊。
在 GPU 概念還不為人知、CPU 當道的 2015 年,美國就曾為了限制中國超算的發展,禁止英特爾向中國四家超算公司出口高性能計算芯片。
這給英特爾帶來巨創。當時,采用中國 E 級超算天和 2 号所采購的英特爾 Xeon 處理器和至強 Phi 加速器芯片,占到英特爾該芯片約一半的銷量。次年,英特爾 Phi 7290、7250 加速器價格腰斬,Phi 7290 更是于 2017 年直接停產。而中國也逐漸發展出了自研的 CPU 芯片。
盡管去年 12 月,8 天内連續訪問了日本、新加坡、馬來西亞和越南四國,但黃仁勳清楚的知道中國市場的重要性,他曾在接受金融時報采訪時說,"如果失去了中國市場,我們并沒有應變計劃。中國只有一個。"
從成立以來,英偉達中國就在一直向上,并在如今了達到頂點。但當一切變化迅速襲來,面對本屬于自己的時代,以及随時可能流走的機會,英偉達中國目前只能承受、适應。
在時代的枷鎖下,如英特爾的 Phi 芯片一樣,在板塊擠壓下墜入海溝,大概是英偉達中國最不願看到的事情。
(文章中出現名字皆為化名)