今天小編分享的财經經驗:AI芯片“一騎絕塵”,英偉達為什麼沒有對手?,歡迎閲讀。
誰是生成式 AI 最大的受益者?至少在芯片產業鏈,一定是 GPGPU(通用圖形處理器)絕對龍頭英偉達。在 AI 芯片,在 GPGPU 領網域,天下英雄誰敵手?答案是沒有。
在優良業績的助推下,英偉達一度站上一萬億美元市值。這是芯片行業内其他公司難以企及的高度,其市值也達到芯片巨人英特爾的七倍。
作為英偉達的創始人,黃仁勳究竟有什麼魔法把公司帶到如此高度。從近日黃仁勳在台大的演講中,或能窺得一二。
" 學會放棄,是邁向成功的核心關鍵。" 黃仁勳是這樣説的,也是這樣做的。十年前的 2013 年,英特爾還在耗費巨資補貼移動端平板廠商;華為憑借 P6 手機,帶領海思 K3V2 芯片初露鋒芒。而英偉達,卻漸漸淡出了彼時風頭正盛的移動端 SoC 市場。
" 我們的放棄獲得了回報,我們創造了一個新的市場——機器人技術。擁有神經網絡處理器和運行 AI 算法的安全架構。" 黃仁勳説道。
但任何人無法僅靠 " 放棄 " 獲得成功。放棄之外,黃仁勳更多的是 " 專注 "。芯謀研究總監李國強告訴《每日經濟新聞》記者:"(英偉達的成果)源自它的專注,其長期專注于 GPU 領網域,又趕上了 AI 生态的爆發。這兩個方面造成英偉達成為全球芯片產業王者。"
圖片來源:視覺中國 -VCG31N1237120515
舍得放棄的 " 狂人 "
身着皮夾克的 " 狂人 ",這是業界對黃仁勳的印象,遊戲玩家們在各大論壇中也常常親切地喊他 " 老黃 "。由于英偉達每一階顯卡,在價格和性能上只比次一階高一些,因此黃仁勳也被稱為 " 刀客 ",這種錯落有致的各階顯卡布局,也被叫做 " 老黃刀法 "。
在這次演講中,老黃一改 " 皮衣刀客 " 的狂人形象,穿起了禮服,顯得温文儒雅。演講中,黃仁勳講了一個有趣的故事。十年前,台大陳教授邀請他來看其物理實驗室,只見整個房間都是英偉達的遊戲顯卡,插在開放式電腦的主機板上,金屬架上都是散熱用的大風扇。陳教授告訴他:" 黃先生,因為你的關系,我可以完成我的事業。"
陳教授的話深深地感染了黃仁勳,"(陳教授)説的那些話至今仍感動我,完美诠釋了我們公司的價值:幫助這個時代的愛因斯坦與達文西完成他們的事業。"
愛因斯坦在創立廣義相對論的過程中,曾尋求同時代數學家的幫助。
而在如今這個時代,無論 AI,亦或物理學、生物學的研究,都離不開算力的支持。英偉達,正是 AI 芯片的領軍者。
" 放棄 " 與 " 專注 ",可謂黃仁勳成功的關鍵。十年前,AI 并不興盛,行業裏關注的焦點是移動端。智能手機、平板的大爆發,使得移動端芯片成為各大芯片巨頭的 " 兵家必争之地 "。
英偉達在移動端 " 起得早 ",卻最終放棄。據英偉達官網,早在 2008 年,英偉達就推出針對移動端的 Tegra 芯片;2011 年 5 月,為了補基帶的短板,英偉達又收購了 Icera 公司,後者在針對 3G 和 4G 網絡的手機、平板電腦的高性能基帶處理器領網域一直是領先的創新者。
當時,黃仁勳宣稱:" 這是英偉達在移動計算革命浪潮中成為領先公司的關鍵一步。通過将 Icera 公司的技術整合到 Tegra 中,我們将開發出一個極佳的平台,用以支持行業中最好的手機和平板電腦。"
只是,在這輪移動計算革命浪潮中,英偉達失敗了,勝利屬于蘋果、高通和聯發科。2013 年,英偉達在拉斯維加斯國際消費電子展上發布 Tegra4,這款芯片也成為英偉達在手機芯片領網域的 " 絕唱 "。此後,Tegra 系列芯片主要應用在任天堂 Switch 主機上。
AI 芯片獨領風騷
盡管當下手機芯片行業不景氣,但這依舊是一個巨大的市場。十年前,要做出放棄手機芯片市場的決定,更是非常艱難。
但黃仁勳選擇放棄一個規模巨大的市場,去創造一個未知的市場。在演講中,黃仁勳感嘆:" 從巨大的手機市場撤退,再創造一個不知道市場規模的機器人市場。然而,現在的我們擁有數十億美元的自動駕駛、機器人技術的事業,也開創一個新的產業。"
在桌面 CPU,英特爾、AMD 雙雄并立;在移動端 SoC,蘋果小幅領先,高通、聯發科、紫光展鋭等公司各領風騷。在 AI 芯片領網域,不乏 AMD、英特爾這樣的老牌芯片巨頭,也有芯片大神 Jim Keller 帶領下的初創公司 Tenstorrent。盡管巨頭雲集,大神匯聚,英偉達依然能夠 " 一騎絕塵 "。
為何沒有敵手?" 英偉達赢在 CUDA(Compute Unified Device Architecture,英偉達推出的通用并行計算架構),赢在軟體。" 一位前券商分析師如此回復記者。其後,《每日經濟新聞》采訪了多名行業專家及 GPGPU 行業工程師,CUDA 幾乎均被提及。由 CUDA 構建的軟體生态,是英偉達能夠獨領風騷的關鍵。
英偉達領先其他 GPGPU 廠商的優勢到底有多大?" 院士與高中生的差别。" 芯片工程師林達(化名)告訴記者。那英偉達跟 AMD 呢?" 院士和大學教授吧。" 其回復道。
拉開差距的關鍵,在于生态。" 生态是第一位,(CUDA)跟安卓系統很像,太成熟、太方便,生态太強了。就像可樂一樣,程式員已經習慣(CUDA)這個飲料了。而(CUDA)把門檻搞得很低,就好像你數學差,但是你會用計算器。" 林達向記者解釋。
那麼其他 AI 芯片公司能否使用類似 CUDA 的工具?比如 AMD 推出的 ROCm(Radeon Open Compute Platform)以及非盈利組織 Khronos Group 推出的 OpenAI。
林達舉例回復稱:" 跟你買螺絲、扳手一樣。你也可以不通用,但是沒人陪你玩啊。AMD 也搞了個,但是自己都不用。"
軟體生态無可替代
與非網資深行業分析師張慧娟向記者解釋道:" 英偉達 2006 年就推出 CUDA 了。正是 CUDA 的推出,降低了 GPU 的應用門檻。軟體開發者可以通過 CUDA 使用 C/C++ 等語言,來編寫 GPU 片上程式,降低了 GPU 的應用門檻。也是從那時開始,GPU 逐漸脱離了影像處理這一單一用途。它不僅僅可以用于影像處理,也可以用于高性能計算。"
簡單説,CUDA 降低了 GPU 的門檻,使得 GPU 的應用領網域從影像渲染拓展到方方面面,真正成為通用型處理器,因此也有了 GPGPU(通用圖形處理器)的説法。
" 英偉達所有架構都在 CUDA 之上,一直從頭走到現在,包含了很多層級在裏面,包括編譯器、調試器、豐富的庫函數、各種軟體工具,是很龐大的資源。假設現在有一個新的硬體平台,但是不兼容 CUDA,那麼對開發者來説就意味着大量的軟體移植工作。因此一些平台可能會選擇兼容 CUDA,也就是 CUDA 加速的軟體可以跑在他的硬體上,不過實際的效率和性能表現,都有待觀察,這也是 CUDA 生态環境的強大之處。" 張慧娟補充表示。
國内頭部 GPGPU 廠商工程師劉默(化名)6 月 5 日告訴記者:" 經過多年的建設,英偉達的 CUDA 已經有 400 萬開發者,基本形成了壟斷态勢的生态壁壘,而軟體生态恰恰是下遊客户最為重視的產品競争要素,這是英偉達相對于 AMD、Intel 以及其他初創企業的最大優勢。"
既然 CUDA 如此重要,其他廠商可以提供自己的硬體,然後使用 CUDA 生态嗎?
在這個問題上,劉默認為:"CUDA 是一個完全封閉的系統,目前可以真正兼容 CUDA,或者説叫使用 CUDA 的企業(除英偉達自身外)就 AMD 一家,AMD 和英偉達之間有相關的 IP 授權,這樣英偉達的 MI 系列 GPGPU 可以使用 CUDA。但其他初創企業都不能直接使用 CUDA。目前初創企業有兩種思路,第一種往往是 AMD 系出來創業的企業,由于其芯片架構類似 AMD 的產品,因此硬體條件上可以直接使用 CUDA,但由于 IP 的問題,對方會在 CUDA 的基礎上微調出自己的軟體棧,這種雖然便于用户從 CUDA 環境遷移過去,但存在 IP 的風險;第二種就是完全原創的軟體棧,這種最大的問題就是客户存在一定的遷移成本,對商業落地產生負面影響。"
電子創新網 CEO 張國斌也對記者表示:" 讓 NVIDIA 自己開放 CUDA 硬體,以便其他廠商将 CUDA 集成到自己的芯片中,并運行自己為 CUDA 開發的軟體,這種可能性是沒有的,黃仁勳已經徹底否定了,畢竟 CUDA 在這方面是領先對手的,NVIDIA 不可能将自己的優勢開放給其他廠商甚至對手。"
跑吧!無論如何都要保持奔跑
在演講中,黃仁勳寄語學子:" 你們即将進入一個正在經歷巨大變革的世界,就像我畢業時遇到個人電腦和芯片革命時一樣,你們正處于 AI 的起跑線上。每個行業都将被革命、重生,為新思想做好準備。不論是為了食物而奔跑,或不被他人當做食物而奔跑。你往往無法知道自己正處在哪一種情況,但無論如何,都要保持奔跑。"
李國強表示:" 英偉達很早就開始進入 GPU 的研發,且長期專注于 GPU。在 AI 領網域,需要的是高算力并行計算,最适合的就是 GPU。(英偉達)核心產品還是 GPU,别的東西也有嘗試,後來都是慢慢退出。"
此外,英偉達所建立的優勢,并不局限于 CUDA 生态,還有硬體架構與制程。張慧娟表示:" 對于所有芯片而言,硬體架構是基礎,它就像房子的框架。比如 H100,就采用最新一代 Hopper 架構,該架構針對大模型就有一些跨單元的協同計算,擁有更好的加速能力。其最新推出的 GH200,則屬于異構集成架構,它采用英偉達自己的 Grace CPU 和 H100 GPU,在 CPU 和 GPU 中間采取自己的 NVLink 互連技術。這樣的架構解決了很多數據傳輸的瓶頸,把 CPU 與 GPU 之間的帶寬大大提高了。"
這兩款產品,是英偉達即将推出的新品。目前全球大模型訓練,使用最多的仍是英偉達 A100。張慧娟認為:"A100 采用的還是上一代的安倍架構,這個架構也針對 AI 提升了它的計算性能吞吐量,包括更大的内存、更高的帶寬,這些對于大規模計算都是必不可少的。我們只是看了最新兩代的架構,再往前看,英偉達從面向遊戲,到面向高性能計算,一代一代架構演進,這對它來講是非常重要的。"
來源:每經記者 朱成祥 作圖
英特爾曾施行 Tick-Tock(一年更新制程、一年更新)策略,後因制程長期卡在 10 納米而難以推行。而英偉達,從 2008 年推出特斯拉架構,到 2022 年推出 Hopper 架構,一共推出 9 代架構,甚至不到兩年就推出一代架構。此外,由于跟台積電的密切合作,英偉達使用的制程一直是最先進的。
頭豹研究院 TMT 行業高級分析師陳文廣告訴記者:"H100 采用了台積電 4nm 工藝,集成了 800 億個晶體管,比上一代 A100 足足多了 260 億個,是目前全球範圍内最大的加速器;其 CUDA 核心數量則飙升到了前所未有的 16896 個,達到 A100 的 2.5 倍。浮點計算和張量核心運算能力也随之翻了至少 3 倍,比如 FP32 就達到了達到 60 萬億次 / 秒。更重要的是,H100 面向 AI 計算,針對 Transformer 搭載了優化引擎,使大模型訓練速度直接提升了 6 倍以上。這意味着,無論是訓練 1750 億參數的 GPT-3 ,還是 3950 億參數的 Transformer 大模型,H100 都能将訓練時間從之前的一周縮短到 1 天之内。這些突破性的技術創新幫助英偉達保持在高端芯片市場的絕對領導地位。"
或許,就如同黃仁勳所言,英偉達 " 一直在奔跑 "。其對學子們表示:" 無論是什麼,像我們一樣全力以赴去追求它,跑吧!不要慢慢走。"
是的,跑吧!不要慢慢走。正是在不斷奔跑中,英偉達逐步站上全球芯片之巅。在 GPU 領網域,曾經的王者 3DX、ATI 陸續被收購,唯有英偉達屹立不倒。在 GPU 軟體生态中,也湧現出微軟 DirectX、ATI Stream,但在這場長跑中,勝者屬于 CUDA。
而專注,或許是英偉達能從長跑中勝出的原因。微軟的重心不在 GPU 軟體生态,ATI 被 AMD 收購之後,AMD 也更傾向于 CPU 與 GPU 的異構協同。軟體是這樣,硬體同樣如此。在李國強看來,英特爾、AMD 都是橫跨 CPU、GPU 和 FPGA 的龍頭,而英偉達長期專注 GPU。
誰能撼動英偉達?
長期專注、不斷奔跑,奠基了英偉達芯片帝國的霸業。而在異構計算大潮下,英偉達也布局多類型芯片。比如前文提及的 GH200,就融合了英偉達基于 ARM 架構的 CPU 和自身 GPU。除此之下,英偉達還通過收購,推出 DPU 產品。
2020 年上半年,英偉達以 69 億美元對價收購以色列網絡芯片公司 Mellanox Technologies,并于同年推出 BlueField-2 DPU,将其定義為繼 CPU、GPU 之後的 " 第三顆主力芯片 "。
CPU、GPU 人們已經比較熟悉,DPU 又是做什麼的?據英偉達官網,DPU 是一個用于數據中心基礎設施的先進計算平台,可大規模提供加速的軟體定義網絡、存儲、安全和管理服務。
張慧娟向記者解釋:" 随着數據量越來越大,使用傳統的 CPU 處理已經跟不上數據的爆發。尤其是短視頻、視覺類應用,數據量是爆炸式、指數級增長的,DPU 應運而生。此前,一些 FPGA 廠商也在進行這方面的探索,自英偉達收購了這家 DPU 公司之後,DPU 這個市場被迅速帶火了,AMD(2022 年斥資 19 億美元)收購 DPU 芯片廠商 Pensando,國内也湧現出好幾家 DPU 創業公司。"
在這輪 " 第三顆主力芯片 " 大潮中,英偉達也在構建自身的軟體生态,其于 2021 年推出 DOCA。
何為 DOCA?英偉達簡單直接地解釋道:"DOCA 之于 DPU,正如 CUDA 之于 GPU。"
" 如果説 CUDA 是 GPU 的靈魂,那麼 DOCA 就是 DPU 的靈魂。因為芯片如果沒有好用的軟體配合,就是一個(幹巴巴的)硬體。就如同手機,假如沒有豐富的 APP,可能就只能打電話。正是因為有了軟體,讓開發者開發出各種各樣的應用,硬體的應用才如此豐富。" 張慧娟表示。
通過硬體架構和軟體生态,英偉達已經在 GPU 領網域構建強大的壁壘。在 DPU 領網域,英偉達似乎也要如法炮制。
誰能撼動英偉達的地位呢?目前可能還沒有。" 除非英偉達自己出現重大失誤,但是這樣的可能性很小。" 張國斌表示。
劉默認為:"AMD 的 MI300 是目前從硬體水平和軟體生态上最接近 H100 的產品,無論是國外的初創公司例如 Graphcore,還是國内的幾家企業,目前還沒有能夠替代英偉達 H100 的產品。此外,英偉達依靠其巨大的出貨量以及在芯片制造上的投入,已經和台積電形成了緊密的合作,而非簡單的客户與供貨商關系。比如 H100 使用的 4nm 制程,就是英偉達和台積電在公版 5nm 制程的基礎上進行優化後的特制版本。"
曾經在桌面 CPU 領網域,英特爾也是一騎絕塵。因為領先太多,還有 "i3 默秒全 " 的説法,即 i3 在默認頻率下就能秒 AMD 全系列。然而 AMD 在蘇姿豐的帶領下,如今已成功與英特爾平分秋色。
AMD 還能在 GPU 領網域上演奇迹嗎?李國強認為:" 确實存在這種可能。但英特爾之所以會被 AMD 趕上來,根本性原因在于其在晶圓制造技術上。當時英特爾在 10 納米節點停滞了,但 AMD 是 Fabless 模式,通過與台積電合作才翻身。而英偉達本身就和台積電密切合作。"
一直在奔跑的英偉達,一直在奔跑的黃仁勳,誰又能颠覆呢?
每日經濟新聞