今天小編分享的科技經驗:英偉達殺瘋了!連投三家生成式AI獨角獸,加單帶飛台積電5nm產能,歡迎閲讀。
誰能挑戰英偉達?
作者 | ZeR0
編輯 | 漠影
芯東西 6 月 30 日消息,不管是今年上半年,還是本周,英偉達都是妥妥的大赢家。
在由生成式 AI 掀起的新一波人工智能熱潮中,英偉達已經成為最熱門的股票之一,今年迄今股價暴漲 185%,市值突破 1 萬億美元,并在支持生成式 AI 及大模型研發的硬體競賽中遙遙領先。
圍繞生成式 AI 創企投資,英偉達的存在感也越來越讓人難以忽視。本周四,美國 AI 聊天機器人創企 Inflection AI 宣布獲得 13 億美元新融資,估值升至約 40 億美元;美國 AI 文生視頻創企 Runway 宣布完成 1.41 億美元新融資,估值升至約 15 億美元。而英偉達均在這兩筆融資的投資方之列。
另據市研機構 TrendForce 預測,因 AI 相關芯片部署刺激了營收增長,英偉達有望在 2023 年第二季度取代高通登頂全球最大芯片設計公司。
一邊在 AI 芯片市場接單接到手軟,另一邊面向生成式 AI 賽道加碼重金投資,英偉達的 AI 如意算盤正打得越來越響。
01.
連投生成式 AI 獨角獸
英偉達閃電擴張 AI 投資版圖
英偉達最新參投的兩家生成式 AI 獨角獸——打造出類 ChatGPT 產品的大型語言模型創企Inflection AI和讓用户輸入文字就能輕松創作短視頻的 AI 視頻編輯軟體創企Runway,這兩家都雲集了非常強大的明星投資陣容。
除了英偉達之外,Inflection AI 新一輪融資還獲得了LinkedIn 聯合創始人 Reid Hoffman、微軟聯合創始人比爾 · 蓋茨、谷歌前 CEO Eric Schmidt等科技巨頭及大佬的注資。Runway 最新融資的投資方則包括谷歌、Salesforce等科技巨頭,累計融資已經有約 2.37 億美元。
更早之前,今年 6 月 9 日,同樣在做類 ChatGPT 聊天機器人的加拿大 AI 創企Cohere宣布完成 2.7 億美元 C 輪融資,估值約 22 億美元,英偉達、甲骨文、Salesforce等均參與了該輪融資。
尤其值得一提的是 Inflection AI,由 DeepMind 聯合創始人 Mustafa Suleyman 于 2022 年聯合創辦并擔任 CEO,在推出 Pi 聊天機器人後收到了大量報價,繼而獲得了這一筆高額融資,而且英偉達是這輪唯一的新投資者。至此,這家獨角獸企業超過 Cohere,成為估值僅次于 OpenAI 和 Anthropic 的全球第三大生成式 AI 獨角獸。
Inflection AI 最近推出了其首個專有語言模型 Inflection-1,并稱該模型是在非常大的數據集上使用數千個英偉達 H100訓練的,性能與 GPT-3.5、Chinchilla 和 PaLM-540B 相當。
▲ Inflection-1、GPT-3.5、LLaMA-65B 多任務準确率對比(圖源:Inflection AI)
02.
11 分鍾訓練 GPT-3
英偉達 GPU 強勢霸榜大模型基準測試
Inflection AI 正與英偉達合作構建用于訓練 AI 大模型的全球最大 GPU 集群之一。通過與英偉達和雲服務提供商 CoreWeave 的合作,其超級計算機将擴展至包含22000 個 H100,這一數量遠超 Meta RSC 超算集群的 16000 個 A100。
CoreWeave 成立于 2017 年,号稱可提供 " 比傳統雲提供商便宜 80%" 的計算能力。英偉達之前曾向 CoreWeave 投資 1 億美元。據外媒今年 6 月報道,微軟同意在未來數年内向 CoreWeave 投資數十億美元,用于雲計算基礎設施建設。
在最新發布的權威 AI 性能基準測試 MLPerf 中,英偉達和 CoreWeave 合作構建的擁有 3584 個 H100 的集群,僅用不到 11 分鍾就訓練完 GPT-3 大型語言模型。
▲英偉達 H100 在最新 GPT-3 訓練基準測試的表現
毫無意外的,英偉達憑借旗艦計算芯片 H100 GPU 繼續霸榜各項基準測試。
▲英偉達 H100 在 8 項 MLPerf 基準測試的性能表現
最新 MLPerf 訓練 3.0 新增了 GPT-3 大模型基準測試,而英偉達和英特爾成為唯二的參賽者。英偉達用 3584 個 GPU 創下了最快的 GPT-3 訓練紀錄,英特爾 AI 芯片 Habana Gaudi2 則通過在更小的系統上跑 GPT-3 展示在易用性和性價比方面的競争力,包括在 384 個 Gaudi2 芯片上訓練總時長為 5 個多小時,在 256 個 Gaudi2 芯片上訓練總時長為 7 個多小時。
▲ GPT-3 訓練基準測試結果對比,深紅色圖例為英偉達 H100,淺紅色圖例為英特爾 Gaudi2(圖源:IEEE Spectrum)
在一些測試中,Gaudi2 訓練性能超過了英偉達 A100 GPU。英特爾還計劃通過軟體優化進一步縮小 Gaudi2 與 H100 的差距,将于 9 月份發布對 FP8 的軟體支持與新功能,并預告屆時 Gaudi2 性能和性價比将超過 H100。另一個被視作英偉達強勁競争對手的 AMD 則并未提交測試成績。
▲ Gaudi2 跑 4 款模型性能超過 A100(圖源:英特爾)
MLPerf 基準測試的結果由 MLCommons 發布。據 MLCommons 執行董事 David Kanter 透露,GPT-3 是 MLPerf 基準測試中對計算要求最高的,MLPerf 中的大多數基準網絡都能在單個處理器上運行,但 GPT-3 至少需要 64 個處理器。
03.
AI 大模型軍備競賽白熱化
大算力 AI 芯片需求暴漲
科技企業正積極将 AI 融入其產品和服務中,投資者對生成式 AI 創企的投資熱情不減,顯然沒有誰願意因為計算速度落後而錯過這一波潛在的歷史性增長機遇。
僅是在本周,國内外均誕生了迄今最大的生成式 AI 并購案:美國大數據超級獨角獸 Databricks 同意以 13 億美元(約合 94 億人民币)收購美國大型語言模型創企 MosaicML,美團昨日宣布以 20.65 億元收購由美團聯合創始人王慧文創辦的大模型創企光年之外。
訓練生成式 AI 模型離不開昂貴的數據中心計算芯片。大模型軍備競賽白熱化背景下,大算力 AI 芯片市場需求持續高漲。而目前訓練 AI 大模型的真正芯片赢家只有一家——英偉達。
去年 11 月,甲骨文宣布購買數萬個 A100 和 H100 搭建新計算中心。谷歌在今年 5 月的 I/O 開發者大會上宣布推出了一台擁有 26000 個 H100 的 AI 超級計算機 A3。本周甲骨文被外媒報道正在花費數十億美元采購英偉達的芯片,以擴展針對新一波 AI 浪潮的雲計算服務。
英偉達未來能否繼續赢麻,還與中國市場息息相關。根據财報,去年來自中國大陸和香港的收入占英偉達收入的 22%。據《晚點 LatePost》報道,今年春節後,擁有雲計算業務的中國各互聯網大公司都向英偉達下了大單,字節今年向英偉達訂購了超過 10 億美元的 GPU,另一家互聯網大廠今年至少已給英偉達下了萬卡級别訂單,按目錄價估算價值超 10 億元人民币。僅字節一家公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU 總和。不算今年的新增訂單,字節 A100 和前代產品 V100 總數接近 10 萬塊;字節到貨和沒到貨的 A100 與 H800 總計有 10 萬塊。
在本周出現美國商務部考慮進一步限制對華出口英偉達 A800 和 H800 的傳聞後,英偉達首席财務官 Colette Kress 警告説:" 從長遠來看,禁止向中國銷售我們的數據中心 GPU 的限制,如果實施,将導致美國工業永久失去在世界上最大的市場之一競争和領先的機會,并影響我們未來的業務和财務業績。"
04.
結語:距離登頂全球最大芯片設計公司
只差臨門一腳
無論從產品性能、新增訂單、業績進展、股市表現、生态擴張還是投資布局來看,英偉達都已經肉眼可見的赢麻了。
5 月 25 日,英偉達發布 2024 财年第一季度财報中,其單季度實現營收 71.9 億美元,并預測其第二季度的收入将達到 110.0 億美元。6 月 12 日,據台媒報道,在英偉達 AI 芯片加單的帶動下,台積電先進制程利用率大幅提升,5nm 產能利用率從五成多提升至七八成。
據近日市研機構 TrendForce 發布的數據,受益于生成式 AI 和雲端算力需求爆發以及新款 GeForce RTX 40 系列新品上市,英偉達在 2023 年第一季度營收環比增長 13.5% 至 67.3 億美元,其全球芯片設計市場份額提升至 19.9%。
▲ 2023 年第一季度全球前十大芯片設計公司排名,部門:百萬美元(圖源:TrendForce)
TrendForce 預測,因 AI 相關芯片部署刺激了營收的增長,增速明顯,在 2023 年第二季度,英偉達有望取代高通成為全球最大的無晶圓廠芯片設計公司。
在英偉達俨然已是生成式 AI 時代最大受益者的背景下,英特爾、AMD 等芯片巨頭正虎視眈眈,試圖通過軟硬體協同優化分食 AI 計算市場。與此同時,國產 AI 芯片公司能否接住這一波大模型訓練及部署紅利,也成為業界關注的焦點。
>