今天小編分享的科技經驗:英特爾向英偉達宣戰!推出AI芯片Gaudi 2專供中國,老牌芯片巨頭勝算幾何?,歡迎閲讀。
本文來源:時代周報 作者:梁春富
今年以來,全球大模型創業熱潮引發算力需求猛增,英偉達 H100、A100 等用于大模型訓練的 AI 芯片走俏。而作為 AI 芯片的主戰場之一,中國市場備受芯片巨頭關注。
7 月 11 日,英特爾(INTC.NASDAQ)在發布會上推出面向中國市場的第二代深度學習加速器—— Habana® Gaudi®2(下稱 "Gaudi 2")。該產品是一款 ASIC(專用集成電路)芯片,由英特爾 Habana 團隊設計,采用台積電 7 納米工藝。Habana 是英特爾在 2019 年斥資 20 億美元收購的以色列 AI 芯片初創企業。
Habana® Gaudi®2 深度學習加速器,圖源:英特爾
Gaudi 2 去年于海外發布,此次是針對中國市場推出的定制版本。在性能和配置上,該芯片集成了 24 個可編程 Tensor 處理器核心(TPCs),配置 21 個 Gbps 以太網接口,内存和緩存提高到 96GB HBM2e 和 48MB SRAM,内存帶寬升為 2.4TB/s 等。
時代周報記者從英特爾獲得的資料顯示,在測試 GPT-3 時,Gaudi 2 也表現出了強勁性能,在 384 個加速器上訓練時間達 311 分鍾,從 256 個加速器到 384 個加速器實現了近線性 95% 的擴展。這使得 Gaudi 2 是除了英偉達產品外,唯一能把 MLPerf GPT 3.0 模型跑起來的芯片。
英特爾還透露,Gaudi 2 國内首批将與百度智能雲、浪潮信息、美團、紫光新華三等公司合作。其中,浪潮信息在發布會現場發布了基于 8 顆 Gaudi 2 加速卡 HL-225B、雙路第四代英特爾至強可擴展處理器的浪潮信息 AI 伺服器 NF5698G7;新華三則宣布即将适配 Gaudi 2,打造專為大模型訓練的智能算力伺服器 H3C UniServer R5500 G6,算力提升 3 倍,GPT-4 訓練時間縮短 70%。
對于英特爾來説,推出中國定制版 AI 處理器,意味着英特爾在中國市場也在全力争取客户。2022 年,中國區營收在英特爾總營收中占比約為 27%。
英特爾數據中心與人工智能集團副總裁兼中國區總經理陳葆立表示,在将 Gaudi 2 從海外引進中國的數月中,英特爾亦針對時下大模型熱潮進行了軟體層面的迭代優化。該公司稱,計劃在 2024 年發布采用台積電 5 納米工藝的下一代 Gaudi 3 產品,并将在符合美國出口限制政策的前提下,繼續推出針對中國市場的定制版本。
" 英特爾正在降低人工智能的準入門檻,并強化客户在雲端通過網絡和智能邊緣部署這一關鍵業務技術的能力,從而幫助構建中國人工智能的未來。" 英特爾執行副總裁、數據中心與人工智能事業部總經理 Sandra Rivera 説。
圖源:英特爾
由 ChatGPT 引發的大模型熱潮中,提供底層算力的 AI 芯片被視作必争之地。目前在這一領網域,英偉達(NVDA.NASDAQ)占據絕對主導地位,其 A100 和 H100,是 GPU 同類產品中的佼佼者,為中國主流數據中心、雲服務廠商所熟悉。
因此,Gaudi 2 被市場看作英特爾挑戰英偉達的又一力作。
在發布會現場,英特爾毫不避諱将 Gaudi 2 與英偉達的同類產品進行正面較量。據介紹,Gaudi 2 運行 ResNet-50 的每瓦性能約是英偉達 A100 的 2 倍,性價比相較于 AWS 雲中基于英偉達的解決方案高出 40%,并預計今年 9 月性價比超越英偉達最新 H100。
Gaudi 2 作為一款專用 AI 加速芯片,相比英偉達的通用 GPU A100 和 H100,其伺服器成本更低,價格優勢也更為明顯。不過,Habana Labs 首席運營官 Eitan Medina 也坦承,Gaudi 2 在性能上落後于目前英偉達最高端的 H100 芯片。
" 對于包含整個 GPT-3 語料庫的代表性切片的 GPT-3 訓練評估,Gaudi 2 在 384 個加速器上訓練 GPT-3 的時間為 311 分鍾,Nvidia 在 512 個 H100 GPU 上的訓時間則為 64 分鍾。這意味着,基于 GPT-3 模型,每個 H100 的性能領先于 Gaudi 2 3.6 倍。性價比是影響 H100 和 Gaudi 2 相對價值的一個重要考量因素。Gaudi 2 伺服器的成本要比 H100 低得多。Gaudi 2 的價格優勢大大縮小了與 H100 的性價比差距。"Eitan Medina 在接受媒體采訪時如是説。
除了性能表現,CUDA(Compute Unified Device Architecture)生态一直是英特爾的強項。Sandra Rivera 在接受媒體采訪時表示,在 AI 運算中,确實很多人使用 CUDA,但在最近的大模型領網域,大部分開發者并不會打底層開發,而是在較高的框架層面做創新。Eitan Medina 則補充,Gaudi 2 已是第二代產品,有數年的軟體積累,底層軟體庫已經開發完備。" 我們希望讓開發者能夠在最上層 20% 的比例中做開發,這裏的開發和 CUDA 并沒有那麼直接的關聯。" 他説。
不僅是英特爾,越來越多的 AI 芯片廠商加入 GPU 芯片競争,試圖挑戰 " 擂主 " 英偉達,其中不乏燧原科技、墨芯、沐曦等國内初創企業。在此前舉辦的世界人工智能大會(WAIC)上,燧原科技等初創企業也展示了各自的造芯能力。
另據摩根士丹利分析師的估計,今年 AI 芯片市場的年銷售額将達到 430 億美元左右。而在四年内,AI 芯片收入将達到 1250 億美元。對于英偉達的市場争奪,Sandra Rivera 強調,市場需要替代品。" 他們(客户)非常歡迎英特爾在向大眾部署 AI 方面發揮重要的領導作用。" 他説。