今天小編分享的财經經驗:英特爾披露5nm“中國特供版”AI 芯片,性能或暴降92%,最快6月推出,歡迎閱讀。
英特爾 Gaudi 3 AI 芯片(圖片來源:Intel 官網)
關于英特爾 Gaudi 3 的 " 中國特供版 " AI 芯片有了新進展。
钛媒體 App 4 月 15 日消息,芯片巨頭英特爾(Intel)日前在官網發布一份 24 頁的 "Gaudi 3 AI 加速器白皮書 " 中披露,英特爾将推出 Gaudi 3 在中國發售的兩款 " 特供版 "AI 芯片產品。
具體包括兩種硬體形态加速卡:一款型号為 HL-328 的 OAM 兼容夾層卡(Mezzanine Card),預計将于今年 6 月 24 日推出;另一款是型号為 HL-388 的 PCle 加速卡,預計将于今年 9 月 24 日推出。而基于内核數量、工作頻率、TDP 等參數估算,相比 Gaudi 3 國際版," 中國特供版 "HL-328 芯片性能或降低約 92% 左右。
早前 4 月 9 日舉行的美國 Intel Vision 2024 會議上,英特爾發布新一代 Gaudi 3 AI 加速芯片,采用台積電 5nm 工藝,帶來 4 倍(400%)的 BF16 AI 計算能力提升。同時,相比英偉達 H100 GPU,英特爾 Gaudi 3 AI 芯片的模型訓練速度提升 40%,推理速度提升 50%,平均性能提高 50%,能效平均提高 40%,但成本卻僅為 H100 的一小部分。
對于 Gaudi 3 中國特供版消息,钛媒體 App 已向英特爾美國總部發送郵件詢問更多詳細信息,但截至發稿前,英特爾方面并未回復。
據悉,過去一段時間,美國政府不斷更新對華半導體、AI 芯片等領網域的出口管制。
2022 年 8 月 9 日,美國總統拜登籤署總額高達 2800 億美元的《芯片和科學法案》(以下簡稱 " 芯片法案 "),通過 527 億美元的巨額產業補貼和遏制競争的條款,推動芯片制造 " 回流 " 美國本土。該法案禁止獲得補貼的美國及其盟友夥伴的企業 10 年内在中國和其他關切的國家新建或擴大先進制程芯片廠。
2022 年 10 月 7 日、2023 年 10 月 17 日,美國商務部工業和安全局(BIS)連續兩次發布對中國的先進半導體和計算設備的出口管制,旨在阻止中國進口 AI 半導體產品。同時,英偉達、AMD、英特爾的多款 GPU 和 AI 芯片產品已不能再出口到中國,就連高端遊戲顯卡 RTX 4090 都受到了限制。
2023 年 12 月,美國商務部 BIS 宣布啟動對成熟制程節點的半導體供應鏈展開調查,劍指中國芯片半導體產業。
2024 年 3 月 29 日,BIS 更新出口限制措施,其中包括美國對中國出口的 AI 半導體產品将采取 " 逐案審查 "(case-by-case review)政策規則,包括技術級别、客戶身份、合規計劃等信息全面查驗,以及部分 AI PC 芯片或納入到出口管制措施當中,更大範圍限制英偉達、AMD 等先進 AI 芯片和半導體設備向中國銷售,4 月 4 日全面生效。
4 月 11 日,美國商務部在 " 聯合公報 "(Federal Register)上更新了最新的實體清單(Entity List),将 6 家中國企業列入 " 實體清單 ",其中包括英偉達在中國的最大 AI 芯片經銷商思騰合力(天津)科技有限公司(SITONHOLY ( Tianjin ) Co., Ltd.)。
事實上,在美國 BIS 第一輪出口管制下,早在 2023 年 7 月,英特爾就曾發布基于 7nm 制程的 " 中國特供版 "AI 芯片 Gaudi2。相比國際版 Gaudi2,面向中國市場推出的加速卡在性能上差别不大,而集成以太網 RDMA 端口數量從 24 個端口減到 21 個,以符合美國芯片出口管制規定。(詳見钛媒體 App 前文:《英特爾發布中國特供版 7nm AI 芯片 Gaudi2,減少 RDMA 接口以符合出口管制規定》)
然而,钛媒體 App 了解到,英特爾 Gaudi 2 中國特供版僅銷售幾十張 OAM 產品。自去年 BIS 1017 新規更新後,由于英特爾 Gaudi 2" 中國特供版 " 產品性能高于出口管制措施,最終導致其產品再也沒能繼續銷往中國市場。
基于此,去年 12 月前後,英特爾曾嘗試研發 Gaudi 2 HL-225B 變體,内部稱 Gaudi 2C AI 芯片,希望重新獲得銷往中國大陸的許可,但最後卻等到今年 3 月 BIS 公布更新出口限制措施。
4 月 10 日發布 Gaudi 3 之後,英特爾重新研發特供版產品,希望讓 5nm Gaudi 3 AI 芯片未來全力争奪中國市場,旨在為 AI 和雲客戶提供英偉達產品的 " 替代選擇 "。
具體硬體規格方面,中國特供版的 Gaudi 3 與原版相比,具有相同的 96MB SRAM 片上内存, 128GB HBM2e 高帶寬内存,帶寬為 3.7TB/s,擁有 PCIe 5.0 x16 接口和解碼标準。但是,由于美國對于 AI 芯片的出口管制規則限制,使得這類高性能 AI 的綜合運算性能(TPP)需要低于 4800 才能出口到中國, 這意味中國特供版的 Gaudi 3 的 16bit 性能不能超過 150 TFLOPS。
相比 Gaudi 3 國際版達到的 1835 TFLOPS(FP16/BF16),中國特供版 Gaudi 3 需要大幅削減内核數量和工作頻率,最終可能需要其 AI 性能降低約 92%,才能符合美國的出口管制要求。
同時,由于中國特供版 Gaudi 3 產品的 AI 性能降低,這也将使得其 TDP(熱設計功耗)大幅降低,預計 OAM 卡和 PCIe 卡的 TDP 均為 450 瓦,而原版 PCIe 卡(HL-338)的 TDP 高達 600 瓦,原版 OAM 卡(HL-325L、HL-335)的 TDP 更是高達 900 瓦。
整體來說,英特爾專為中國市場推出的 " 特供版 "Gaudi 3 兩款產品的 AI 性能,或将與英偉達 " 中國特供版 "AI 加速卡 H20 水平相當,後者比 H100 的整體性能降低 80% 左右,達 148 TFLOPS 的 FP16/BF16 性能,略低于出口管制的 150 TFLOPS 的限制。
目前,英偉達 H20 AI 芯片已經向中國大陸客戶送樣,但國内百度、阿裡等 AI 龍頭對其反響平平。有行業人士對钛媒體 App 表示,主要原因是 H20 性能太低、價格太高,企業購買意願降低了。
美國商務部長雷蒙多(Gina Raimondo)早前在一場公開論壇中表示,美國絕不能讓中國得到這些最尖端的芯片,絕不能讓中國芯片技術趕超美國。美國政府不允許英偉達向中國出售 " 最復雜、處理能力最高 " 的 AI 芯片,以防中國有能力訓練前沿 AI 模型。
此外,有消息稱,美國政府還正在制定一份禁止接收關鍵工具的中國先進芯片制造工廠名單,以便美國企業更容易阻止技術流入中國,這份名單可能會在未來幾個月内公布。同時,美國正向包括荷蘭、日本、德國和韓國在内的盟友施壓加碼,要求它們進一步收緊對中國獲得半導體技術的限制措施。
針對于美方行動,外交部發言人毛寧在 4 月 11 日表示," 我們堅決反對美方濫用實體清單等出口管制工具遏制打壓中國企業,敦促美方停止将經貿科技問題政治化、工具化、武器化。中方将采取必要措施堅決維護中國企業的合法權益。"
(本文首發钛媒體 App,作者|林志佳)