今天小编分享的财经经验:英特尔披露5nm“中国特供版”AI 芯片,性能或暴降92%,最快6月推出,欢迎阅读。
英特尔 Gaudi 3 AI 芯片(图片来源:Intel 官网)
关于英特尔 Gaudi 3 的 " 中国特供版 " AI 芯片有了新进展。
钛媒体 App 4 月 15 日消息,芯片巨头英特尔(Intel)日前在官网发布一份 24 页的 "Gaudi 3 AI 加速器白皮书 " 中披露,英特尔将推出 Gaudi 3 在中国发售的两款 " 特供版 "AI 芯片产品。
具体包括两种硬體形态加速卡:一款型号为 HL-328 的 OAM 兼容夹层卡(Mezzanine Card),预计将于今年 6 月 24 日推出;另一款是型号为 HL-388 的 PCle 加速卡,预计将于今年 9 月 24 日推出。而基于内核数量、工作频率、TDP 等参数估算,相比 Gaudi 3 国际版," 中国特供版 "HL-328 芯片性能或降低约 92% 左右。
早前 4 月 9 日举行的美国 Intel Vision 2024 会议上,英特尔发布新一代 Gaudi 3 AI 加速芯片,采用台积电 5nm 工艺,带来 4 倍(400%)的 BF16 AI 计算能力提升。同时,相比英伟达 H100 GPU,英特尔 Gaudi 3 AI 芯片的模型训练速度提升 40%,推理速度提升 50%,平均性能提高 50%,能效平均提高 40%,但成本却仅为 H100 的一小部分。
对于 Gaudi 3 中国特供版消息,钛媒体 App 已向英特尔美国总部发送邮件询问更多详细信息,但截至发稿前,英特尔方面并未回复。
据悉,过去一段时间,美国政府不断更新对华半导体、AI 芯片等领網域的出口管制。
2022 年 8 月 9 日,美国总统拜登签署总额高达 2800 亿美元的《芯片和科学法案》(以下简称 " 芯片法案 "),通过 527 亿美元的巨额产业补贴和遏制竞争的条款,推动芯片制造 " 回流 " 美国本土。该法案禁止获得补贴的美国及其盟友伙伴的企业 10 年内在中国和其他关切的国家新建或扩大先进制程芯片厂。
2022 年 10 月 7 日、2023 年 10 月 17 日,美国商务部工业和安全局(BIS)连续两次发布对中国的先进半导体和计算设备的出口管制,旨在阻止中国进口 AI 半导体产品。同时,英伟达、AMD、英特尔的多款 GPU 和 AI 芯片产品已不能再出口到中国,就连高端游戏显卡 RTX 4090 都受到了限制。
2023 年 12 月,美国商务部 BIS 宣布启动对成熟制程节点的半导体供应链展开调查,剑指中国芯片半导体产业。
2024 年 3 月 29 日,BIS 更新出口限制措施,其中包括美国对中国出口的 AI 半导体产品将采取 " 逐案审查 "(case-by-case review)政策规则,包括技术级别、客户身份、合规计划等信息全面查验,以及部分 AI PC 芯片或纳入到出口管制措施当中,更大范围限制英伟达、AMD 等先进 AI 芯片和半导体设备向中国销售,4 月 4 日全面生效。
4 月 11 日,美国商务部在 " 联合公报 "(Federal Register)上更新了最新的实体清单(Entity List),将 6 家中国企业列入 " 实体清单 ",其中包括英伟达在中国的最大 AI 芯片经销商思腾合力(天津)科技有限公司(SITONHOLY ( Tianjin ) Co., Ltd.)。
事实上,在美国 BIS 第一轮出口管制下,早在 2023 年 7 月,英特尔就曾发布基于 7nm 制程的 " 中国特供版 "AI 芯片 Gaudi2。相比国际版 Gaudi2,面向中国市场推出的加速卡在性能上差别不大,而集成以太网 RDMA 端口数量从 24 个端口减到 21 个,以符合美国芯片出口管制规定。(详见钛媒体 App 前文:《英特尔发布中国特供版 7nm AI 芯片 Gaudi2,减少 RDMA 接口以符合出口管制规定》)
然而,钛媒体 App 了解到,英特尔 Gaudi 2 中国特供版仅销售几十张 OAM 产品。自去年 BIS 1017 新规更新后,由于英特尔 Gaudi 2" 中国特供版 " 产品性能高于出口管制措施,最终导致其产品再也没能继续销往中国市场。
基于此,去年 12 月前后,英特尔曾尝试研发 Gaudi 2 HL-225B 变体,内部称 Gaudi 2C AI 芯片,希望重新获得销往中国大陆的许可,但最后却等到今年 3 月 BIS 公布更新出口限制措施。
4 月 10 日发布 Gaudi 3 之后,英特尔重新研发特供版产品,希望让 5nm Gaudi 3 AI 芯片未来全力争夺中国市场,旨在为 AI 和云客户提供英伟达产品的 " 替代选择 "。
具体硬體规格方面,中国特供版的 Gaudi 3 与原版相比,具有相同的 96MB SRAM 片上内存, 128GB HBM2e 高带宽内存,带宽为 3.7TB/s,拥有 PCIe 5.0 x16 接口和解码标准。但是,由于美国对于 AI 芯片的出口管制规则限制,使得这类高性能 AI 的综合运算性能(TPP)需要低于 4800 才能出口到中国, 这意味中国特供版的 Gaudi 3 的 16bit 性能不能超过 150 TFLOPS。
相比 Gaudi 3 国际版达到的 1835 TFLOPS(FP16/BF16),中国特供版 Gaudi 3 需要大幅削减内核数量和工作频率,最终可能需要其 AI 性能降低约 92%,才能符合美国的出口管制要求。
同时,由于中国特供版 Gaudi 3 产品的 AI 性能降低,这也将使得其 TDP(热设计功耗)大幅降低,预计 OAM 卡和 PCIe 卡的 TDP 均为 450 瓦,而原版 PCIe 卡(HL-338)的 TDP 高达 600 瓦,原版 OAM 卡(HL-325L、HL-335)的 TDP 更是高达 900 瓦。
整体来说,英特尔专为中国市场推出的 " 特供版 "Gaudi 3 两款产品的 AI 性能,或将与英伟达 " 中国特供版 "AI 加速卡 H20 水平相当,后者比 H100 的整体性能降低 80% 左右,达 148 TFLOPS 的 FP16/BF16 性能,略低于出口管制的 150 TFLOPS 的限制。
目前,英伟达 H20 AI 芯片已经向中国大陆客户送样,但国内百度、阿里等 AI 龙头对其反响平平。有行业人士对钛媒体 App 表示,主要原因是 H20 性能太低、价格太高,企业购买意愿降低了。
美国商务部长雷蒙多(Gina Raimondo)早前在一场公开论坛中表示,美国绝不能让中国得到这些最尖端的芯片,绝不能让中国芯片技术赶超美国。美国政府不允许英伟达向中国出售 " 最复杂、处理能力最高 " 的 AI 芯片,以防中国有能力训练前沿 AI 模型。
此外,有消息称,美国政府还正在制定一份禁止接收关键工具的中国先进芯片制造工厂名单,以便美国企业更容易阻止技术流入中国,这份名单可能会在未来几个月内公布。同时,美国正向包括荷兰、日本、德国和韩国在内的盟友施压加码,要求它们进一步收紧对中国获得半导体技术的限制措施。
针对于美方行动,外交部发言人毛宁在 4 月 11 日表示," 我们坚决反对美方滥用实体清单等出口管制工具遏制打压中国企业,敦促美方停止将经贸科技问题政治化、工具化、武器化。中方将采取必要措施坚决维护中国企业的合法权益。"
(本文首发钛媒体 App,作者|林志佳)