今天小编分享的科技经验:英特尔向英伟达宣战!推出AI芯片Gaudi 2专供中国,老牌芯片巨头胜算几何?,欢迎阅读。
本文来源:时代周报 作者:梁春富
今年以来,全球大模型创业热潮引发算力需求猛增,英伟达 H100、A100 等用于大模型训练的 AI 芯片走俏。而作为 AI 芯片的主战场之一,中国市场备受芯片巨头关注。
7 月 11 日,英特尔(INTC.NASDAQ)在发布会上推出面向中国市场的第二代深度学习加速器—— Habana® Gaudi®2(下称 "Gaudi 2")。该产品是一款 ASIC(专用集成电路)芯片,由英特尔 Habana 团队设计,采用台积电 7 纳米工艺。Habana 是英特尔在 2019 年斥资 20 亿美元收购的以色列 AI 芯片初创企业。
Habana® Gaudi®2 深度学习加速器,图源:英特尔
Gaudi 2 去年于海外发布,此次是针对中国市场推出的定制版本。在性能和配置上,该芯片集成了 24 个可编程 Tensor 处理器核心(TPCs),配置 21 个 Gbps 以太网接口,内存和缓存提高到 96GB HBM2e 和 48MB SRAM,内存带宽升为 2.4TB/s 等。
时代周报记者从英特尔获得的资料显示,在测试 GPT-3 时,Gaudi 2 也表现出了强劲性能,在 384 个加速器上训练时间达 311 分钟,从 256 个加速器到 384 个加速器实现了近线性 95% 的扩展。这使得 Gaudi 2 是除了英伟达产品外,唯一能把 MLPerf GPT 3.0 模型跑起来的芯片。
英特尔还透露,Gaudi 2 国内首批将与百度智能云、浪潮信息、美团、紫光新华三等公司合作。其中,浪潮信息在发布会现场发布了基于 8 颗 Gaudi 2 加速卡 HL-225B、双路第四代英特尔至强可扩展处理器的浪潮信息 AI 伺服器 NF5698G7;新华三则宣布即将适配 Gaudi 2,打造专为大模型训练的智能算力伺服器 H3C UniServer R5500 G6,算力提升 3 倍,GPT-4 训练时间缩短 70%。
对于英特尔来说,推出中国定制版 AI 处理器,意味着英特尔在中国市场也在全力争取客户。2022 年,中国区营收在英特尔总营收中占比约为 27%。
英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立表示,在将 Gaudi 2 从海外引进中国的数月中,英特尔亦针对时下大模型热潮进行了軟體层面的迭代优化。该公司称,计划在 2024 年发布采用台积电 5 纳米工艺的下一代 Gaudi 3 产品,并将在符合美国出口限制政策的前提下,继续推出针对中国市场的定制版本。
" 英特尔正在降低人工智能的准入门槛,并强化客户在云端通过网络和智能边缘部署这一关键业务技术的能力,从而帮助构建中国人工智能的未来。" 英特尔执行副总裁、数据中心与人工智能事业部总经理 Sandra Rivera 说。
图源:英特尔
由 ChatGPT 引发的大模型热潮中,提供底层算力的 AI 芯片被视作必争之地。目前在这一领網域,英伟达(NVDA.NASDAQ)占据绝对主导地位,其 A100 和 H100,是 GPU 同类产品中的佼佼者,为中国主流数据中心、云服务厂商所熟悉。
因此,Gaudi 2 被市场看作英特尔挑战英伟达的又一力作。
在发布会现场,英特尔毫不避讳将 Gaudi 2 与英伟达的同类产品进行正面较量。据介绍,Gaudi 2 运行 ResNet-50 的每瓦性能约是英伟达 A100 的 2 倍,性价比相较于 AWS 云中基于英伟达的解决方案高出 40%,并预计今年 9 月性价比超越英伟达最新 H100。
Gaudi 2 作为一款专用 AI 加速芯片,相比英伟达的通用 GPU A100 和 H100,其伺服器成本更低,价格优势也更为明显。不过,Habana Labs 首席运营官 Eitan Medina 也坦承,Gaudi 2 在性能上落后于目前英伟达最高端的 H100 芯片。
" 对于包含整个 GPT-3 语料库的代表性切片的 GPT-3 训练评估,Gaudi 2 在 384 个加速器上训练 GPT-3 的时间为 311 分钟,Nvidia 在 512 个 H100 GPU 上的训时间则为 64 分钟。这意味着,基于 GPT-3 模型,每个 H100 的性能领先于 Gaudi 2 3.6 倍。性价比是影响 H100 和 Gaudi 2 相对价值的一个重要考量因素。Gaudi 2 伺服器的成本要比 H100 低得多。Gaudi 2 的价格优势大大缩小了与 H100 的性价比差距。"Eitan Medina 在接受媒体采访时如是说。
除了性能表现,CUDA(Compute Unified Device Architecture)生态一直是英特尔的强项。Sandra Rivera 在接受媒体采访时表示,在 AI 运算中,确实很多人使用 CUDA,但在最近的大模型领網域,大部分开发者并不会打底层开发,而是在较高的框架层面做创新。Eitan Medina 则补充,Gaudi 2 已是第二代产品,有数年的軟體积累,底层軟體库已经开发完备。" 我们希望让开发者能够在最上层 20% 的比例中做开发,这里的开发和 CUDA 并没有那么直接的关联。" 他说。
不仅是英特尔,越来越多的 AI 芯片厂商加入 GPU 芯片竞争,试图挑战 " 擂主 " 英伟达,其中不乏燧原科技、墨芯、沐曦等国内初创企业。在此前举办的世界人工智能大会(WAIC)上,燧原科技等初创企业也展示了各自的造芯能力。
另据摩根士丹利分析师的估计,今年 AI 芯片市场的年销售额将达到 430 亿美元左右。而在四年内,AI 芯片收入将达到 1250 亿美元。对于英伟达的市场争夺,Sandra Rivera 强调,市场需要替代品。" 他们(客户)非常欢迎英特尔在向大众部署 AI 方面发挥重要的领导作用。" 他说。