今天小编分享的科技经验:继续狙击英伟达, AMD子弹已上膛,欢迎阅读。
作者丨邱晓芬
编辑丨苏建勋
10 月 10 日,一年一度的 Advancing AI 大会上,美国芯片巨头 AMD 发布了一系列重磅的芯片产品更新,覆盖 AI PC 的处理器、EPYC 处理器、DPU 等等。
在英伟达最新的 Blackwell 芯片面临交付困境的当下,AMD 最新的 GPU 产品系列(AMD Instinct MI325X)将如何出牌,直接关系到 AMD 的未来,自然成为各界的关注焦点。
在参数上猛追英伟达,是 AMD MI 系列一以贯之的打法,此次的 AMD Instinct MI325X 芯片也不例外,选择紧密对标英伟达上一代芯片产品 H200。
不过,好消息是,从产品信息来看,AMD 如今逐渐找到了差异化竞争的策略—— AMD 这款产品逐渐把精力都放在了提升内存、推理能力上。
AMD 创始人苏姿丰发布 AMD Instinct MI325X 系列芯片
首先,AMD Instinct MI325X 上配备了 256GB 的 HBM3E 高带宽内存,提供了 6TB/s 的内存带宽——参数上比英伟达 H200 大许多(H200 分别是 141G、4.8TB/s)。
其次,尽管 AMD 这款产品在 FP16(16 位浮点数)上的算力没有英伟达那么强,但推理能力却比英伟达 H200 整体高出 20%-40%。
重仓推理,不失为一项明智之举。一位行业人士向 36 氪表示,今年算力中心的一大趋势是,随着部分大模型厂商逐渐放下预训练,推理和模型微调的诉求增加。
" 某算力中心客户,去年预训练和推理的比例是 7:3,今年完全反过来了 "。下游大模型、应用厂商的需求变化,上游芯片厂商更需要及时做好策略转向。
不过,只有单芯片的差异化竞争是远远不够的。AMD 此次也从体系化入手,弥补在连接、軟體生态上的短板。而这也正是英伟达的壁垒最高处。
英伟达产品的一大优势是,依靠 NV-Link,使得多个单芯片连接起来之后依旧强大,不因芯片互联传递而折损算力。而此次,AMD 则依靠他们的 Infinity Fabric 互连技术,使得多卡的效果比单兵作战更强。
据介绍,当 8 张 AMD Instinct MI325X 搭配在一起时,相比于同样数量级的英伟达(即 H200 HGX),内存是其 1.8 倍、内存带宽是其 1.3 倍、算力更是其 1.3 倍。
在軟體生态方面,AMD 也持续补短板。AMD 的軟體平台 ROCm 通过持续调教、以及与多个 AI 开发平台深度合作,不仅不会拖后腿,反而提升了整体效率。
经过 AMD 方面的实测,当跑 Meta Llama-2 模型时,AMD MI325X 单卡在 ROCm 的加持下,训练效率超过了英伟达 H200。而若用 AMD 的 8 卡集群跑,训练效率仍也与 H200 HGX 相当。
在此前的台北电腦展上,AMD 创始人苏姿丰已经明确,GPU 产品节奏向英伟达看齐,要" 一年一更新"。AMD 除了发布 Instinct MI325X 系列之外,也顺便透露了未来产品的情况——
据其介绍,AMD 下一代芯片 Instinct MI350 系列将在明年下半年推出,同样延续了这一代的产品逻辑,推理性能将有 35 倍提升、提供 288GB 的 HBM3E 内存,峰值算力提升 1.8 倍,与英伟达 B200 的算力持平。
在逐渐明确了产品打法、发布节奏后,AMD 2024 年在数据中心领網域大有高歌猛进趋势。
苏姿丰此前透露,AMD 已经拿下了上百家 AI 客户和 OEM 厂商的订单。其在数据中心伺服器的份额,也从早前可怜的个位数,上升到如今的 30% 左右。
财报数据正是最好的说明。7 月份,AMD 方面公布的信息显示,今年第二季度的数据中心业务收入达到了 28 亿美元,虽然相比于英伟达,数据还有很大差距(226 亿美元),但同比大增 115%,也是 AMD 所有业务中增速最快的一项。
AMD 在数据中心领網域的突围,其实是多项因素的综合作用——除了 AMD 上一代产品(MI300 系列)找对了打法,成为 AMD 有史以来的爆款产品之外,还要叠加智算中心市场整体的大爆发,以及一丝对手失误的因素。
在去年一整年,英伟达的 GPU 产品受困于产能,交货周期达到惊人的 8-11 个月。供应问题,直到 2024 年第一季度才有所缓解,但客户依旧需要等待漫长的 3 个月。
而好景不长,当英伟达的 H 系列今年终于顺利进入出货高峰后,其最新的 Blackwell 系列芯片产品又陷入新一轮交付难题。
综合多方信息显示,英伟达原定于今年三季度排产的全新 Blackwell 系列芯片,因为芯片设计缺陷,导致稳定性不足,又遇到供应链封装良率不高等原因,整体往后又推迟了一个季度。
当对手持续受困于生产、设计难题,AMD 的产品自然成为弥补算力缺口的一项最佳选择。
不过,英伟达也担心错失市场机遇,把蛋糕拱手让人,也在努力摆脱延期的阴霾。
在 AMD 大会的同期,摩根士丹利为英伟达办了一场为期三天的非交易路演。路演上着重向投资人传递的信息是—— Blackwell 的难题已经解决, 需求大热,英伟达 "已经把未来一年内的芯片全部卖光"。
黄仁勋此前也多次在公开场合暗示这一点,提示 " 这颗芯片正是每个客户都想拥有最多的产品,大家都想当第一个收到货的人 "。
对于 AMD 来说,这可能算不上是好消息。随着对手产能的阴霾散去,幸运的是,AMD 也逐渐找到适合自己的竞争节奏。2025 年,两家芯片巨头,在 GPU 领網域又再一次回归正面战场,这才是考验双方真正综合实力的关键一年。
延伸阅读:
《AMD 发布锐龙 AI PRO 300 系列移动商用处理器,为 AI PC" 再添把火 " | 最前线》
end