今天小编分享的科技经验:英伟达GTC大会,给AI浇了一盆冷水?,欢迎阅读。
文 | 硅基研究室,作者 | 白嘉嘉
北京时间 3 月 19 日凌晨 4 点,黄仁勋身着标志性的黑色皮衣匆匆登台,拉开了本次英伟达 GTC 2024 大会序幕。
对黄仁勋来说,「超预期」是必须要在本次 GTC 实现的一项任务。过去一年时间里,英伟达因为卖水人的身份赚得盆满钵满,但接近垄断的市场地位和颇具攻击性的业务布局,也让一些同行或客户感到危险,纷纷开启了自研芯片、扶持 AMD 等竞争对手,以及打破 CUDA 生态等一系列计划。
显然,如果英伟达想要继续坐稳 AI 时代的铁王座,黄仁勋就需要用拿出具有统治力的新产品和新业务来证明这些挑战的不堪一击。
而对投资人而言,他们更关注的是本届 GTC 能否继续向 AI 概念里注入新的想象力。虽然今天已经很少有人将 AI 视作泡沫,在科技巨头的财报中 AI 也逐渐兑现业绩,但它们已经涨上天的估值依旧让人担心,知名华尔街分析师木头姐甚至将英伟达比作思科,预言它很快将股价腰斩并一蹶不振。
担忧会成真吗?从结果来看,忧喜参半。
喜的一面在于,黄仁勋描绘的 AI 蓝图仍有吸引力,从硬體向 AI 軟體乃至世界模拟器攀登,英伟达的野心大得让人咂舌。
但市场似乎并不愿意咬下这口大饼,盘后股价持续下跌,截止发稿,跌幅已达 1.77%。
"Hopper 很棒,但我们需要更大的 GPU。"
在本次 GTC 上,黄仁勋新推出的所有硬體产品,都围绕 Blackwell 构架展开,包括独立的 Blackwell GPU、GB200 Superchip、DGX SuperPOD。
Blackwell 的名称来源于美国首位黑人院士 David Harold Blackwell,他创立的「Rao-Blackwell」定理是现代统计学的基础性概念。
这款芯片也如它背后的象征那样,承担着在算力需求越来越旺盛的 AI 时代,成为解释、研究世界的基础硬體的任务。
GB200 是 Blackwell 系列的第一款芯片,它拥有 2080 亿个晶体管,采用定制的两掩模版极限 4NP TSMC 工艺制造,可提高大量处理能力,每秒能进行 20Pflops 浮点运算。
与前一代芯片 H100 相比,「大」是 Blackwell 系列芯片最直观的特点。
将 GB200 与 H100 放在一起对比,能明显看到前者大了一圈。多出来的体积让 Blackwell 系列芯片得以容纳更多的晶体管,并带来了更高的运算速度。
具体来说,GB200 的 2080 亿晶体管数量是 H100 的 2.5 倍,浮点运算速度提升 5 倍,如果专门针对 LLM 推理,性能提升幅度将来到 30 倍。
"Hopper 很好,但我们需要更大的 GPU",为了防止手中的 H100 感到自卑,黄仁勋专门停下演讲安慰了它一会儿。
除了「大」之外,黄仁勋还列出了另外几个使它脱颖而出的因素。
首先是第五代 NVLink,它能为每个 GPU 提供 1.8TB/s 的双向吞吐量,确保今天最复杂的 LLM 在 576 个 GPU 之间实现无缝高速通信。
其次,Blackwell 采用第二代 Transformer Engine(变压器引擎)。Transformer Engine 配备了新的微张量缩放支持和先进的动态范围管理算法,通过创新的 4 位浮 AI 推理功能使计算和模型大小加倍。
最后英伟达还引入了一些 AI 安全功能,包括包括机密计算功能和 RAS(可靠性、可用性和可服务性)引擎,以确保其数据中心 GPU 的正常运行时间最大化。
与此同时,虽然本次大会演讲中黄仁勋没有直说,但 GB200 NVL72 与用于推理用途的相同数量的 H100 Tensor Core 相比能耗减少 25 倍的数据,仍让那句标志性的 " 买得越多,省得越多 " 呼之欲出。
和之前的 Hopper GPU 一样,Blackwell GPU 将作为独立 GPU 提供,或者将两个 Blackwell GPU 组合,并与英伟达的 Grace CPU 配对,搭建 GB200 Superchip。
除了 Blackwell 和 Grace Blackwell 芯片,英伟达还推出了采用了液冷的 DGX SuperPOD 超级计算机系统。
DGX SuperPOD 由 8 个或更多 GB200 组成,其中包括 36 个 GB200 Superchips,可以按需配置作为单台计算机运行。英伟达表示,如果客户需要拓展 SuperPOD,最高可以支持数万个 GB200 Superchips。
硬體不是这届 GTC 大会的全部,正如英伟达深度学习研究副总裁 Bryan Catanzaro 此前所表达的,虽然英伟达被称为硬體公司,但軟體形成的护城河同样不容小觑。
" 很多人不知道这一点,但英伟达的軟體工程师比硬體工程师还多。" 他说。
这次 GTC 大会的后一个小时,黄仁勋几乎把所有时间都花在了介绍 Omniverse 和 NIM 上。
简单来说,前者是一个旨在开发、部署和管理 3D 应用程式的云平台,该平台能够构建数字孪生。
而后者,是英伟达为了让企业更方便地入驻 Omniverse 而推出的新服务——生成式 AI 微服务(NIM)。
通过这些微服务,企业可以在自己的平台上创建和部署自定义应用程式,同时保留对其知识产权的完全所有权和控制权。
Omniverse 和微服务(MIN)一同组成了英伟达打开机器人领網域的钥匙。黄仁勋在视频中演示了一个人类与机器人协同合作的虚拟仓库。虽然视频中的工人看起来有些僵硬,但这幅关于未来工业如何运作的画面,仍帮他拿到了西门子的订单。
AI 的轉捩點,来了?
如前文所说,无论是对英伟达自身,还是整个 AI 行业,本次 GTC 大会都扮演着关键角色。因此有 3 个问题至关重要:
首先是 Blackwell 系列芯片及軟體生态,能不能挽回那些起了异心的买家?
这个问题的答案是不确定的。
一方面,与市面上现有的 GPU 产品对比,GB200 展现出了足够优越的性能。尤其是大模型训练热潮告一段落,AI 企业相继进入商业落地阶段后,眼下推理所占算力需求比重逐渐上升,云厂商必定会大量采购 GB200。
目前,微软和亚马逊都已经宣布将与英伟达展开进一步的合作。
微软 CEO 纳德拉在一份声明中表示:" 通过将 GB200 Grace Blackwell 处理器引入我们全球的数据中心,我们正在为我们的云优化英伟达 GPU 的悠久历史奠定基础,同时我们也为世界各地的组织兑现了 AI 的承诺。"
亚马逊 AWS 同样宣布计划为寻求高级生成式 AI 功能的客户提供 GB200 Grace Blackwell Superchip 和 B100 Tensor Core GPU。
但另一方面,受限于芯片链条长,扩产周期慢,Blackwell 系列芯片很有可能会和当初 H100 一样受限于产能困境,同时新版本芯片和旧版本芯片形成替代,中国市场的疲软,此消彼长下,英伟达能否持续保持高增长,无疑需要打上一个问号。
与此同时,即便芯片性能没有英伟达优越,科技巨头们自研芯片可能也是更划算的方案。
此前,《财新》在一篇报道中透露,哪怕花英伟达同样的成本,只要做出十分之一的效果,这些科技厂商便已经有利可图。更具体的案例是,按照谷歌的报价,使用其最新的 AI 芯片 TPUv5e 在训练、推理参数少于 2000 亿的大模型时,成本低于用 A100 或 H100。
整体来说,按照英伟达此前以数据中心为主的业务结构,GB200 固然能带来性能优势,但短期来看对业绩增幅可能有限。
那么,本次 GTC 大会中究竟有没有涌现出能继续支撑英伟达业绩高增的新场景?
从黄仁勋的演讲来看,英伟达最理想的发展路径,是从硬體公司更新成 AI 全链条服务公司。而生物领網域则是他在这个方向上竖起的路标。
黄仁勋曾在多个场合表示生物领網域将是未来的主导学科,本次演讲中也花了大量时间来介绍英伟达軟體生态在这一领網域的成就。
目前市面上涌现出了大量尝试将 AI 与生物研究、制药相结合的项目和企业,但大多停留在概念层面。
此前曾有美国普渡大学 AI 领網域 PHD 向「硅基研究室」透露,Domain Adaptation(领網域迁移)是目前摆在医疗 AI 面前最主要的难关之一。他举例,以 X 光为代表精密仪器在不同医院、不同操作者手中形成的数据存在显著差异,很难形成标准化,甚至同一个 Program 对于不同种族的诊断准确率差距也很大。
而英伟达目前的布局主要集中在有机物研究,分子建模领網域,从理论到商业落地之间的距离更是遥遥无期。或许从价值投资的角度来看,这是一个确定性十足的领網域,但置身眼下的 AI 热潮,仍不够「诱人」。
相比之下,人形机器人可能是更近的业绩增量。黄仁勋像钢铁侠一样站在一排人形机器人中央时,也确实在大会现场掀起了短暂的高潮。
但可惜的是,与日前火遍全网的 OpenAI、Figure 合作推出的 Figure 01 相比,来到 GTC 现场的机器人并没有展现出让人眼前一亮的能力,不由让人怀疑这些机器人的智能化程度。
即便从量产的角度出发,与背靠汽车流水线的特斯拉相比,英伟达似乎也很难通过迭代芯片将人形机器人的价格推至市场化的门槛。
看上去,AI 时代的卖水人似乎和大多数 AI 企业一样面临着如何将 AI 商业化落地的困窘。不过这也很好理解,当市场从 AI 概念的狂热中恢复冷静,所有此前受益的玩家都要经受泡沫破裂的风险。
有了前两个问题做铺垫,第三个问题的答案已经呼之欲出。
英伟达在 GTC 上的新动作能不能给市场描绘出更有吸引力的 AI 故事?显然大多数人并没有因此更加兴奋。
GTC 大会召开前,英伟达、谷歌、微软、Meta 股价分别上涨 0.7%、4.44%、0.22%、2.66%,但大会召开后,盘后价格均出现了不同程度的下跌,其中英伟达下跌 1.77%。
显然,即便在大洋彼岸,人们也不再被 AI 的问答、做图、做视频等功能所满足,黄仁勋和其它科技巨头一再宣传的「世界模型」,只有实实在在出现在现实世界,并且产生一些有意义的影响,才会有人继续为此买单。
但对身处 AI 行业的从业者来说,本届 GTC 大会或许也给予它们一个启示:加快步伐研究更先进的大模型,还是花更多时间来思考如何让自己的产品落地。
两种选择都充满风险,前者有可能因为越来越难融资而失败,后者则意味着有可能被迭代后更先进的大模型顺手碾压。
毕竟,这样的事情不止发生过一次,也不会是最后一次。