今天小编分享的互联网经验:黄仁勋放大招!,欢迎阅读。
来源:AI 星球,文 / 王非
一年时间,AI 从 iPhone 时刻,来到了变革时刻。
当地时间 3 月 18 日下午(北京时间 3 月 19 日凌晨 4 点),英伟达 CEO 黄仁勋发表 " 见证 AI 的变革时刻 " 的主题演讲,发布了全新 AI 芯片架构 Blackwell,基于该架构的首款 GPU 产品 B200。
基于此,英伟达提供了 GB200、DGX GB200 NVL 72、DGX SuperPOD 超算平台等 " 组合产品 "。
硬體产品之外,英伟达还发布了创造营收的新产品——集成 AI 开发軟體微服务系统 NIM,用以帮助企业快捷部署公司级专有模型。
此外,英伟达还推出了 GR00T 人型机器人项目——人型机器人基础模型,支持通过语言、视频和人类演示,为人形机器人生成行动指令。
值得一提的是,在回顾完英伟达发展历史,正式发布新产品之前,黄仁勋通过一个短片向外界展示了 " 英伟达的灵魂 ",该片是 " 世界上第一场一切都是(AI)自制的音乐会 "。
"God,I love NVIDIA !" 观看完毕,黄仁勋忍不住赞叹。
黄仁勋如此激动兴奋,在于大模型时代,英伟达自身 " 卖铲人 " 的定位,使得该公司 2024 财年营收 609.22 亿美元,同比增长 126%,净利润 297.60 亿美元,同比增长 581%。而这,更是助推其股价在一年来翻了近两倍。
新架构新产品,更快更强
作为英伟达 GTC 大会的重磅环节,黄仁勋宣布推出新一代 GPU Blackwell(致敬统计学家兼数学家大卫 · 哈罗德 · 布莱克威尔),"Hopper(致敬格蕾丝 · 赫柏)固然已经非常出色了,但我们需要更强大的 GPU"。
黄仁勋表示,8 年时间,AI 算力已增长 1000 倍。他认为," 加速计算到达了临界点,通用计算已经过时了。我们需要另一种方式来进行计算,这样我们才能够继续扩展,这样我们才能够继续降低计算成本,这样我们才能够继续进行越来越多的计算。"
据黄仁勋介绍,许多组织预计将采用 Blackwell,如亚马逊网络服务、戴尔、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉、XAI。
在 Blackwell 的支撑下,黄仁勋再次为英伟达更新了 " 核武库 "。
当下 4 nm 制程工艺仍处于瓶颈期,于是英伟达将两个芯片拼接,通过 10 TB/ 秒的带宽互联,组合而成包含 2080 亿晶体管的 B200 GPU,将于今年晚些时候上市。单 GPU AI 性能达 20 PFLOPS(即每秒 2 万万亿次),前代 H100 仅为 4 PFLOPS。B200 的内存 192 GB,基于第五代 NVLink,带宽达到 8 TB/s。
黄仁勋展示两款 GPU,左为新款 Blackwell 架构 B200 芯片
通过搭积木的方式,英伟达还提供了超级芯片 GB200,包含 1 个 Grace CPU+2 个 B200 GPU,通过 900 GB/s 的超低功耗 NVLink 芯片间互连技术连接在一起。而两个 GB200 装到主機板上,就成为了一个 Blackwell 计算节点。
将 18 个 Blackwell 计算节点叠加,则诞生了英伟达 " 新一代计算单元 "DGX GB200 NVL 72,包含 36 个 CPU+72 个 GPU。它们之间由 NVIDIA Quantum-X800 InfiniBand 和 Spectrum ™ -X800 以太网平台连接,可提供速度高达 800Gb/s 的网络。
单独使用的 DGX GB200 NVL 72,其 FP8 精度的 AI 训练性能高达 720 PFLOPs,拥有 1.4 EFlops 的 AI 推理算力和 30 TB 高速内存。与相同数量的 72 个 H100 相比,大模型推理性能提升 30 倍,成本和能耗降低 25 倍。
将 8 个上述 " 新一代计算单元 "Quantum InfiniBand 交换机连接,配合散热系统,则形成了 DGX SuperPOD 超算平台,包含 8 个 " 新一代计算单元 ",即 288 个 CPU+576 个 GPU,内存高达 240 TB,FP4 精度计算性能达到 11.5 EFLOPs(每秒 11.5 百亿亿次)。
此外,英伟达的超算平台,还支持增加额外的机架扩展性能,最终成为包含 32000 GPU 的分布式超算集群。
黄仁勋难掩兴奋," 英伟达 DGX AI 超级计算机,就是 AI 工业革命的工厂 "。
由硬及软,发布新创收产品 NIM
事实上,仅凭 GPU 与算力," 卖铲人 " 英伟达已经坐稳万亿美元市值。但显然,黄仁勋不甘心将公司仅仅定位为 GPU 公司、硬體公司。
在 2023 年的 GTC 大会上,英伟达即发布了 DGX Cloud 人工智能云服务。这是一项人工智能超级计算服务,它可以让企业快速访问为生成式人工智能和其他开创性应用训练高级模型所需的基础设施和軟體。黄仁勋称,该服务可让企业和軟體开发人员通过浏览器登入,即可获得英伟达的超级计算机 DGX 的 AI 算力。
叠加 NVIDIA AI Enterprise 5.0 等軟體产品,英伟达在 2024 财年第四财季,来自軟體部分的收入就已达 10 亿美元。
于是在本届 GTC 大会上,为了让传统企业," 简单粗暴 " 地部署并完全利用自己数据,打造专属行业模型。英伟达推出了全新的 AI 推理微服务—— NVIDIA NIM,能够帮助开发者将部署时间,从周缩短至分钟级。企业可以使用这些服务在自己的平台上创建和部署自定义应用,同时保留对其知识产权的完全所有权和控制权。
据介绍,NVIDIA NIM 可对来自英伟达及其合作伙伴生态系统的 20 多个主流的 AI 模型进行优化推理。
此外,英伟达自己的开发套件、軟體库和工具包都可以作为 NVIDIA CUDA-X ™微服务访问,用于检索增强生成 (RAG)、防护栏、数据处理、高性能计算(HPC)等。通过这些微服务,客户可以轻松构建基于大模型和向量数据库的 ChatPDF 产品,甚至智能体 Agent 应用。
NVIDIA NIM 支持客户使用旧的英伟达 GPU 进行推理,并允许这些公司继续使用英伟达已经拥有的数亿个 GPU。黄仁勋还表示,NVIDIA NIM 将帮助在配备 GPU 的筆記型電腦上运行人工智能,而不是在云伺服器上运行。
在商业模式上,黄仁勋则似乎用上了 " 薄利多销 " 的策略:购买英伟达伺服器的客户需要注册英伟达企业版," 一个 GPU 一小时一美元 ",同时也支持年费打五折,即每个 GPU 每年收取 4500 美元。
目前,英伟达全公司已经都用上了 NVIDIA Nim,包括 Box、Cloudera、Cohesity、Datastax、Dropbox 等合作伙伴也都已经参与 NVIDIA Nim 的使用和优化过程。
黄仁勋表示:" 成熟的企业平台坐拥数据金矿,他们掌握了大量可以转化为副驾驶的数据,当你准备好运行这些人工智能聊天机器人时,你将需要一个人工智能铸造厂 "。NVIDIA NIM 正是这样一个铸造厂,它帮助构建企业 AI 转型的 Copilot 级产品,可以被视为公司 AI 化所需的基石。
值得一提的是,在本次 GTC 大会上,黄仁勋还宣布,两年前发布的 NVIDIA Omniverse Cloud 将可以连接到苹果公司混合头显 Vision Pro。而在他演讲时展示的诸多场景中,Vision Pro 也是频频出镜,诸多开发者佩戴该产品,在元宇宙的工业领網域探索 " 空间计算 "。
GR00T 人形机器人项目,加速具身智能浪潮到来
早在 2023 年 5 月,黄仁勋就曾表示,人工智能的下一个浪潮将是 " 具身智能 "。
彼时,GGII 发布的报告也预测,预计到 2026 年,人形机器人在全球服务机器人市场中的渗透率预计将达到 3.5%,市场规模超过 20 亿美元,到 2030 年全球市场规模有望突破 200 亿美元。
而对机器人领網域的开发赋能,也被外界视为英伟达下一个万亿美元市值的增长点。
为了加速这一浪潮的到来,今年初,英伟达资深科学家 Jim Fan 刚刚宣布建立 GEAR 工作室,相关研究成果以及研究基础环境成为英伟达新机器人解决方案的基础。
在本次 GTC 大会上,黄仁勋还宣布了一个名为 GR00T 的人形机器人项目,旨在进一步推动英伟达在机器人和具身智能的突破性工作。
现场展示中,除了机器人影像外,迪士尼的 orange 和 green 机器人也来到现场,这款机器人用的就是英伟达为机器人设计的首款 AI 芯片 Jetson。
据介绍,由 GR00T 驱动的机器人可以理解自然语言,并通过观察人类动作来模拟运动。
目前,英伟达正在构建包括 NVIDIA IAI、Omniverse、ISAAC 三大平台,三大平台均与机器人产业高度关联。
其中,NVIDIA IAI 搭载 DGX 系列产品,用于模拟物理世界;Omnivese 搭载 RTX 和 OVX 系列产品,用于驱动数字孪生的计算系统;ISAAC 搭载 AGX 系列,用于驱动人工智能机器人。
为了给 GR00T 项目提供軟體支持,基于英伟达 Omniverse 构建的 ISAAC Lab 也进行了同步更新,允许开发者利用该平台模拟机器人学习技能、与物理世界模拟互动,支持数千个机器人同步训练与模拟。
黄仁勋表示:" 为通用人形机器人构建基础模型,是当今人工智能领網域最令人兴奋的问题之一。这些使能技术正在汇聚在一起,让世界各地领先的机器人专家在人工通用机器人领網域取得巨大飞跃。"