今天小编分享的财经经验:英伟达抛出年度AI杀器:史上最强芯片,还有机器人大模型,欢迎阅读。
作者丨邱晓芬、景霖
编辑丨苏建勋
3 月 18 日 -21 日期间,英伟达在美国圣何塞召开 GTC 大会。作为英伟达一年一度的技术发布会, GTC 大会也被誉为 AI 行业的风向标。创始人黄仁勋在 GTC 大会上,做了一场长达 2 个小时的开幕演讲。
在过去一年 AI 的风起云涌当中,英伟达是率先吃到 AI 发展红利的公司,股价在一年之内飙升了 260%,目前市值已经突破 2.2 万亿美元。英伟达员工 " 靠股票致富 " 一度成为行业热闻,令人艳羡。(关于英伟达在中国的更多内容,可参看 36 氪之前报道:夹缝中的英伟达中国 | 深氪 lite )
如今,英伟达技术的最新进展如何?英伟达后续将他们的 GPU 落地到各行各业?种种疑问,也让行业对于这场演讲更加关注。
发布历史上 " 最成功 "GPU
此次演讲中,英伟达发布了他们的下一代芯片架构 Blackwell,这一 GPU 平台也是黄仁勋口中,英伟达史上最成功的产品。
据介绍,Blackwell GPU 以数学家 David Harold Blackwell 的名字命名,同样沿用了英伟达此前推出的 Hopper 架构。Blackwell GPU 中包含 2080 亿个晶体管,可以支持多达 10 万亿个参数的 AI 模型。
黄仁勋展示 Blackwell
除了芯片本身之外,这一架构还采用了第五代 NVLink 高速互联、第二代 Transformer 引擎,多方位全面更新。据黄仁勋介绍,这一全新的芯片将在 2024 年晚些时间上市。
在商业化层面,英伟达方面已经有了初步计划。黄仁勋表示,英伟达未来计划用 Blackwell 向世界各地的人工智能公司进军,与世界各地的所有 OEM、区網域云、国家主权 AI、电信公司签约。
目前,亚马逊、戴尔、谷歌、Meta、微软、OpenAI、特斯拉都已经计划使用 Blackwell GPU。
blackwell 参数情况
值得注意的是,此前传说中的 B100 并没有出现,英伟达转而发布了由一个 Grace CPU、和两组 Blackwell GPU 组合而成的超级芯片 GB200。
黄仁勋介绍, 相比于 H100,「GB200」的算力是前者的 6 倍,而对应处理多模态特定领網域的算力表现可达 30 倍。
此外,英伟达还发布了由 36 组 Grace CPU 和 72 组 Blackwell GPU 组合而成的伺服器 GB200 NVL72。
GB200 NVL72 参数
在「GB200 NVL72」上,推理算力达到 1440 PFLOPS,传输量最大达到每秒 260TB,另外,FP8 精度的训练算力就高达 720PFlops,几乎相当于一个超级计算机集群。
发布机器人领網域通用大模型
此次,英伟达将推出了一款用于机器人领網域、名为 GROOT 的通用基础大模型。此外,英伟达还推出了适用于机器人的全新计算机 Thor,英伟达对于相关的性能、功耗和尺寸进行了具体的优化。
GROOT
据介绍,英伟达希望通过这一举措,让机器人拥有更聪明的大腦,得以通过观察人类的行为,做出自然的模仿动作,在动作的协调性、灵活性等方面大大提升。
英伟达方面称,目前正在为 1X Technologies、Agility Robotics、Apptronik、Boston Dynamics、Figure AI、Fourier Intelligence、Sanctuary AI、Unitree Robotics 和 XPENG Robotics 等人形机器人公司构建 AI 平台。
更新 25 个医疗微服务
此次,英伟达还推出了全新的 AI 推理伺服器 NIM(NVIDIA INFERENCE MICROSERVICE),让所有人都可以通过这一形式自定义 AI 模型和应用。
在医疗场景上,英伟达此次推出了基于医疗场景的 25 个新的微服务(NIM), 帮助全球的医疗保健公司可以基于生成式 AI 进行效率提升。
对于医疗行业公司来说,他们可以基于这些微服务,筛选数万亿种药物化合物,收集更多的患者数据以帮助早期疾病检测,或者实施更智能的数字助理等等。
具体而言,这些微服务包括一系列药物发现模型,包括用于生成化学的「MolMIM」、用于蛋白质结构预测的「ESMFold」、帮助研究人员了解药物分子如何与靶标相互作用的「DiffDock」。
医疗落地
英伟达方面举了一个例子,与在 CPU 上运行相比,英伟达的微服务能够将基因组分析工作流程中的变异调用速度提高了 50 倍以上。
英伟达还展示了另外一个在医疗领網域合作的例子。有初创企业借助搭建基于人工智能驱动的医疗临床对话平台,平台将通过电话与患者交谈以安排预约、术前约访、出院随访等,将大大缓解普遍的人员短缺问题,改善患者的治疗结果,也为临床医生节省最多三个小时时间。
目前,全球有接近 50 家应用程式提供商正在使用英伟达的医疗微服务。
汽车落地
英伟达今日还发布了全新的「DRIVE Thor」车载计算平台。
作为上一代「DRIVE Orin」的继任者,这一平台将提供功能更丰富的自动驾驶舱性能——集成了专为 Transformer、LLM 和生成式 AI 工作负载而设计的全新 NVIDIA Blackwell 架构。
目前,已经有多加厂商公布了这一平台的全新合作进展。
比如,比亚迪和英伟达的合作范围从汽车扩展到云。除了在 DRIVE Thor 上构建下一代电动汽车车队外,比亚迪还计划使用英伟达的 AI 基础设施进行基于云的 AI 开发和培训技术。
另外,广汽、小鹏汽车在内等厂商也表明了将使用「DRIVE Thor」车载计算平台。
此外,黄仁勋还披露了他们将数字建模技术用到苹果去年发布的空间计算设备 Vision Pro 上。在英伟达播放的一条视频短片中,英伟达着重展示了一个汽车模型在苹果设备上的应用。
Vision Pro 上展示的互動应用
通信 & 气候治理 & 量子计算
此次,英伟达方面还宣布推出「6G 研究云平台」。基于这一平台,通信公司可以对物理地形和人造建筑进行精确模拟,大大提高无线传输的可靠性。诺基亚、三星是这一领網域的合作伙伴。
6G 研究云平台
这次演讲上,英伟达还推出了「Earth-2 气候数字孪生云平台」,用来模拟和可视化天气。据介绍,Earth-2 可以帮助用户在几秒钟内提供警告和更新的预报,而若采用传统的 CPU 驱动建模,则需要几分钟或几小时。
不仅仅是速度上有优势,用「Earth-2 气候数字孪生云平台」所生成的气候影像,分辨率比当前数值模型高 12.5 倍,速度快 1000 倍,并且能源效率提高 3000 倍,纠正了粗分辨率预测的不准确性。
黄仁勋也介绍了这一平台的实际使用场景。比如,台湾中央气象局就计划利用这一模型来预测台风登陆的更精确位置,对人员进行早期疏散,减少人员伤亡。
此次,英伟达方面还宣布,日本新型 ABCI-Q 超级计算机,将由英伟达加速和量子计算平台提供支持。这一超级计算机由 500 多个节点中的 2000 多个英伟达 H100 GPU 提供支持,这是世界上唯一完全可解除安裝的网络内计算平台,预计将于明年初部署。