今天小编分享的科技经验:黄仁勋SIGGRAPH演讲:GH200、L40S显卡、ChatUSD轮番登场,欢迎阅读。
财联社 8 月 9 日讯(编辑 史正丞)北京时间周二晚间,英伟达联合创始人兼 CEO 黄仁勋时隔 5 年再度登上 SIGGRAPH 的舞台发表主旨演讲,期间提及一系列与生成式 AI 浪潮息息相关的硬體和軟體服务。
SIGGRAPH 由 ACM SIGGRAPH(计算机协会计算机图形影像特别兴趣小组)举办,是计算机图形学的年度顶级会议。
对于再度登上 SIGGRAPH 的舞台,黄仁勋也是颇为感慨。他回忆称,2018 年正是在 SIGGRAPH 的舞台上,他发布了能够在实时渲染中完成光线追踪的 RTX 平台,那也是英伟达的 " 赌命时刻 "。时过境迁,当年发布显卡时他可以把显卡拿在手上展示,现在由 Grace Hopper 芯片组成的产品只能放在台子上展示了。
(来源:直播视频)
" 买得越多、赚得越多 " 的 GH200
黄仁勋也再度提到今年 5 月台北电腦展上发布的 GH200 系统,同时通过动画展示了如何使用 NVLink 等技术,将 Grace Hopper 超级芯片与 HBM3e 高速连接,并构建出一整套为生成式人工智能打造的超级计算机。
顺便一提,最后的图片是按照实物大小展示,中间那个影子就是黄仁勋。这套系统能够无缝连接 256 个 Grace Hopper 超级芯片——对应的是 1 EFLOPS 的 AI 算力和 144TB 的高速存储。
黄仁勋还顺便解释了一下 GH200" 买得越多、赚得越多 " 这件事情。作为比较,同样使用 1 亿美元打造数据中心,可以买下 8800 个 x86 的 CPU 和 2500 套 GH200,但后者的 AI 算力是前者的 12 倍,同时能耗也更低。
反过来算,只需要花 800 万美元采购 210 套 GH200,就能达到与 1 亿美元 CPU 数据中心同等的 AI 算力。
Omniverse
Omniverse 是 Nvidia 创建的实时 3D 图形协作平台,主要的功能就是创建 " 数字孪生 ",在虚拟世界中模拟现实。
在周二的演讲中,黄仁勋也拿世界最大广告公司 WPP 和比亚迪(腾势汽车),作为 Omniverse 云和生成式 AI 的使用案例。WPP 通过 Omniverse 为腾势 N7 打造了一个实时、囊括各种外观配置的汽车 " 数字孪生 ",并能够通过 Adobe 等提供的 AIGC 功能修改宣传材料的影像背景。
Hugging Face
在这一轮 AI 浪潮中脱颖而出的共享机器学习模型和数据集平台 Hugging Face(俗称 " 抱抱脸 ")也出现在周二的舞台上。黄仁勋宣布,英伟达已经与 Hugging Face 达成合作協定,帮助该社区推出一项 AI 模型训练服务,背后自然有英伟达 DGX 云的支持。
AI 工作台
随着各种模型的开发变得日常工作,开发者也有在不同设备间同时开发大模型的需求。一个统一,且能调用不同算力、同步微调结果的 "AI 工作台 " 应运而生。通过 AI 工作台,开发人员能够在 PC 或工作站上快速创建、测试和自定义预训练的生成式 AI 模型,然后将其扩展到几乎任何数据中心或者公共云上。
另外,英伟达也发布了最新版本的企业軟體平台 NVIDIA AI Enterprise 4.0,为企业用户提供生成式人工智能所需的工具。
L40S 显卡、新工作站和伺服器
对于那些想要配置本地算力资源的个人和创业公司而言,英伟达也在周二发布了新的工作站产品,每个工作站最多可以塞进去四张 NVIDIA RTX 6000 显卡,对应的参数为 5,828 TFLOPS AI 算力和 192GB 显存。黄仁勋介绍称,用这台机器,微调 400 亿参数的 GPT-3 大概只需要 15 个小时。
在这里,黄仁勋再一次强调 " 买得越多、赚得越多 ",直言像这样的工作站,用来开发大模型,几个月就能把本金赚回来了。
英伟达也在周二发布了基于 Ada Lovelace 架构的新显卡 L40S。官方数据介绍称,与 A100 相比,L40S 的生成式 AI 推理性能提高最多 1.2 倍,训练性能提高最多 1.7 倍。L40S 包含 18,176 个 CUDA 内核,单精度浮点 ( FP32 ) 性能是 A100 的近 5 倍。
随后,黄仁勋也把遮在台上的黑布揭开,展示了一系列新的 OVX 伺服器产品。新的 OVX 系统最多可以装 8 张 L40S 显卡,每张显卡拥有 48GB 的显存。黄仁勋也强调,这些伺服器设计时的用途,并不是用来训练最尖端的大模型(例如 GPT-4),而是用来运行从 " 抱抱脸 " 上下载的主流大模型。
与前面提到的工作站相比,这些伺服器微调 400 亿参数的 GPT-3 大概只需要 7 个小时。
通用场景描述
通用场景描述(OpenUSD)是一种高性能 3D 场景描述技术,对于 3D 互動而言,类似于超文本标记语言(HTML)与 2D 网页之间的关系。这项技术最早在 2015 年由皮克斯动画工作室创造,并在 2016 年开源。英伟达的 Omniverse 也正是以 OpenUSD 作为基础,以成为连接各类 3D 制作工具的平台为愿景来开发。
黄仁勋在周二宣布,英伟达将为开发者和公司提供广泛的框架、资源和 API 服务,以加速 OpenUSD 的采用,并推出 ChatUSD 来帮助开发者利用自然语言实现一系列场景的调整。