今天小編分享的科技經驗:黃仁勳SIGGRAPH演講:GH200、L40S顯卡、ChatUSD輪番登場,歡迎閲讀。
财聯社 8 月 9 日訊(編輯 史正丞)北京時間周二晚間,英偉達聯合創始人兼 CEO 黃仁勳時隔 5 年再度登上 SIGGRAPH 的舞台發表主旨演講,期間提及一系列與生成式 AI 浪潮息息相關的硬體和軟體服務。
SIGGRAPH 由 ACM SIGGRAPH(計算機協會計算機圖形影像特别興趣小組)舉辦,是計算機圖形學的年度頂級會議。
對于再度登上 SIGGRAPH 的舞台,黃仁勳也是頗為感慨。他回憶稱,2018 年正是在 SIGGRAPH 的舞台上,他發布了能夠在實時渲染中完成光線追蹤的 RTX 平台,那也是英偉達的 " 賭命時刻 "。時過境遷,當年發布顯卡時他可以把顯卡拿在手上展示,現在由 Grace Hopper 芯片組成的產品只能放在台子上展示了。
(來源:直播視頻)
" 買得越多、賺得越多 " 的 GH200
黃仁勳也再度提到今年 5 月台北電腦展上發布的 GH200 系統,同時通過動畫展示了如何使用 NVLink 等技術,将 Grace Hopper 超級芯片與 HBM3e 高速連接,并構建出一整套為生成式人工智能打造的超級計算機。
順便一提,最後的圖片是按照實物大小展示,中間那個影子就是黃仁勳。這套系統能夠無縫連接 256 個 Grace Hopper 超級芯片——對應的是 1 EFLOPS 的 AI 算力和 144TB 的高速存儲。
黃仁勳還順便解釋了一下 GH200" 買得越多、賺得越多 " 這件事情。作為比較,同樣使用 1 億美元打造數據中心,可以買下 8800 個 x86 的 CPU 和 2500 套 GH200,但後者的 AI 算力是前者的 12 倍,同時能耗也更低。
反過來算,只需要花 800 萬美元采購 210 套 GH200,就能達到與 1 億美元 CPU 數據中心同等的 AI 算力。
Omniverse
Omniverse 是 Nvidia 創建的實時 3D 圖形協作平台,主要的功能就是創建 " 數字孿生 ",在虛拟世界中模拟現實。
在周二的演講中,黃仁勳也拿世界最大廣告公司 WPP 和比亞迪(騰勢汽車),作為 Omniverse 雲和生成式 AI 的使用案例。WPP 通過 Omniverse 為騰勢 N7 打造了一個實時、囊括各種外觀配置的汽車 " 數字孿生 ",并能夠通過 Adobe 等提供的 AIGC 功能修改宣傳材料的影像背景。
Hugging Face
在這一輪 AI 浪潮中脱穎而出的共享機器學習模型和數據集平台 Hugging Face(俗稱 " 抱抱臉 ")也出現在周二的舞台上。黃仁勳宣布,英偉達已經與 Hugging Face 達成合作協定,幫助該社區推出一項 AI 模型訓練服務,背後自然有英偉達 DGX 雲的支持。
AI 工作台
随着各種模型的開發變得日常工作,開發者也有在不同設備間同時開發大模型的需求。一個統一,且能調用不同算力、同步微調結果的 "AI 工作台 " 應運而生。通過 AI 工作台,開發人員能夠在 PC 或工作站上快速創建、測試和自定義預訓練的生成式 AI 模型,然後将其擴展到幾乎任何數據中心或者公共雲上。
另外,英偉達也發布了最新版本的企業軟體平台 NVIDIA AI Enterprise 4.0,為企業用户提供生成式人工智能所需的工具。
L40S 顯卡、新工作站和伺服器
對于那些想要配置本地算力資源的個人和創業公司而言,英偉達也在周二發布了新的工作站產品,每個工作站最多可以塞進去四張 NVIDIA RTX 6000 顯卡,對應的參數為 5,828 TFLOPS AI 算力和 192GB 顯存。黃仁勳介紹稱,用這台機器,微調 400 億參數的 GPT-3 大概只需要 15 個小時。
在這裏,黃仁勳再一次強調 " 買得越多、賺得越多 ",直言像這樣的工作站,用來開發大模型,幾個月就能把本金賺回來了。
英偉達也在周二發布了基于 Ada Lovelace 架構的新顯卡 L40S。官方數據介紹稱,與 A100 相比,L40S 的生成式 AI 推理性能提高最多 1.2 倍,訓練性能提高最多 1.7 倍。L40S 包含 18,176 個 CUDA 内核,單精度浮點 ( FP32 ) 性能是 A100 的近 5 倍。
随後,黃仁勳也把遮在台上的黑布揭開,展示了一系列新的 OVX 伺服器產品。新的 OVX 系統最多可以裝 8 張 L40S 顯卡,每張顯卡擁有 48GB 的顯存。黃仁勳也強調,這些伺服器設計時的用途,并不是用來訓練最尖端的大模型(例如 GPT-4),而是用來運行從 " 抱抱臉 " 上下載的主流大模型。
與前面提到的工作站相比,這些伺服器微調 400 億參數的 GPT-3 大概只需要 7 個小時。
通用場景描述
通用場景描述(OpenUSD)是一種高性能 3D 場景描述技術,對于 3D 互動而言,類似于超文本标記語言(HTML)與 2D 網頁之間的關系。這項技術最早在 2015 年由皮克斯動畫工作室創造,并在 2016 年開源。英偉達的 Omniverse 也正是以 OpenUSD 作為基礎,以成為連接各類 3D 制作工具的平台為願景來開發。
黃仁勳在周二宣布,英偉達将為開發者和公司提供廣泛的框架、資源和 API 服務,以加速 OpenUSD 的采用,并推出 ChatUSD 來幫助開發者利用自然語言實現一系列場景的調整。