今天小編分享的科技經驗:英偉達又發“最強”AI超算,還聯手了HuggingFace,黃仁勳要加收大模型税了,歡迎閲讀。
黃仁勳在 SIGGRAPH 2023 的主題演講上透露了英偉達為降低生成式 AI 使用門檻所做的最新努力。
生成式 AI 是這次大會毋庸置疑的絕對主角,黃仁勳會上透露的在軟體和硬體以及生态方面的更新,歸結起來就是盡力降低生成式 AI 的使用門檻——促進大模型的真正落地。
" 買的越多,省的越多 "2.0
硬體方面,英偉達推出了 GH200 超級芯片的更新版,或者可以叫它 HBM3E 增強版。它是世界第一款 HBM3e 處理器。
通過英偉達 NVLink 技術,彼此互聯的 Grace Hopper 超級芯片平台能夠提供 1.2TB 的快速内存,由于 HBM3e 内存比當前 HBM3 快 50%,平台總共能提供 10TB/ 秒的組合帶寬。也就是説,其内存容量增加 3.5 倍,帶寬增加了 3 倍,平台包括了一台具有 144 個 Arm Neoverse 核心、8 petaflops 的 AI 性能和 282GB 最新 HBM3e 内存技術的伺服器。它同時與早先在台北電腦展上公布的英偉達 MGX 伺服器規範完全兼容。
數據中心的硬體正在快速向加速計算轉變,這是黃仁勳一直在強調的一個趨勢。相比 CPU,GPU 在能效上有很大的優勢,黃仁勳演講中舉的例子是同樣 1 億美元成本,相比 x86 架構 CPU,GH200 将能提供超過 20 倍能效提升。
于是我們又聽到了黃仁勳那句名言:the more you buy, the more you save. 買的越多,省的越多。
可以説也是不忘初心了。
黃仁勳現場展示的 PPT 顯示,2500 張 GH200 組成的數據中心相比 CPU 有 20 倍能效優勢。
除了數據中心外,黃仁勳還發布了兩套硬體,它們同樣針對大模型而來。
一款是桌面級的 RTX 工作站,包括最多四個 RTX 6000 Ada GPU,單個桌面工作站可提供高達 5,828 tflops 的 AI 性能和 192GB GPU 内存。
另一款是 OVX 伺服器,其中包括了 8 個英偉達 L40S GPU,每個 GPU 配備 48GB 内存,可提供超過 1.45 petaflops 的張量處理能力。
作為對比,新的 RTX 工作站運行 8.6 億個 token 的 GPT3-40B 需要 15 個小時,OVX 伺服器則只需要 7 小時。實際上,OVX 伺服器相比 A100,推理性能提高了 1.2 倍,訓練性能上提高 1.7 倍。其單精度浮點 ( FP32 ) 性能是 A100 的近 5 倍。
英偉達 L40S GPU
這些硬體的更新是有梯度的,黃仁勳演講中也點的很明白:for everyone,英偉達在每個價格階段上都為潛在客户準備了對應產品。
因此除了伺服器和工作站之外,英偉達還同時發布了三款專業顯卡—— RTX 5000, RTX 4500 and RTX 4000,它們采用了 Ada Lovelace 架構,在顯存方面都有提升(RTX 4000 有 20GB GDDR6 顯存;RTX 4500 為 24GB;RTX 5000 最高為 32GB ),這是英偉達顯卡過去曾一度削弱的部分,而現在顯存對于大模型來説無比重要。另外它們還使用了第四代 Tensor Core,AI 訓練性能比上一代快了兩倍,并擴展了對 FP8 數據格式的支持。
這些硬體最終組成了一個矩陣,囊括了從企業級客户到個人用户。但在黃仁勳看來,想要觸達每一個人,英偉達還需要一些 " 軟工具 "。
軟硬兼施
距離黃仁勳推出 DGX Cloud 才短短幾個月,英偉達在降低用户和開發者使用大模型門檻方面又有新的動作。
其中一項是非常好猜的,那就是和 Hugging Face 的合作。在此之前,Hugging Face 已經和包括 AMD 亞馬遜雲等在内的諸多巨頭緊密合作,大家都看中了它集成開放模型的優勢,英偉達也不例外。
" 點擊一下滑鼠即可實現英偉達 AI 計算。" 黃仁勳説,幾個月前發布的 DGX Cloud 和 Hugging Face 平台集成到了一起。用户可以先在自己的電腦上啓動項目,然後擴展到工作站和數據中心。
另一項名叫英偉達 AI Workbench,開發人員可以直接在 PC 和工作站上創建、測試和定制預訓大模型。這非常像國内的大模型預訓練平台,把模型、框架和軟體開發套件與庫集合到了一個統一的開發人員工具包中,要説區别那就是 AI Workbench 能直接調用英偉達的算力資源,并且更好的支持英偉達的硬體——前面發布的那些工作站和伺服器不用説都支持 AI Workbench 的本地測試和微調。
開發者原本需要分散在各處的大模型開發工具與流程,現在由英偉達 AI Workbench 整合了起來。
它的界面就是一個網站。截圖可以看到,本地計算機使用的是消費級 4090 移動版顯卡。
這極大簡化了大模型的操作流程,實際上你只需要一台電腦就夠了。
" 每個人都可以做到這一點。" 黃仁勳説道,某種意義上講,這像是大模型的民主化。
另外一個旨在降低生成式 AI 部署門檻的服務是名為 AI Enterprise 4.0 的企業軟體平台,主要針對企業客户。AI Enterprise 4.0 包括了名為 NeMo 的大模型雲原生框架和集群管理軟體,幫助企業客户管理從雲到數據中心再到邊緣設備的所有 AI 解決方案,它會被集成到谷歌雲和微軟的 Azure。
場景在哪裏
大模型最近一個頗為引人争論的話題是,它的場景到底在哪裏?
這對善于從第一性原理出發的老黃來説恐怕完全不是問題,一方面有硬體技術,一方面有軟實力。英偉達的層次顯然更高一點——不是找尋場景,而是打造生态。因為在英偉達看來,恐怕沒有什麼所謂 " 垂直場景 ",一切都可以被生成式 AI 介入,承載它的是 Omniverse。
元宇宙在黃仁勳這裏不是一個過氣的名詞,而是連接虛拟與物理世界,并且極大開發生成式 AI 潛力的工具。在虛拟與現實的轉換中,英偉達看中了名為 Universal Scene Description,通用場景描述(簡稱 OpenUSD)的潛力。
黃仁勳把 OpenUSD 對虛拟世界的重要性與 HTML 之于 2D 互聯網的重要性相提并論。簡單來説,你可以把 OpenUSD 理解成一套通用的描述 3D 場景的語言——這在過去往往需要非常復雜的流程和不同的工具才能實現。
有了這種通用語言,不同的人能基于同樣的背景建構 3D 世界——也就是元宇宙的世界。
通過 OpenUSD 構建共同的 3D 場景——盡管來自不同的工具和平台。
顯而易見,OpenUSD 在英偉達的元宇宙願景中占有重要地位,為此,Omniverse 進行了多重更新。
一方面,黃仁勳推出了四個 Omniverse Cloud API,方便開發人員無縫地實施和部署 OpenUSD 應用。
最吸引人的是一個名為 ChatUSD 的功能,顧名思義,它能通過問答形式幫助開發者生成 3D 模型,現場演示的例子中,你提出要求,ChatUSD 可以直接給你提供 Python-USD 代碼腳本——直接使用它們就可以了!
另外使用了生成式 AI 技術的 API 名為 DeepSearch,它是一個大語言代理(LLM agent),可以快速搜索無标記數據庫的内容。
另一方面,Omniverse 本身進行了大更新以更好支持 OpenUSD,比如用少量的編碼就能快速開發本機 OpenUSD 應用以及允許用户組建基于 OpenUSD 的大規模場景。
在英偉達看來,Omniverse 将因為 OpenUSD 而增強,它可以跨 3D 工具和應用進行對世界的虛拟,這意味着一種生态的搭建:既然大家都是用 OpenUSD 進行 3D 世界的建構,那麼顯然,數字孿生所需要的互聯、互相操作可以以此為基礎實現。
由此,英偉達的元宇宙生态——它被生成式 AI 和 OpenUSD 所加持——變得初具規模,Adobe Firefly 可以作為 Omniverse 中的 API 提供給開發者,而許多業界知名的元宇宙和虛拟人開發者,Convai、Inworld AI 和 Wonder Dynamics 都能夠借助 OpenUSD 的通用标準與 Omniverse 實現連接。
英偉達對元宇宙的未來充滿自信。波士頓動力正在使用 Omniverse 來模拟機器人互動,更多的工業自動化案例,包括沃爾沃、奔馳和寶馬都是 Omniverse 的客户——在實際投入巨資建設一個昂貴的工廠之前,它們在 Omniverse 的虛拟世界裏檢查和測試物理世界的方方面面。
步入融合
生成式 AI 熱度不退,英偉達當然更有理由為其添一把柴,老黃是個盡職盡責的商人,發布會上他説的最後一句話還是 the more you buy, the more you save. 足見其不忘初心的商人本色。
而想要讓自己的硬體賣的更好,股價再創新高,英偉達一面需要不斷迭代產品,提升性能,打造更豐富的生成式 AI 產品矩陣,另外一方面還要進一步降低大模型的使用門檻——後者甚至只有英偉達才能做到,它踩中了一個絕佳的點位,圖形。
為了讓機器生成影像,人類花了幾十年時間,最終英偉達開發出了顯示卡,而現在的事實證明,适用于圖形顯示的并行計算恰好也适用于生成式 AI,而虛拟世界也需要更強大的圖形技術和人工智能的幫助。
黃仁勳在演講剛開始的時候就舉了個例子:來自全球最大廣告公司 WPP 的藝術家通過 Omniverse 運用多種支持 OpenUSD 的工具創建了比亞迪汽車的數字孿生版本——全球 100 多個地區的營銷活動基于這些生成内容。
五年前的 SIGGRAPH 大會,英偉達發布了支持光線追蹤的 GPU,那時恐怕沒有人會想到,人工智能,虛拟世界,加速計算,雲,它們會以如此迅猛的速度逐漸融合為一體。