今天小編分享的科技經驗:GPU計算爆發!誰還記得遊戲顯卡鼻祖GeForce 256?,歡迎閲讀。
2024 年 8 月,國產遊戲《黑神話:悟空》正式開售。作為近期熱度最高的國產遊戲,《黑神話》憑借出色的劇情發展、場景設計和配樂成功 " 出圈 ",不僅遊戲愛好者們 " 人手一份 ",不少已經 " 戒遊戲 " 的老玩家也選擇趁機更新電腦,換張新顯卡好好享受遊戲。
盡管這種為了遊戲而換顯卡的行為看起來有 " 衝動消費 " 的意思,但回顧近幾年的遊戲史,我們不難發現,每次現象級遊戲走火,同時也有大量玩家為此更新顯卡。比如用豐富遊戲性推動 GTX 1060 顯卡的《PUBG》和《守望先鋒》,用出色營銷和畫質推動 RTX 時代的《賽博朋克 2077》,成為 RTX 4060" 帶貨王 " 的《Apex》。可以説每一款成功遊戲的背後,都有一張 " 現象級 N 卡 "。
圖片來源:英偉達
那麼問題也随之而來——英偉達第一張遊戲顯卡面世時,遊戲行業是怎樣的呢?
1999 年,英偉達發布了其第一張遊戲顯卡—— GeForce 256。但在 GeForce 256 發布之前,市場上已經存在多個顯卡(GPU)品牌,如 3dfx 的 Voodoo(巫毒)系列、Matrox(邁創)、S3 Graphics、ATI 的 Rage 系列。
和現代的 GPU 一樣,這些 GPU 同樣基于 3D 加速技術,但可惜的是,這些 GPU 產品缺乏統一的 3D 加速制式。這意味着遊戲開發者必須針對不同顯卡優化遊戲,顯著增加了開發成本和難度。此外受產品性能的限制,這些 GPU 也無法支撐復雜的 3D 遊戲。
與此同時,《古墓麗影》、《雷神之錘 2》、《星際争霸》等遊戲的流行也推動了玩家對 3D 遊戲的期望。也就在這時,英偉達 GeForce 256 出現了。
GeForce 256 是全球首款被稱為 GPU 的產品,源于其首次将圖形處理的多個功能集成于單一芯片,這一行為定義了 GPU 這一概念,同時也将復雜的 3D 渲染任務從 CPU 中解放出來,賦予 GPU 專門的計算職責。從 GPU 的歷史進程來看,這也為後來 GPU 的廣泛應用奠定了基礎。
此外,GeForce 256 也将 T&L(Transform & Lighting、變換與光照)硬體加速集成到 GPU 中,使 3D 場景的變換和光照計算由 GPU 專門負責。這是圖形處理史上的重大突破,以前這類計算任務通常由 CPU 執行,不僅效率低下,而且限制了遊戲畫面的表現力。借助 GeForce 256,遊戲畫面的復雜性和細節大幅提升,推動了 3D 遊戲時代的到來。
而且 GeForce 256 出色的性能也将 GPU 這一概念帶到遊戲行業之外。别着急,此時的英偉達還沒拿出 CUDA 這種改變 GPU 行業生态的大殺器。但 GeForce 256 出色的性能,确實為 GPU 在科學計算、金融分析等領網域的應用奠定了基礎。
如果説 GeForce 256 開啓了 GPU 圖形運算的時代,那英偉達在 2008 年發布的 GeForce 8800 GTX,則真正解放了 GPU 的性能。很顯然這張顯卡的性能放在現在早已不值一提,但這張顯卡上,英偉達提出了 CUDA(統一計算架構)這一概念。
CUDA 的出現讓 GPU 不僅可以用來處理圖形運算,還可以用來執行、加速基于 CUDA 的通用計算,讓電腦成為真正的通用工具。
而在提出了 CUDA 後,英偉達也在 2018 年進一步對 GPU 的算力進行細化,引入了 RT Core、Tensor Core 的概念,讓光線追蹤和專門的 ML 計算成為可能——Tensor Core 通過高效執行大規模矩陣運算,顯著加快了 AI 模型的訓練和執行速度。
根據英偉達的介紹,現階段 RTX AI 已經對 10 種不同的 AI 場景實現覆蓋,包括遊戲、影視、自動駕駛和科學計算等領網域。深受英偉達用户喜愛、可以顯著提高遊戲 FPS 的 DLSS,就基于 Tensor Core 來實現,可以説是廣大遊戲玩家最早接觸到的真 AI 用例了。
在影視制作領網域,RTX AI 加速渲染速度,使復雜的光線和反射效果在短時間内完成,從而縮短了制作周期。在自動駕駛方面,RTX GPU 處理大量影像和傳感器數據,支持實時決策,提高車輛的安全性與精準性。此外,AI 還用于醫療影像處理、金融預測和科學模拟,加速數據分析和預測模型的訓練。
不誇張的説,RTX AI 的出現不僅推動了高端視覺效果和 AI 計算的融合,還降低了企業使用 AI 的門檻。它正逐漸成為各行業提升效率、創新業務的關鍵引擎,引領未來技術的發展潮流。
但話説回來,盡管 GPU 的算力提升讓 AI 能以驚人的速度普及,現階段英偉達确實是 AI 算力的代名詞,以及個人 AI 計算機的唯一選擇。但這是否意味着美歐強勁 GPU 的設備,就無緣 AI 時代呢?
答案是否定的。
在 2024 雲栖大會上,阿裏集團 CEO、阿裏智能雲董事長兼 CEO 吳泳銘表示:
生成式 AI 改變計算架構,從 CPU 主導的計算體系到 GPU 主導的 AI 計算遷移。AI 時代将是 "GPU 算力為主,CPU 算力為輔 " 的計算模式。2024 年市場新增算力,超過 50% 的需求 AI 驅動產生,這一趨勢将持續擴大。
不可否認,即使是阿裏雲提供的 AI 雲算力,背後也主要由 GPU 驅動。但從另一個方面想,将 GPU 算力集中在雲端,配合設備本地的 CPU、NPU 進行混合 AI 運算,其實也不失為一個好主意。
首先,這可以緩解算力瓶頸,提升計算靈活性。GPU 在 AI 計算中的核心地位毋庸置疑,但個人開發者和消費者通常難以承受購買和維護大量 GPU 的成本。将 GPU 算力集中在雲端,允許用户按需租用雲 GPU 資源,可以避免一次性高額投入。這種模式也提供了極大的彈性,可根據任務需要随時擴展或縮減算力。
其次,許多終端設備受限于尺寸和功耗,無法配備高性能 GPU。通過在雲端完成復雜的 AI 運算,并将結果傳輸至本地設備執行簡單任務,設備可以保持輕量化且功耗低。這種混合計算模式,特别适合邊緣設備和移動終端。
而且在本地 CPU 和 NPU 的配合下,雲 GPU 的計算能力可以得到最大化利用:設備本地的 NPU 可以快速處理延遲敏感的任務,如語音識别和實時影像分析;而復雜的模型訓練和推理則交由雲端 GPU 完成。這種模式有效縮短了計算響應時間,提升了用户體驗。
短時間來看,英偉達在 AI 算力市場的優勢仍然巨大,但是長遠來看,群狼環伺之下的 AI 市場,英偉達雙拳難敵四手。諸如移動 PC、智能終端等英偉達的弱勢市場,很快就會被其他廠商瓜分幹淨,而關鍵的伺服器市場也并非高枕無憂,AMD 的 MI300 系列 AI 顯卡份額增長迅速,已經足夠引起英偉達的警覺。
不過,競争所帶來的創新與發展,才是科技進步的關鍵,随着 AI 領網域的競争加劇,實際上也在推動 AI 成本的下降,讓 AI 技術得到更快、更廣泛的應用。就像吳泳銘説的那樣:
AI 驅動的數字世界連接着具備 AI 能力的物理世界,将會大幅提升整個世界的生產力,對物理世界的運行效率產生革命性的影響。
一個圍繞 AI 而生的新生态,此時此刻就在我們面前。