今天小編分享的互聯網經驗:AI PC噱頭破碎,什麼才是真·AI PC?,歡迎閱讀。
文 | 半導體產業縱橫
距離 AI PC 推出的概念炒作已經一年有餘了,但似乎 " 雷聲大,雨點小 "。市場和消費者似乎也并不買賬。AI PC 真的 "AI" 嗎?什麼才是真 · AI PC?看看真正的 AI 大廠給的答案吧。
AI PC 概念的興起
AI PC 是 Artificial Intelligence Personal Computer 的簡稱,最早由英特爾于 2023 年 9 月提出,短短時間内獲得業内廣泛青睐,盡管發展時間不長,但業内普遍認為,AI PC 将會是 PC 行業的轉捩點。而 Canalys 對 AI PC 的定義為配備專用 AI 芯片組或模塊(如 NPU)的台式機和筆記型電腦,用于處理 AI 工作負載。
2024 年被業界公認為 AI PC 應用的元年,各大企業紛紛推出了自己的 AI 電腦。
3 月初,蘋果發布 AI PC MacBook Air。3 月 18 日,榮耀發布公司首款 AI PC MagicBook Pro 16,緊接着,AMD 董事會主席及 CEO 蘇姿豐宣布 AMD 銳龍 8040 系列 AI PC 處理器已經實現出貨。3 月 22 日,微軟宣布推出 Surface AI PC。4 月 11 日,華為發布新款 MateBook X Pro 筆記型電腦,首次應用華為盤古大模型。
某種程度上來說,強綁定 AI 概念的 PC 業确實有了起色。2024 年第四季度,AI PC 出貨量達到 1540 萬台,占季度 PC 總出貨量的 23%。2024 年全年,AI PC 占 PC 總出貨量的 17%。其中,蘋果以 54% 的市場份額領跑,聯想和惠普各占 12%。受 Windows 10 服務停止帶來的換機潮,AI PC 的市場滲透率将在 2025 年繼續提升。但這其中究竟有多少 AI 含量?
AI PC:雷聲大雨點小
2024 年 2 月 23 日,聯想 CEO 楊元慶在最新财報發布後表示,預計 2024 年全球 PC 出貨量将同比增長約 5%。盡管面臨一些挑戰,但他堅信人工智能将是推動聯想業務增長和重塑的關鍵因素。
然而,楊元慶也指出,目前 AI PC 市場還處于初級階段,盡管 " 雷聲大 ",但實際銷售量和用戶接受度還相對較低。他認為,這主要是由于技術成熟度、用戶教育以及市場接受度等方面的原因。
對于已經發布的 AI PC 產品,不少人并不認可,核心在于這些 AI PC 中 "AI" 與 "PC"(硬體)基本是分離的。以目前 PC 上最大的 AI 用例——微軟 Copilot 來說,在英特爾與微軟對 AI PC 的聯合定義中,強調必須配備混合架構芯片、Copilot 及其對應的物理按鍵。但事實是,所有更新到最新 Windows 11 版本的 PC 都能使用 Copilot,因為 Copilot 只依賴于微軟 Azure 雲端算力,與 PC 硬體本身無關。
而作為掌握核心科技的 AI 芯片老大,英偉達根本就不理微軟的定義,試問又有誰能比英偉達更有 AI 的話語權?而英偉達很早就開始布局 AI 領網域的生态,自 1993 年成立以來,一直是加速計算領網域的先驅,擁有最廣泛 CUDA 生态應用的 AI 生產力,帶有 N 卡獨顯的高性能 PC,不那麼依賴于 OEM 的适配,不但可以運行輕量極的 AI 工具,比如本地的大語言模型,簡單的 Stable Diffusion 繪圖,甚至可以玩中等規模的 AI 模型,實際使用的生成速度,也比普通核顯玩 AI 快得多。
之所以現在 AI PC 受到市場冷遇,主要有以下幾點原因:
1、現階段 AI PC 搭載的 NPU 算力不足
Intel NPU 的 AI 性能最高為 48TOPS,Intel Xe 核顯大約 28TOPS。搭載核顯的 AI PC 算力目前在 10 - 45 TOPS 這個量級,而搭載 GeForce RTX 40 系列 GPU 的設備,涵蓋了筆記型電腦和台式主機,能提供 200 - 1400 TOPS 不同級别的產品方案選擇。
而今年發布的 RTX 5090 顯卡采用了 NVIDIA 的 Blackwell 架構,這使得它在性能上有了質的飛躍。據 NVIDIA 官方介紹,RTX 5090 的 AI 算力達到了 4000 TOPS,是上一代 Ada Lovelace 架構的三倍。
NPU 的 AI 算力與 GPU 相比可謂是弟中弟。
事實上主流的那些常見 AI 應用方面,本地上哪怕單塊 RTX 4080、4090 也不見得多充沛,可想而知 NPU 這點算力也确實沒有太多作用。
2、NPU 不帶 DRAM,無法單獨支撐大模型運行
目前的 AI 大模型從硬體需求來說都是 "DRAM 的大模型 "。NPU 天生不帶 DRAM,依賴系統 RAM。也就是運行大模型必須另配 64G 以上的 DRAM 以配合 NPU ——都加碼到這份上了,這為啥不直接用 APU/GPU 跑呢,都要加錢了,讓誰跑不是跑?
而且 APU 和 GPU 跑 AI 大模型是開源适配好的,可謂是開箱即用。
3、NPU 适配應用少,應用範圍窄
理論上,現在 NPU 上已經能跑 LLM 大語言模型、stable diffusion 圖片生成、常見 CV 神經網絡的推理(包括 Resnet、yolo)、whisper 語音轉文字。基本上所有的 AI 推理負載,本質上就是矩陣運算,都能夠通過 NPU 來實現低功耗運行。
但實際上現在用戶買到的 Windows 筆記型電腦,能夠調用 NPU 的應用場景是 Windows Studio Effect 裡面的背景虛化、剪映摳圖。應用範圍實在是太窄了。NPU 支持的本地程式截止目前非常少。
總體來說,目前 NPU 實際能用的功能都是一些花拳繡腿。這一輪 AI 真正火起來,還是因為大家看到 ChatGPT 這樣的聊天機器人能夠解決很多問題。所以如果真的要讓 NPU 發揮作用,還是需要能運行 LLM 大語言模型,而顯然當前 AI PC 上的 NPU 無法滿足需求。
NPU 還是 GPU 不重要,但本地化的 AI 很需要。而目前來看,是不是 AI PC 并不重要,有沒有搭載 NVIDIA GPU 比較重要。
三大廠的 " 真 · AI PC"
此前雖然一些廠商宣傳推出了 AI PC 產品。但實際上卻至少噱頭居多,只是搭載了 NPU 芯片,而沒有真正的本地大模型運行。既不能訓練、也不能推理。
AI PC 的概念被廣泛宣傳在筆記型電腦上。然而,現在沒有任何一台輕薄本,稱得上是高算力的 AI 專用計算設備 PC,反倒是傳統的高性能遊戲本,搭載強大 GPU 顯卡的台式機,可以真的去提供真正的 AI 生產力。
真 · AI PC 還是得看能開發高性能 GPU 的廠商,比如英偉達和 AMD。
而就在今年年初 CES 上,AMD 發布了 AI Max 300Strix Halo。黃仁勳也發布了 Project DIGITS。再加上此前蘋果公司的 Mac Pro。這三個是本地部署大模型的利器。堪稱 " 桌面 AI 超級電腦 "。
AMD發布的 Strix Halo 有兩種:消費級的 Strix Halo--- 主要用于消費性能筆電(遊戲本)和商用級的 Strix Halo Pro--- 主要用于移動工作站。曝光的 3DMark 測試數據顯示,其旗艦型号 Ryzen AI MAX+ 395 有 16 個基于 Zen 5 架構的 CPU 核心,32 線程;40 個基于 RDNA 3.5 架構的 GPU 核心,即 Radeon 8060S 核顯;最高 120W,是标準移動 APU 的 3 倍;支持四通道 LPDDR5X 内存,提供高達 256 GB/s 的帶寬。值得注意的是,集成的 Radeon 8060S 核顯性能竟達到前代 Radeon 890M 的三倍以上,甚至逼近 RTX 4060 獨顯水平。
英偉達将其發布的 Project DIGITS 稱之為 " 目前體積最小的 AI 超算 "。Project DIGITS 使用了一顆定制的 "GB10" 超級芯片,它在一個核心裡融合了基于 Blackwell 架構的 GPU,以及 NVIDIA 與聯發科、ARM 三方合作研發的 Grace CPU。資料顯示,其中的 Blackwell GPU 能夠提供 1PFLOPS 的 FP4 算力,同時 Grace CPU 則包含了 10 個 Cortex-X925 核心和 10 個 Cortex-A725 核心。在 GPU 和 CPU 之間,則是通過大型超算同款的 NVLINK-C2C 芯片到芯片互聯總線連接。
Project DIGITS 還配備了一顆獨立的 NVIDIA ConnectX 互聯芯片,它可以讓 "GB10" 超級芯片内部的 GPU 兼容多種不同的互聯技術标準,其中包括 NCCL、RDMA、GPUDirect 等,從而使得這顆 " 大核顯 " 可以被各種開發軟體和 AI 應用直接訪問。
而蘋果則在 2023 年發布了 M3 系列芯片并配備了下一代 GPU,代表了蘋果芯片圖形架構史上最大的飛躍。不僅速度更快、能效更高,并且還引入了稱之為 " 動态緩存 " 的新技術,同時首次為 Mac 帶來了硬體加速光線追蹤和網格着色等新渲染功能。渲染速度現在比 M1 系列芯片快 2.5 倍。值得注意的是,全新的 M3 系列芯片帶來最高 128GB 的統一的内存架構。蘋果稱,對高達 128GB 内存的支持解鎖了以前在筆記型電腦上無法實現的工作流程,例如人工智能開發人員使用具有數十億參數的更大的 Transformer 模型。去年蘋果有發布了 M4 Pro 芯片,性能号稱超越 AI PC 芯片。
而這三者都采用了一種叫做統一内存架構的技術。統一架構的好處,就是把以前内存和顯存(顯卡的内存)做了統一,這樣就減少了 CPU 和 GPU 通信時候,在内存和顯存之間數據通信時候的拷貝。此外,這一技術也能使電腦顯存更大,從而可以打破消費級顯卡在運行大模型時候顯存不足的困境。值得注意的是,統一内存設計不是英偉達首創,蘋果 M1 才是第一例。
Deepseek 開啟桌面 AI 超級電腦之戰
近一段時間以來,DeepSeek 線上算力的嚴重不足,帶火了大模型本地部署需求,三大廠的 " 真 · AI PC" 也都開始廠商部署 DeepSeek。
而 DeepSeek 作為一款 MoE 模型對顯存要求高,對算力 / 内存帶寬要求相對低。這也給了這些通過統一内存技術而擁有大顯存的桌面 AI 超級電腦可乘之機。
之前有國外大佬用 8 台 M4 Pro Mac mini 跑 DeepSeek V3。同樣的,預計可以利用四台 Project DIGITS 來部署 DeepSeek V3,而且生成速度應該也會快很多。根據 AMD 自己的公布,strix halo 架構 APU 可以部署 70B 的模型,比 4090 快 2.2 倍,功耗低 87%。
有網友表示," 打算等 halo 筆記本上市之後把現在的筆記本換掉的,本地部署大模型确實有意思,再過幾年也許就可以本地部署 671B 的 INT8 或者 FP8 大模型了。除了大模型,RAM 和 CPU 配置提高了,做其它事情也快。"
AI 賽道,或許是國產廠商切入 PC 芯片領網域的契機。當前許多廠商開始營銷各類 AI 一體機產品。相信如果國產廠商能推出更大統一内存,比如 256G 版本的國產 "Project DIGITS",也許會更受歡迎。
AI PC 的概念,是任人打扮的小姑娘。故事,其實各家有各家的講法。OEM 各大廠百花齊放,砸錢砸工程師做本地化 AI 應用,軟體有些能本地也能雲,雲服務可以接入國產模型做商業,可能是一快很好的蛋糕。
低延遲 + 隐私保護,或許是拉動類似 GPT 一類大語言模型,SD 繪圖,聲音克隆,AI 補幀,摳圖,重繪等本地化 AI 應用的一個點。
AI PC 的足夠強的邊緣算力 + 大内存(顯存)+ 優化到足夠高效的軟體,結合起來才能有望解決行業痛點,大批量落地 AI 終端。所以說,AI PC 其實也不完全是噱頭炒作,不管是更普惠的 AI,更高能效的 AI,還是更強大算力的 AI,還是基于雲和網絡更簡單好用的 AI,都是有在進一步發展技術,摸索市場。