GPU又赢了？蘋果臨陣倒戈！

今天小編分享的科技經驗：GPU又赢了？蘋果臨陣倒戈！，歡迎閲讀。

GPU 再勝一局！2025 年 3 月，Loop Capital 爆出一則重磅消息：Apple 已向 NVIDIA 訂購總額約 10 億美元的 GB300 NVL72 GPU 集群伺服器系統，由 Super Micro Computer（SMCI）與 Dell 聯合交付。在 AI 領網域 " 掉隊 " 的蘋果，終于正式進入 " 大型伺服器集群 Gen AI 遊戲 "。無論是科技巨頭（如蘋果、谷歌、Meta）還是初創公司，都在依賴 NVIDIA 的 GPU 來加速其 AI 戰略。AI 領網域的壟斷巨頭正享受着屬于他們的高光時刻。

蘋果終轉向商用 GPU？

蘋果長期以來以自研芯片為核心競争力，其 Apple Silicon 系列通過深度軟硬體協同，在移動設備和邊緣計算領網域取得了巨大成功。此前，蘋果軟體工程高級副總裁 Craig Federighi 曾公開确認，Apple Intelligence 服務完全運行在自研的 Apple Silicon 伺服器上，并稱之為 " 行業雲端處理新标準 "。

然而，這次轉向 NVIDIA 的商用 GPU，在 AI 策略上的轉變，也反映了蘋果承認了 GPU 生态和 Gen AI 範式的優勢，并願意為此砸下重金。可能是在生成式 AI（Gen AI）領網域，自研芯片的開發周期和優化成本難以滿足當前市場對高性能計算的迫切需求。據分析師 Ananda Baruah 的報告透露，蘋果正計劃訂購約 250 台英偉達的 NVL72 伺服器，每台伺服器的成本預計在 370 萬至 400 萬美元之間，總價近 10 億美元。

Siri" 失利 " 是導火索，業界對蘋果 AI 一直以來都翹首以盼。然而，Siri 近年來在與競争對手（如 Google Assistant 和 Alexa）的對比中逐漸失去競争力，原本預計今年春季 iOS 18.4 會更新 Siri，但是，蘋果已将 Siri Apple Intelligence 功能推遲到明年，蘋果在今年 3 月初罕見地承認了這一點，并委婉地表示：" 我們還在努力打造更加個性化的 Siri，讓它更了解你的個人情況，并能夠在你的應用内和跨應用為你采取行動。實現這些功能需要比我們預想的更長的時間，我們預計将在明年推出它們。"

生成式 AI 爆火了兩三年，OpenAI、Anthropic、Google 等玩家在 Gen AI 賽道上狂奔，GPT-4、Claude、Gemini 已經實現推理、多輪對話、文檔操作、編程協助等核心能力。AI PC 也已經逐漸落地了。大模型重新定義了用户對 " 智能助理 " 的期望，用户的心理預期已從 " 命令執行 " 躍遷至 " 智能協同 "。而作為全球最大的手機廠商——蘋果顯然是有點 " 掉隊了 "。這也促使蘋果重新評估其 AI 硬體策略，從傳統的 AI/ML（機器學習）轉向更前沿的 Gen AI 技術。

Apple 此次投下這 10 億美元大單，它想幹什麼？有幾個推測：一是打造 Apple LLM，嵌入 Siri 新版本，實現設備級混合部署（本地 + 雲）；二、構建 Apple AI Cloud，支持 iOS/macOS 等設備遠程 AI 增強；三、未來将 AI 深度集成到 iWork 套件、Health、Shortcuts 等應用中。

盡管此次采購 NVIDIA GPU，蘋果不太可能完全放棄自研芯片。一種可能的路徑是：利用 NVIDIA GPU 進行模型訓練和開發，而 Apple Silicon 則專注于推理（inference）和邊緣設備。這種混合策略能夠平衡性能與成本，同時保留蘋果在生态系統中的控制力。

GPU 的勝利

盡管蘋果在自研 ASIC 領網域擁有深厚積累，但最終選擇投向 NVIDIA 陣營，透露出兩大關鍵信号：首先，時間優先級成為壓倒性因素——蘋果顯然不願等待自研 Gen AI 專用 ASIC 的漫長開發周期；其次，GPU 在短期内的性能優勢和生态成熟度，蓋過了定制化帶來的效率紅利。特别是 NVIDIA 的 GPU 搭配 CUDA 生态，已成為訓練大語言模型（LLM）的事實标準。這種 " 時間與性能 " 的取舍，清晰地驅動了蘋果的決策。

生成式 AI（如 LLM）的崛起，對算力架構提出了全新要求：超高的并行吞吐量、海量的内存帶寬以及靈活的計算結構。這些需求讓通用 GPU 的優勢進一步凸顯，而非通用架構（如傳統 ASIC）在短期内難以匹敵 NVIDIA 在性能與生态上的領先地位。

過去兩年，NVIDIA GPU 的價格已飙升至每顆 9 萬美元，其财務表現也印證了這一統治力：在截至 1 月 26 日的第四季度，NVIDIA 實現營收 393 億美元，同比增長 78%。英偉達的毛利率高達 70% 以上，遠超競争對手 AMD 的 50%。這種高毛利不僅反映了市場對其產品的旺盛需求，也凸顯了其在 AI 硬體領網域的定價權。

理論上，高昂的芯片成本可能推高 AI 服務（如 ChatGPT 或 Microsoft Copilot）的價格，最終轉嫁給消費者。然而，目前硅谷科技巨頭似乎更願意自行消化這些成本，以搶占 AI 競賽的先機。NVIDIA 約 41% 的收入來自微軟、谷歌、亞馬遜和 Meta 四大客户，這些公司均表示，GPU 供應不足已成為構建 AI 數據中心的瓶頸。

今年 1 月，英偉達的前景遭遇了一次震蕩——中國初創公司 DeepSeek 發布了一個具有競争力的 AI 模型，聲稱其背後預算極為有限。英偉達的市值在一天之内幾乎蒸發了 6000 億美元。不過，英偉達在接下來的幾周内大部分恢復了這些損失。行業的普遍假設是，DeepSeek 模型所暗示的這種更廉價的 AI，将只會增加全球對 AI 服務和其背後硬體的需求。科技巨頭們并沒有改變自己對 AI 基礎設施的建設，反而愈演愈烈：Meta 計劃今年斥資 650 億美元建設 AI 基礎設施，包括一個規模堪比 " 曼哈頓大部分地區 " 的數據中心；微軟、谷歌等全球九大科技公司預計 2025 年在 AI 上的總支出将達 3710 億美元，同比增長 44%。

有 AI 專家則認為，DeepSeek 的成就實際上只會鞏固英偉達的地位，因為這仍然發生在英偉達的軟硬體生态系統中。與此同時，普遍認為 DeepSeek 是借助現有模型（如 OpenAI 的 GPT）進行開發的，而這些模型的構建依賴于巨大的計算資源。

在硬體層面，NVIDIA 最新推出的 GB300 NVL72 平台堪稱巅峰之作。這款機架級設計集成了 72 個 Blackwell Ultra GPU 和 36 個基于 Arm Neoverse 的 Grace CPU，形同一個為推理和訓練優化的巨型 GPU。與前代 Hopper 架構相比，GB300 NVL72 在響應速度（TPS，每用户每秒事務數）上提升 10 倍，能效吞吐率（每兆瓦 TPS）提升 5 倍，整體 AI 產出能力躍升 50 倍。這種性能飛躍讓自研 ASIC 或傳統 x86 CPU 在面對大規模并行計算時，幾乎無法與之抗衡。

來源：NVIDIA

NVIDIA 創始人黃仁勳曾表示："Blackwell 的需求令人震驚。AI 推理引入了新的縮放定律——更多訓練算力讓模型更智能，更多推理算力讓答案更精準。" 這一洞察不僅揭示了 AI 算力的雙輪驅動邏輯，也預示了 NVIDIA 的增長勢頭。展望 2026 财年第一季度，公司預計營收将達 430 億美元，顯示其在 AI 硬體市場的統治力仍在延續。

從蘋果的妥協，到科技巨頭的狂熱投入，再到 DeepSeek 的意外挑戰，GPU 的勝利不僅是技術路線的勝出，更是對時間與性能極致追求的見證。在 AI 驅動的未來，GPU 的通用算力生态正成為不可撼動的基石。

ASIC 的 " 失敗 "

與 GPU 的耀眼成就相比，ASIC（專用集成電路）在生成式 AI（Gen AI）浪潮中的暫時 " 失利 "，為自研芯片路線敲響了警鍾——在技術競争中，" 錯過時間視窗 " 比性能稍遜更為致命。

在半導體領網域，自研 ASIC（如 Apple Silicon）與商用 GPU 之間的技術路線之争由來已久，核心在于 " 定制化 " 與 " 通用性 " 的博弈。從技術特性來看，自研 ASIC 在特定任務（如 AI 推理階段）上具備更高的效率，但其設計和驗證周期漫長，難以跟上人工智能領網域日新月異的發展節奏。相比之下，通用 GPU 憑借靈活性和強大的生态支持，在快速迭代的 AI 市場中占據了上風。

ASIC 的開發周期是其最大軟肋。以蘋果為例，作為全球芯片設計的佼佼者，其從架構設計到流片驗證仍需數年時間。然而，Gen AI 的競争是一場速度至上的賽跑，大語言模型（LLM）等技術的迭代周期以月計，市場需求瞬息萬變。蘋果顯然無法承受自研 AI 專用 ASIC 逐步成熟的等待期。相比之下，NVIDIA 的 GPU 作為成熟的商用解決方案，可立即投入使用，直接滿足蘋果對算力的迫切需求。這種時間上的差距，成為 ASIC 在短期内失利的關鍵。

ASIC 的另一大短板在于靈活性不足。作為專為特定任務優化的 " 專用芯片 "，ASIC 在固定場景下（如推理或網絡加速）表現出色，但在 Gen AI 的工作負載面前卻顯得捉襟見肘。LLM 的訓練涉及多樣化的算法和不斷擴展的模型規模，需要硬體具備高度的通用性和适應性。而 ASIC 的設計初衷恰恰與之相悖，其定制化特性難以快速響應 AI 領網域的動态需求。反觀 NVIDIA GPU，憑借通用架構和 CUDA 生态的加持，不僅能覆蓋訓練與推理的全流程，還能靈活适應新算法的演進。這種靈活性讓 ASIC 在競争中相形見绌。

博通和 Marvell 作為 ASIC 設計服務的兩大廠商，也面臨不利局面。

去年底，The Information 報道稱，蘋果正與博通合作開發代号為 "Baltra" 的 AI 伺服器芯片。這款芯片聚焦網絡技術，預計 2026 年量產，僅限蘋果内部使用，并采用台積電 N3P 工藝（與 OpenAI 和 NVIDIA 的 AI 芯片工藝一致）。盡管博通在傳統數據中心市場憑借網絡加速器等定制 ASIC 表現強勁，但其產品在 AI 訓練領網域的競争力仍無法與 GPU 抗衡。

Marvell 則通過 ThunderX 系列 Arm CPU 和定制芯片布局 AI 市場，但其方案更偏向推理而非訓練，難以滿足蘋果在大規模 LLM 訓練上的需求。

蘋果此前透露，它也在探索使用亞馬遜的 Trainium2 芯片進行 AI 模型預訓練。如今選擇英偉達 GPU，還是佐證了通用 GPU 尤其是英偉達 GPU 短期地位難以撼動。

當然，這并不意味着 ASIC 徹底退出舞台。蘋果未來可能采取 "GPU 訓練 +ASIC 推理 " 的混合策略，利用 NVIDIA 完成模型開發，再用 Apple Silicon 優化邊緣部署。然而，在當前階段，ASIC 的 " 失敗 " 更多是時間視窗的失利，而非技術的終結。

總結

蘋果 10 億美元豪購 NVIDIA GB300 NVL72 的決定，既是其 AI 戰略的急轉彎，也是 GPU 在生成式 AI 時代統治力的又一注腳。在這場技術與時間的賽跑中，通用算力以其現成性和适應性，擊敗了定制化方案的長期潛力，即使如蘋果這般自研能力傲視群雄的巨頭，也不得不向現實低頭。Siri 的失利、Gen AI 的狂飙，以及用户對 " 智能協同 " 的新期待，共同将蘋果推向了英偉達的懷抱。然而，這并非 ASIC 的終曲，而是時間視窗與生态博弈的階段性結果。未來，當蘋果的自研芯片與 GPU 的混合策略成熟，AI 算力的王座之争或許會迎來新的轉折。但至少在當下，英偉達的 GPU 不僅是技術的勝利，更是時間鐵律的化身——在 AI 的狂潮中，誰能更快站上風口，誰就握住了定義未來的鑰匙。