今天小編分享的科技經驗:DeepSeek算力需求暴降,為什麼全球算力競賽反而更瘋狂了?,歡迎閱讀。
本文來自微信公眾号:觀弈行研,作者:我是叁叁啊,原文标題:《DeepSeek 算力悖論:算力需求暴降?一場 " 降本增效 " 的觀察與迷思》,題圖來自:AI 生成
春節期間,國產大模型 DeepSeek-R1 的橫空出世,一度讓人們看到了 " 降本增效 " 的曙光。DeepSeek-R1 以更低的成本和算力需求,實現了世界一流的模型性能,打破了大模型領網域 " 燒錢買芯片 " 的傳統路徑。
彼時彼刻,英偉達股價應聲下跌,似乎印證了市場對算力需求放緩的預期,也宣告着 " 暴力堆算力 " 時代的終結。
然而,在通往 AGI 的征途上,算力真的不再重要了嗎?至少,從矽谷科技巨頭們的行動來看,答案是否定的——這場效率革命,正在将人類拽入更瘋狂的算力競賽。
一、 巨頭加碼:矽谷的 " 反效率 " 投資
與 DeepSeek 的算力焦慮不同,矽谷的科技巨頭們顯然沒有對此產生任何遏制的擔憂,反而在不斷增加投入。1 月底以來,谷歌、微軟、Meta 和亞馬遜這四大科技巨頭相繼發布了最新财報。令人矚目的是,他們不約而同地在财報中強調:2025 年将加大在算力方面的投入。
谷歌母公司 Alphabet 在 2025 年的資本開支目标為 750 億美元,較上年激增 42%。微軟同樣表示,2025 财年将在人工智能數據中心上投資 800 億美元,并透露其對于算力投資的節奏保持謹慎,原因在于硬體的快速迭代。
Meta 和亞馬遜也分别在财報中披露了大幅增加算力投入的計劃。Meta 将其資本開支預算增加了 66%,而亞馬遜則計劃在 2025 年投入 1000 億 ~1050 億美元,主要用于 AI 和雲服務領網域。
面對 DeepSeek,矽谷的四大科技巨頭——谷歌、微軟、Meta 和亞馬遜,以加碼算力的方式回應了這一挑戰。算力,似乎仍然是支撐未來 AI 技術發展的核心資源。
二、 傑文斯悖論在 AI 領網域的再度應驗
四巨頭在算力上的持續投入,并非對 DeepSeek 視而不見。但亞馬遜 CEO Andy Jassy 指出,推理成本的降低并不意味着總支出下降," 我們在雲計算領網域經歷過類似情形 "。微軟 CEO 納德拉則在社交媒體上引用了 " 傑文斯悖論 " 來表達他的觀點。
如經濟學家傑文斯所言:技術進步雖然提高了資源的使用效率,但需求的增加常常會導致總消耗量反而增加。
具體到實際,我們可以看到,過去在汽車領網域,發動機熱效率的提高使得車輛燃油消耗降低,但因使用成本降低,車主反而選擇更多購車,最終導致石油的消耗量反而增加。
這一悖論同樣适用于 AI 領網域。當微軟 CEO 納德拉在 X 平台轉發 " 傑文斯悖論 " 詞條時,現實中正在上演着現代版的技術寓言:1850 年,英國蒸汽機的熱效率提升了三倍,煤炭消耗量卻暴漲了十倍;而今天的 R1 模型将推理成本壓縮了 97%,全球的算力需求卻因其高性價比反而呈現指數級膨脹。
更殘酷的現實在于:DeepSeek-V3 的混合專家架構(MoE)在推理環節,需要同時激活 14 個專家模塊。這導致在線服務時,每個 token 生成需消耗 0.78TFLOPs 算力,較傳統架構高出 18%。
可以說,效率革命的 B 面,是更復雜的資源調度噩夢。
具體到實際數據,可以看到,DeepSeek API 調用量在推出後迅速飙升。根據市場機構估算,DeepSeek 每秒的推理算力需求已經接近 1.6×10^19 TOPs。
而前不久,DeepSeek 官方甚至發表聲明,暫停其 API 充值服務,原因便是伺服器算力資源緊張。
一系列數據的背後仍然依賴于強大的硬體支持。而 DeepSeek 的出現,沒有抑制算力的需求,反而推動了更多企業和開發者投入更多資源以獲得服務,加劇了算力資源的壓力。
三、 DeepSeek 的隐憂:算力之下的挑戰
" 成本創新 " 并不等于 " 削減算力 "。DeepSeek-R1 的訓練成本大幅降低,但依然遵循着 Scaling Law。在其之下,模型性能與算力需求可以近似看作一個正相關函數。過往的模型效率較低,性能提升緩慢;DeepSeek 效率較高,性能提升更快。在這種情況下,企業大概率會因為效率更高而加大投入,而非減少投入。
而 DeepSeek 在算力方面的努力遠未結束。随着硬體和算法的不斷進化,DeepSeek 依然會通過創新優化降低算力需求,但從當前的趨勢來看,算力的需求依舊高漲。
與其擔心算力過剩,我們或許更應該關注的是:當算力和效率都得到提升時,優質訓練數據是否會成為新的瓶頸?
微軟研究院的最新模拟顯示,要保持大模型性能的指數增長,2026 年需要 430 艾字節 ( EB ) 的高質量訓練數據——這相當于把人類現存所有文字資料復制 2300 遍。
為便于理解,依然以汽車為例,當汽車油耗(模型效率)和汽油(算力)都充足時,如果道路(優質訓練數據)不足,就會導致 " 堵車 ",出行速度無法進一步提升。
當科技巨頭們開始不計代價地購入算力,優質數據的焦慮,正在變異為更本質的危機。
四、產業變局 : 本地部署的浪潮
DeepSeek 暫停 API 充值服務,引發了用戶對其算力資源的擔憂,但在另一方面也意外激活了本地部署的第二戰場。
微軟率先宣布将針對 NPU 優化的 DeepSeek R1 版本直接嵌入 Windows 11 Copilot+ PC,讓開發者可在本地構建 AI 應用。英特爾則表示其 Ultra 系列處理器已實現 R1-7B 蒸餾模型的本地推理,延遲控制在 300ms 以内。而國内廠商中,華為、軌迹流動、阿裡、知乎等互聯網公司也相繼宣布部署 DeepSeek 模型。
甚至,騰訊 " 元寶 " 與百度 " 文小言 " 也官宣将接入 DeepSeek-R1 模型。
DeepSeek 無疑為 LLM 大模型的發展提供了新的思路,但這無法從根本上消除全球範圍内的算力焦慮。而這場靜默的本地部署與算力之争,亦将持續下去。
寫在最後:算力競賽,遠未結束
DeepSee-R1 的出現,證明了算法優化和工程創新的重要性,也讓我們看到了 " 輕量級颠覆 " 的可能性。
然而,DeepSeek 并不能終結算力競賽。相反,算力依然是核心驅動力。但這場競賽将不再是單純的 " 堆料 ",而是算法與算力的雙重博弈。誰能更好地平衡效率與投入,誰就能在這場競賽中占據優勢。
在這場沒有終點的馬拉松裡,DeepSeek 既是破局者也是催化劑。它用算法利刃劈開算力鐵幕,卻釋放出更洶湧的欲望洪流 ……
本文來自微信公眾号:觀弈行研,作者:我是叁叁啊