今天小編分享的互聯網經驗:華爾街這是”約好了一起唱空“?巴克萊:現有AI算力似乎足以滿足需求,歡迎閱讀。
繼 TD Cowen 後,巴克萊似乎也開始唱空 AI 算力。
3 月 26 日,巴克萊發布最新研究稱,2025 年全球 AI 算力可支持 15-220 億個 AI Agent,似乎足以滿足美國和歐盟的絕大部分需求。而同日TD Cowen 分析師稱支撐人工智能運算的計算機集群供過于求。
巴克萊研報指出,AI 行業需要從 " 無意義基準測試 " 轉向真正有用的 Agent 產品部署。同時巴克萊分析師表示:
AI Agent 市場的增長潛力巨大: 行業算力能夠支持大規模 Agent 部署,預示着巨大的市場機會。
推理成本是關鍵: 低推理成本對于 Agent 產品的盈利至關重要,這将驅動對更高效的 AI 模型和算力的需求。
開源模型的重要性: 開源模型将在降低成本方面發揮關鍵作用,投資者應關注相關領網域的動态。
算力供需:過剩還是不足?
關于 AI 算力的供需平衡,巴克萊展示了幾個核心發現:
行業推理容量基礎:2025 年全球約有 1,570 萬個 AI 加速器(GPU/TPU/ASIC 等)在線,其中 40%(約 630 萬個)将用于推理,而這些推理算力中約一半(310 萬個)将專門用于 Agent/ 聊天機器人服務;
算力分配正在演變:企業客戶已開始轉向成本更低的開源模型,如 Salesforce 的 Agentforce 采用 Mistral 開源模型(7B-141B 參數),而非最昂貴的專有前沿模型;
開源模型下載激增:Hugging Face 數據顯示 DeepSeek、Llama 和 Mistral 等開源模型的下載量正在迅速增長,這一趨勢将随着從聊天機器人向 Agent 的轉變而加速。
算力供應雖然表面上充足,但面臨結構性挑戰。巴克萊明确表示:
如果 Agent 產品真正起飛并對消費者和企業用戶非常有用,我們可能需要
1)更便宜、更小但性能同樣高的基礎模型(DeepSeek 風格);
2)更多推理芯片安裝;以及
3)可能需要将已安裝的訓練 GPU 重新用于推理。
這表明,雖然目前總體算力看似充足,但針對高效、低成本 Agent 產品的專用算力仍有較大缺口。巴克萊指出這意味着,在 AI Agent 賽道上,具有高效推理成本結構和專注開發小型高效模型的公司可能擁有更大競争優勢,而僅依賴大模型而不考慮部門經濟學的公司可能面臨更大挑戰。
推理成本:AI Agent 的經濟學挑戰
巴克萊指出AI Agent 的推理成本正成為行業發展的核心考量因素:
AI Agent 生成的 Token 數量巨大:相比傳統聊天機器人,Agent 產品每次查詢生成約 10,000 個 Token,是聊天機器人 ( 約 400 個 ) 的 25 倍,這極大增加了推理成本;
不同模型的經濟效益差異巨大:以年度訂閱成本計算,基于 OpenAI o1 模型的 Agent 產品成本高達 2,400/ 年,而基于 DeepSeekR1 模型僅需 88/ 年,後者提供了 15 倍于前者的用戶容量;
超級 Agent 需求正在興起:OpenAI 計劃推出的 " 超級 Agent" 產品,這類高端產品将消耗更多 Token,每月高達 3,560 萬個,每日查詢次數可達 44 次,遠超普通 Agent 的 2.6 次。
從部門經濟學角度看,以 Token 計價的模式将決定不同模型的市場競争力。正如巴克萊研究指出:
這證明了低推理成本的重要性。由于其自主性質,Agent AI 產品的 Token 消耗趨勢遠高于聊天機器人。
此外,巴克萊分析師表示,雖然 " 超級 Agent" 有潛力,但其高昂的推理成本可能限制其大規模應用。投資者在評估此類產品時,應謹慎考慮其經濟可行性。