今天小編分享的科技經驗:馬斯克用20萬塊英偉達芯片練出Grok 3,印證了DeepSeek真的強,歡迎閲讀。
文 / 王新喜
馬斯克的人工智能初創公司 xAI 發布了更新版 Grok 3 大模型,馬斯克稱之為 " 地球上最聰明的人工智能 "。
Grok 3 是用 20 萬塊英偉達芯片練出來的,運算能力是上代 10 倍。
xAI 在當天的直播中,馬斯克與該公司的三位工程師一起進行了現場演示,Grok 3 在數學、科學和編程基準測試中,Grok 3 擊敗了谷歌 Gemini、DeepSeek 的 V3 模型、Anthropic 的 Claude 和 OpenAI 的 GPT-4o。
據馬斯克此前介紹,Grok 3 是在大量的合成數據上訓練的。它會反復檢查數據,試圖達到邏輯一致性。如果有錯誤的數據,它會反思并删除錯誤數據。
從目前測試看,Grok3 在 AIME'24 數學能力測試、GPQA 科學知識評估、LCB Oct - Feb 編程能力測試等多項測試中成績均高于 DeepSeek。擁有 " 思維鏈 " 推理機制,能像人類一樣逐步拆解復雜任務。參數量達 1 萬億級别。
Grok3 确實在不少任務上表現得很棒,例如在處理復雜邏輯和推理任務時,它的能力确實有東西。不過 Grok3 用海量 GPU 刷了榜單上的分數,數學、編程分高,其實也沒好多少,沒有拉開差距。而 DeepSeek 的優勢在于中文理解和多模态互動方面,它的表現一直很穩定,在實際應用場景中已經得到了不少驗證。
最關鍵的問題在于,Grok3 成本極其高,計算量是前代 Grok 2 的 10 倍,有説法是其訓練成本就 30 億美元,根據相關工程師透露 xAI 旗下超算中心算力已經翻倍。
去年 4 月,馬斯克認為 xAI 若想成功打造出最佳 AI,唯一途徑是自建數據中心。由于想盡快推出 Grok 3,時間緊迫,于是決定在四個月内建成數據中心。最終,團隊耗時 122 天讓第一批 10 萬個 GPU 啓動并運行,不過要構建理想中的 AI 需将集群規模翻倍。發布會上透露,團隊僅用 92 天就已經實現了超算集群的算力翻倍,也就是 GPU 數量已達 20 萬塊。
20 萬塊 GPU 多少錢?以英偉達 H100 為例,單卡價格約為 2.5 萬 -3 萬美元。20 萬塊 × 3 萬美元 = 60 億美元(僅硬體采購成本)。這還只是 GPU 硬體成本,實際部署成本更高,還需考慮配套裝務器、網絡設備、電力、冷卻設施等,總成本可能達百億美元量級,砍一半也高達 50 億美金。
Deepseek 從訓練成本來看僅有 600 萬美元,遠低于 GPT-4 的 7800 萬美元。後續 deepseek 資金、人才、資源上去了,綜合能力肯定不比 Grok3 差。
Grok 3,印證了 DeepSeek 真的強
這説明了什麼,説明了兩點,其一,馬斯克花了那麼多錢堆了比 OpenAI 還多的算力,最後搞出來個跟 OpenAI 差不多的產品。第二,這證明了 DeepSeek 真的強啊,馬斯克大把燒美金當柴火搞煉丹,效果全靠堆硬體,而且從數據來看,和 DeepSeek 并沒有拉開多少差距,DeepSeek 那邊走低成本路線都能差不多打平手,那只能更説明 DeepSeek 非常強。
因為這是兩條不同的路線,一個是力大拍磚大力出奇迹堅定地砸錢堆算力,一個是創新的工程設計與高效的訓練方法,優化節省資源追求極致性價比,是兩條完全不同的路線。
而堆算力的遊戲,是讓 AI 成為美國人主導算力資源分配的遊戲。美國可以通過控制 GPU 芯片出口,精确調控全球 AI 生產力水平。并且把全球獲取 AI 算力劃分為三個等級圈,由它來控制分配,這讓其他國家陷入絕望。
而且特朗普還投資 5000 億美元的 " 星際之門 ",目的就是将 AI 領先牢牢鎖在美國本土,吸引把日韓、中東、歐洲等相關資金,把除中國外的其他實力國家牢牢綁在老美的 AI 戰車之上。
而 DeepSeek 則打破了這種主導,給了其他所有國家看到了自主發展 AI 的希望,因為它在實現 OpenAI 模型的同等性能時,僅需要對方 5% 的算力,以低成本模式直接掀翻了美國一眾科技巨頭,這下所有的國家都覺得自己都能行了。因為,這意味着所有的國家都不需要依賴美國高算力 GPU 芯片資源了,而且還能把成本極大的降下來。
這是現在到處搞錢的特朗普特别看重的能力,DeepSeek 的橫空出世,為啥不光是英偉達、AMD 等企業很快接入,特朗普也一反常态的點贊——他們就一個意思:省成本,省社會總成本,可以給整個國家省下老鼻子錢了。
而且在 AI 大模型發展到現在,其實模型能力已經很難分出絕對的勝負了,在大指标不斷趨同的背景下,開源才是大招,知名投資人朱嘯虎曾經提出一個判斷,開源模型的基礎就是閉源模型的斬殺線,今後閉源模型必須要做到開源基礎的兩到三倍才有活下去的機會。否則十倍成本砸下去性能只提高 20%,那即使是硅谷的投資人也不會接受這樣的結果。
而真用起來如何,也只有開源的才能比較充分測試。不開源,人家還交錢用,還沒什麼特别領先的,商業模式就很難成立。
加上有 Chatgpt 和 deepseek 的巨大成功在前,grok1 和 grok2 差不多無人問津,grok3 單純砸錢堆算力實現大火上演反轉劇情的幾率并不大。
如果不開源,馬斯克巨大的投入無法變現,或會自用到自己的機器人和 FSD。不過話説回來,目前特斯拉 FSD 用户訂閲并不高,但是 Grok-3 還是能增強 FSD 的競争力。
因為 Grok 3 基于 10 萬塊英偉達 H100 芯片訓練,每秒可處理超過 1.5 萬億參數,能實時解析車載攝像頭、雷達等傳感器數據,比競品在識别暴雨天氣下道路積水深度的準确率高 37%,可幫助自動駕駛系統更精準地感知周邊環境。
此外是 Grok 3 引入 " 思維鏈 " 技術,可模拟人類逐步推理過程,在導航時能綜合分析實時交通數據、充電樁可用性和用户日程推薦路線,在自動駕駛場景中,面對復雜路況和交通信号時能做出更合理、安全的決策。
如果特斯拉将其用到 FSD,這意味着新能源車企的智駕競争會更加激烈,對此中國的車企要有足夠的認知與準備。
相對于 Grok3,deepseek 的優勢是創新的工程設計與算法優化實現的超低成本、其次是開源模式的生态與技術優化能力會讓未來包括美國在内的很多科研人員只能在東大的 AI 模型上搞開發了!東大有望成為世界 AI 的開發中心。加上我們舉國之力支持,中國成百上千行業都在快速接入,促進它不斷進化,和千行百業結合實踐,產生生產力。未來發展潛力,可能不是 Grok3 能比的,我們拭目以待。
作者:王新喜 TMT 資深評論人 本文未經許可謝絕轉載