馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？

今天小編分享的互聯網經驗：馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？，歡迎閱讀。

文 | 科技旋渦

北京時間 2 月 18 日午間，馬斯克旗下人工智能初創公司 xAI 正式發布新一代聊天機器人 Grok 3。馬斯克和他的人工智能團隊聲稱，Grok 3 測試版的高級推理能力超過了現有的人工智能模型。

馬斯克這個号稱地表最聰明的 AI，完美诠釋了什麼叫 " 有錢任性 "，只因其使用了 20 萬塊 GPU 訓練模型。那麼，它真的能夠超越風頭正盛的 DeepSeek 和行業先鋒 OpenAI 嗎 ?

燒錢無數的 Grok 3 有多強 ?

在 Grok 3 的直播中，馬斯克等人介紹了 Grok 3 的訓練歷程。去年馬斯克劇透，Grok 3 在 10 萬張 H100 上進行訓練，是首個達到如此訓練集群規模的模型。今天的發布會上又透露，到訓練進行到第 92 天時，集群規模擴展到了 20 萬卡。

Grok 3 的實力也的确證明了，在當下這個時期，砸錢是一種巨大的優勢。這一波 Grok 3 有滿血和 mini 兩個版本，在數學、科學、代碼等數據集上表現均超過了 GPT-4o、DeepSeek-V3 等非推理模型。

Grok-3 mini 的性能基本上領先或媲美其他閉源 / 開源模型。在著名大模型 LMSYS Arena 排行榜中，Grok-3 刷榜，Elo 評分超 1400 位列最高，沒有任何一個模型能與之相比，堪稱斷層式領先。

xAI 團隊還展示了 Grok 3 如何執行有趣的任務。例如計算從地球到火星的航天器任務。Grok 3 生成了一張太空發射的動畫 3D 軌迹圖 ( 即從地球到火星然後再返回地球的可行軌迹 ) 。這涉及一些復雜的物理知識，Grok 3 需要理解這些内容。

Grok 3 還展示了在自動化遊戲開發方面的潛力。xAI 團隊要求 Grok 3 現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新遊戲。Grok 3 生成的 Python 腳本定義了遊戲的常量、顏色、方塊形狀等元素，并呈現出獨特玩法：當連接了至少三個相同顏色的方塊時，會觸發重力機制使方塊消除，這種方式類似《寶石迷陣》。

此外，Grok 3 包含一個名為 Big Brain 的功能，這是一個推理模型模式，允許在處理查詢時進行更深入的思考。馬斯克指出，17 個月前，最初的 Grok 模型幾乎不能解決高中問題，而現在它已經進步了很多，他幽默地比喻 "Grok 已經準備好上大學了 "。

性價比與猛砸錢，大模型的路該怎麼走 ?

眾所周知，DeepSeek 通過獨特的算法優化、架構設計以及高效的資源利用方式，大幅降低了對英偉達高端 GPU 的依賴。這也致使英偉達股價暴跌 16.97%，市值單日蒸發約 5926.58 億美元。

DeepSeek 聲稱其模型訓練成本僅為同類模型的 1/5 至 1/10，這意味着其在擺脫英偉達硬體束縛的情況下，仍然在推理性能等方面都表現出與 ChatGPT-o1 接近的能力，部分領網域還有所超越。

反觀馬斯克的 Grok 3 不僅砸進去 20 萬塊 GPU，更是為了盡快推出 Grok 3，在短短四個月内建成數據中心。如此巨大的投入換來的也僅僅只是 lmArena 排行榜中 41 分的提升，這真的值嗎 ?

事實上，馬斯克瘋狂砸錢的舉動或許有着提前布局的考量。當下，任何 AI 的訓練都離不開 GPU，只不過 DeepSeek 走的是 " 精算師路線 " ——通過算法優化，用行業 1/10 的成本實現 90% 的性能。而馬斯克的 20 萬塊 GPU 不僅是為了快速推出 Grok 3，更可能是為了後續依舊保持快速迭代的選擇。

寫在最後

誠然，馬斯克的 Grok 3 的确超越了 DeepSeek，但似乎更像是一個加強版，而非大跨度的領先。我們期待看到未來 DeepSeek 依舊能夠憑借超高的 " 性價比 " 再度震驚世界。