今天小編分享的互聯網經驗:馬斯克花錢砸出的Grok 3,超越DeepSeek與OpenAI?,歡迎閱讀。
文 | 科技旋渦
北京時間 2 月 18 日午間,馬斯克旗下人工智能初創公司 xAI 正式發布新一代聊天機器人 Grok 3。馬斯克和他的人工智能團隊聲稱,Grok 3 測試版的高級推理能力超過了現有的人工智能模型。
馬斯克這個号稱地表最聰明的 AI,完美诠釋了什麼叫 " 有錢任性 ",只因其使用了 20 萬塊 GPU 訓練模型。那麼,它真的能夠超越風頭正盛的 DeepSeek 和行業先鋒 OpenAI 嗎 ?
燒錢無數的 Grok 3 有多強 ?
在 Grok 3 的直播中,馬斯克等人介紹了 Grok 3 的訓練歷程。去年馬斯克劇透,Grok 3 在 10 萬張 H100 上進行訓練,是首個達到如此訓練集群規模的模型。今天的發布會上又透露,到訓練進行到第 92 天時,集群規模擴展到了 20 萬卡。
Grok 3 的實力也的确證明了,在當下這個時期,砸錢是一種巨大的優勢。這一波 Grok 3 有滿血和 mini 兩個版本,在數學、科學、代碼等數據集上表現均超過了 GPT-4o、DeepSeek-V3 等非推理模型。
Grok-3 mini 的性能基本上領先或媲美其他閉源 / 開源模型。在著名大模型 LMSYS Arena 排行榜中,Grok-3 刷榜,Elo 評分超 1400 位列最高,沒有任何一個模型能與之相比,堪稱斷層式領先。
xAI 團隊還展示了 Grok 3 如何執行有趣的任務。例如計算從地球到火星的航天器任務。Grok 3 生成了一張太空發射的動畫 3D 軌迹圖 ( 即從地球到火星然後再返回地球的可行軌迹 ) 。這涉及一些復雜的物理知識,Grok 3 需要理解這些内容。
Grok 3 還展示了在自動化遊戲開發方面的潛力。xAI 團隊要求 Grok 3 現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新遊戲。Grok 3 生成的 Python 腳本定義了遊戲的常量、顏色、方塊形狀等元素,并呈現出獨特玩法:當連接了至少三個相同顏色的方塊時,會觸發重力機制使方塊消除,這種方式類似《寶石迷陣》。
此外,Grok 3 包含一個名為 Big Brain 的功能,這是一個推理模型模式,允許在處理查詢時進行更深入的思考。馬斯克指出,17 個月前,最初的 Grok 模型幾乎不能解決高中問題,而現在它已經進步了很多,他幽默地比喻 "Grok 已經準備好上大學了 "。
性價比與猛砸錢,大模型的路該怎麼走 ?
眾所周知,DeepSeek 通過獨特的算法優化、架構設計以及高效的資源利用方式,大幅降低了對英偉達高端 GPU 的依賴。這也致使英偉達股價暴跌 16.97%,市值單日蒸發約 5926.58 億美元。
DeepSeek 聲稱其模型訓練成本僅為同類模型的 1/5 至 1/10,這意味着其在擺脫英偉達硬體束縛的情況下,仍然在推理性能等方面都表現出與 ChatGPT-o1 接近的能力,部分領網域還有所超越。
反觀馬斯克的 Grok 3 不僅砸進去 20 萬塊 GPU,更是為了盡快推出 Grok 3,在短短四個月内建成數據中心。如此巨大的投入換來的也僅僅只是 lmArena 排行榜中 41 分的提升,這真的值嗎 ?
事實上,馬斯克瘋狂砸錢的舉動或許有着提前布局的考量。當下,任何 AI 的訓練都離不開 GPU,只不過 DeepSeek 走的是 " 精算師路線 " ——通過算法優化,用行業 1/10 的成本實現 90% 的性能。而馬斯克的 20 萬塊 GPU 不僅是為了快速推出 Grok 3,更可能是為了後續依舊保持快速迭代的選擇。
寫在最後
誠然,馬斯克的 Grok 3 的确超越了 DeepSeek,但似乎更像是一個加強版,而非大跨度的領先。我們期待看到未來 DeepSeek 依舊能夠憑借超高的 " 性價比 " 再度震驚世界。