今天小編分享的互聯網經驗:200萬人關注!馬斯克Grok 3号稱“地表最強AI”,性能超DeepSeek,OpenAI加緊圍堵,歡迎閱讀。
馬斯克(圖片來源:視頻截圖)
剛剛,馬斯克(Elon Musk)提前扔出 " 王炸 ",與 OpenAI o1、DeepSeek-V3/R1 等模型一決高下。
北京時間 2 月 18 日 12 點 30 分左右,馬斯克 xAI 團隊展示和 OpenAI 一樣的發布會形式,三位技術負責人與馬斯克一同發布 Grok 3 基座大模型。在此之前,馬斯克稱其為 " 地球上最聰明的人工智能 "。
同時,xAI 還公布推理 AI 模型 Grok3 mini(Reasoning,精簡版),基于 Grok 3 的 " 深度思考 "(Deep thinking)的 Agent 智能搜索引擎,以及基于 Grok App 的獨立訂閱服務 "Super Grok" 等。
據钛媒體 AGI 統計,這場直播在 X 平台上擁有超過 200 萬人觀看。
具體來說,Grok3 模型訓練計算量(能力)比上一代高 10 倍,使用了 20 萬張 GPU 卡集群,第一階段 122 天使用 10 萬個 GPU 全面訓練同步,第二個階段,92 天擴展到 20 萬張 GPU 卡再次訓練、推理。
結果顯示,在數學能力測試(AIME24)中,Grok-3 模型獲得 52 分,超過 DeepSeek-V3 的 39 分,以及 OpenAI o3-mini 等模型;科學知識評估(GPQA)、編程能力測試(LCB Oct-Feb)等方面,Grok-3 模型表現優異,最新 AIME 2025 性能測試中,Grok-3 Reasoning Beta 版本在推理和計算時間復合評分上取得 93 分的優異成績,其精簡版本 Grok-3 mini 也達到了 90 分,而 DeepSeek-R1、Gemini-2 Flash Thinking 分别為 75 分、54 分。
馬斯克表示,Grok 3 比 Grok 2 的能力提升了一個數量級。在一系列演示中,馬斯克和他的同事讓 Grok 3 解決一道物理題,并創作一款融合《寶石迷陣》和《俄羅斯方塊》的遊戲,不過,Grok 3 的推理模型處于測試版,仍在訓練中。
事實上,就在上周在迪拜的世界政府峰會上,馬斯克提到,xAI 距離發布新產品還有一、兩周的時間,以确保最佳的用戶體驗,因為他不想操之過急。然而如今,馬斯克決定提前推出 Grok 3,而且他花了整個周末的時間和他的團隊一起完善產品。
" 我們有信心 Grok 3 會比其他任何 AI 都強,而且很有可能,再也不會有比 Grok(系列)更強的 AI 了。" 馬斯克表示,Grok 3 模型有非常強大的 AI 推理能力,在測試中,Grok 3 的表現 " 優于市面上任何已知產品 "。
然而,目前有分析指出,在 " 推理 + 測試時間計算 " 這一測試中,使用 20 萬張卡的 Grok 3 模型,其數學性能相較于 o3-mini-high 模型,或是 DeepSeek R1 模型,并沒有顯著優勢。
馬斯克也坦言,語音模式仍有點不穩定,大概一周後可能推出,不過它非常棒。據悉,從今天開始,X 平台 Premium Plus 訂閱用戶将率先獲得 Grok 3 訪問權限,獨立應用則需要訂閱 Super Grok 服務,售價還未公布。
這場馬斯克與 OpenAI 争奪 " 地表最強 AI" 的故事并未結束。
這場直播的同一時間,OpenAI 對 FT" 透風 " 稱:為抵御馬斯克主動發起的收購要約,OpenAI 正在考慮賦予其非營利性董事會特殊投票權,将确保其對重組後的公司保持控制權,并能夠否決包括微軟和軟銀等現有投資者以及董事會決策,從而确保 OpenAI 能夠擊退像馬斯克這樣的外部敵意收購。
OpenAI CEO 奧爾特曼早前透露:GPT-4.5 将會讓更多人感受到 AGI 時刻。
Grok 3 如何成為 " 地表最強 AI 模型 "
xAI 公司成立于 2023 年 7 月,馬斯克的團隊成員主要來自 OpenAI、DeepMind 以及其他頂級 AI 研究公司。馬斯克創立 xAI 公司的目的,就是與 OpenAI 展開競争。
回溯 2015 年,馬斯克與奧爾特曼等人共同創立 OpenAI,旨在推動 AI 技術開源,讓更多人受益。但到了 2018 年,雙方出現分歧。馬斯克堅持 OpenAI 保持非營利屬性,專注開源和安全,并且馬想要多數股權和董事會控制權,卻被奧爾特曼拒絕,奧爾特曼則想讓公司轉為營利性,以吸引更多資本投入 AI 技術開發。
最終,馬斯克在 2018 年離開公司,并且随着 ChatGPT 的爆火,馬斯克建立 xAI 參與競争。
過去一年多時間裡,xAI 團隊發布了 Grok、Grok 1.5、Grok 2 模型。去年 12 月,xAI 宣布将向 X 平台上所有用戶免費提供 Grok-2 服務。同時,xAI 還發布 Grok 獨立應用程式,這意味着用戶不需要依賴 X 平台訪問 AI 模型。
如今,馬斯克證明自己的時間到了。
直播開始時,馬斯克表示,xAI 和 Grok 的使命是了解 AGI(宇宙)的本質,外星人在哪裡,生命的意義是什麼?這将是好奇心所驅動,同時也導致 xAI 成為最大限度尋求真相的 AGI 公司的原因。
在此之前,Grok 2 模型使用了 2400 億參數規模,性能媲美 GPT-4,如今在 Grok 3 上,"我們有一個非常正确的工程團隊和所有最好的 AI 力量,我們唯一需要的是來自大集群的智能體系。我們現在可以恢復 xAI 的整個進度,運行多少個 GPU 來訓練一個大型語言模型來壓縮整個互聯網。"
馬斯克指出,過去的日子裡,團隊在訓練質量上遇到了很多麻煩。" 自(去年)2 月開始,我們認為我們有大量的芯片,但事實證明,我們幾乎不能讓訓練芯片在任何給定的時間連貫地運行,冷卻和電源問題太多了,數據中心真的有點像 AK 芯片,平均 80% 的效率,數百次有效 H100 訓練。4 個月後,我們花了 122 天才完成了第一個 10 萬卡訓練,但我們并沒有就此止步。實際上決定,如果我們想要構建巨型人工智能,需要立即将集群的大小增加一倍。因此,我們在另一個地方做了 92 天。"
馬斯克早前直言,Grok 3 将成為 AI 領網域真正的颠覆者," 有時候我覺得 Grok 3 聰明得可怕,如果它發現數據錯了,它會反思并删除錯誤數據。"
馬斯克表示,xAI 是基于合成數據進行訓練的,能夠通過反復檢查數據來反思所犯的錯誤,從而實現邏輯一致性。
技術參數層面,Grok 3 模型擁有 20 萬 GPU 數量。相較于 Grok2,計算能力提高了 10 倍,也是推理模型,具有 DeepSearch 功能,而 Big Brain 功能是通過更多的計算來解決問題。
有分析稱,Grok 3 算力消耗是 Deepseek V3 的 263 倍。
直播結束後,OpenAI 聯合創始團隊成員、AI 研究學者安德烈 · 卡帕斯 ( Andrej Karpathy ) 表示:Grok 3+Thinking ,大概和 OpenAI 最強的模型(比如 o1-pro,月費 200 美元)相當,比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 略好一些。
" 考慮到該團隊大約 1 年前從零開始,這個達到最先進領網域的時間表是前所未有的,這真是令人難以置信。注意,這些模型是随機的,每次可能會給出略有不同的答案,而且現在還為時過早,所以我們必須等待未來幾天 / 幾周的更多評估。現在祝賀 xAI 團隊,他們顯然擁有巨大的速度和動力。" 卡帕斯表示。
馬斯克 xAI 正融資 100 億美金,但他收購 OpenAI 計劃泡湯
就在馬斯克 xAI 新模型發布前數小時内,奧爾特曼發布了兩、三條推文 " 吸引火力 ",釋放 GPT-4.5、開源等關鍵信息,試圖讓 xAI 發布會 " 失焦 "。
事實上,當地時間 2 月 10 日,由馬斯克牽頭的投資者财團提出以 974 億美元的價格收購 OpenAI。
馬斯克的律師馬克 · 托貝羅夫确認了這一消息,并稱已向 OpenAI 董事會提交了該收購要約。交易完成後,OpenAI 很可能會與 xAI 進行合并,這将幫助 xAI 迅速填補技術差距,并形成可與谷歌、微軟抗衡的 AI 巨頭。
如果實現這一收購計劃,不僅成為全球 AI 領網域最大規模的并購交易,促使全球 AI 行業未來走向充滿變數,而且也讓馬斯克與奧爾特曼之間由來已久的矛盾激化。
就在 2024 年底,OpenAI 宣布,它需要籌集比預期更多的資金才能實現其目标,并制定了向營利性結構過渡的計劃,計劃重組為一家擁有普通股的公益公司(PBC)。" 大公司現在投資于 AI 開發的資金高達數千億美元,這充分說明了 OpenAI 繼續追求這一使命需要什麼。"
但對于馬斯克來說,這種盈利性發展,違背了 OpenAI 成立初衷,因此,馬斯克對此并未坐視不管。
2024 年 11 月,馬斯克團隊向美國加州北區地方法院申請初步禁令,對 OpenAI 提出多項指控,包括阻礙投資者支持其競争對手 xAI、利用與微軟的關系非法獲取競争敏感信息、改變非營利治理結構轉移關鍵資產和知識產權,以及通過自利交易損害公眾利益和初創使命。馬斯克的律師稱,若禁令不獲批,将造成 " 無法彌補的損害 ",還指出 OpenAI 已背離初心,成了微軟的 " 閉源子公司 "。
而随着馬斯克計劃 974 億美元收購 OpenAI 消息釋出,奧爾特曼并不買賬。對于收購要約,他在社交平台上回應稱:" 不了,謝謝。但如果你願意的話,我們可以花 97.4 億美元收購推特。"
這個回應也充滿了奧爾特曼對馬斯克的暗諷。要知道,97.4 億美元的報價僅為馬斯克當年收購推特成本的 22%,這也意在嘲諷馬斯克的經營不善,導致 X 平台估值縮水。
對于奧爾特曼的回復,馬斯克也作出了回應,他留言稱奧爾特曼是 " 騙子 "。
2 月 16 日,OpenAI 董事會正式拒絕了馬斯克的收購邀約。
"OpenAI 是非賣品,董事會一致否決了馬斯克先生破壞競争的最新企圖。OpenAI 的任何潛在重組都将加強我們的非營利組織及其使命,以确保 AGI 造福全人類,"OpenAI 董事長布雷特 · 泰勒(Bret Taylor)稱,OpenAI 董事會認為這項收購提議不能代表公司的最佳利益,因此予以拒絕。
馬斯克則指責:" 一位朋友說泰勒是個騙子,他經營着一家代理初創公司,這家公司實際上沒有任何產品,但卻在向 OpenAI 注入資金。他只是在搞官僚主義。"
最終,這一目标并未達到,同時 xAI 也在面臨融資。
據報道,xAI 計劃籌集約 100 億美元資金,目前正在接洽包括紅杉資本、Andreessen Horowitz 等潛在投資者,此輪融資可能使該公司估值達到約 750 億美元(約合 5440.5 億元)。由于這輪融資的交易條款尚未最終确定,具體細節仍可能有所變動。
PitchBook 數據顯示,2024 年 12 月,xAI 公司宣布完成 C 輪 60 億美元融資,投資方包括英偉達和 AMD 兩大芯片巨頭等,公司估值約為 510 億美元。
因此,這也意味着,短短三個月,xAI 公司估值增長了 240 億美元,增速達 47% 左右。
復盤馬斯克的收購之路,其實困難重重。
首先,奧爾特曼對收購提議并不感興趣;其次,馬斯克對 OpenAI 的報價也被分析師認為 " 缺乏誠意 ",近期有報道稱,OpenAI 正進行高達 400 億美元的融資,這将使其估值超過 3000 億美元,即便在該融資沒有完成前,OpenAI 現階段的估值也達 1500 億美元;最後,馬斯克如何整合 OpenAI 和 xAI,是否涉及反壟斷等議題,依然存疑。
馬斯克曾表示,他希望将 OpenAI 從帶向的危險方向中拯救出來," 是時候讓 OpenAI 重新成為開源、注重安全的造福力量了。我們将确保這一點實現。"
不過,無論是否收購,馬斯克的介入已經對 OpenAI 下一步發展產生影響,并且使得 OpenAI 下一輪融資充滿變數。英國劍橋大學副教授約翰尼 · 佩恩表示,馬斯克 " 基本上是想阻礙 OpenAI 的增長軌迹 "。
康奈爾大學高級講師、AI 初創公司 R2Decide 創始人兼首席執行官盧茨 · 芬格 ( Lutz Finger ) 也表示,馬斯克在給非盈利部分貼上價格标籤,讓奧爾特曼對 OpenAI 分拆的成本大大增加,給 OpenAI 發展產生了負面影響。
" 馬斯克此舉只是壓制競争的小伎倆,我希望他能通過打造更好的產品來競争;可能他的一生都處于不安全狀态,我為這個人感到難過…我不認為他是個快樂的人。" 奧爾特曼強調,OpenAI 不打算出售。
争奪戰加劇:OpenAI 先發開源
開源成為 AI 大模型的下一個階段。
" 對于我們的下一個開源項目,我們應當選擇開發一個雖然體積小但仍然需要借助 GPU 運行的 o3 mini 層級模型,還是應當致力于開發一個尺寸适合手機且表現最佳的模型呢?" 奧爾特曼今早發起投票,最終端側模型的投票率大幅領先,相比于 o3 mini 的開源,顯然高贊評論的網友更希望開源 GPT-4。
随着 DeepSeek 熱潮席卷全球,給 AI 行業敲響了警鍾。奧爾特曼也在考慮開源,他曾在本月初公開承認,OpenAI 的閉源策略 " 站在了歷史錯誤的一邊 "。
正如 RWKV 創始人彭博早前表示," 我跟你說,現在 AI 的問題就在于它太簡單了,傻瓜都可以做出來。所以它是沒有壁壘、沒有門檻的事情,所以這也是我認為 AI 的商業模式有很大的問題的一個原因,因為太簡單,就是無腦的堆算力,堆數據就行。"
值得注意的是,就在今天上午,OpenAI 和 xAI 的供應商、AI 芯片巨頭英偉達(NVIDIA),聯合北京大學、Hedra 公司發布新的開源視頻生成模型 Magic 1-For-1,該模型生成視頻速度很快,能夠在 3 秒内生成 5 秒的視頻片段,1 分鍾可生成 1 分鍾視頻,将文本到視頻的生成任務分解為兩個更易處理的擴散步驟蒸餾任務,即文本到影像生成,與影像到視頻生成。
在國内,近期,字節跳動豆包大模型團隊開源視頻生成大模型 "VideoWorld",僅憑視覺信号就能理解世界,無需任何文本标注數據,同時字節還聯合 M-A-P 社區開源全新代碼大模型評估基準 FullStack Bench;2 月 18 日," 大模型六小虎 " 之一的階躍星辰則宣布與吉利聯合開源兩款 Step 系列多模态大模型——開源視頻生成模型 Step-Video-T2V 和開源語音互動大模型 Step-Audio,性能出色,遠超業界開源最優水平。
在開源大模型 DeepSeek 衝擊之下,無論是國外 OpenAI、xAI,還是國内百度、騰訊這些科技大廠,或是 " 大模型六小虎 " 這類頭部 AI 大模型公司,都走到了一個新的 " 十字路口 ":要麼開源發力 AI 應用和解決方案,要麼用閉源打敗開源。
悉尼新南威爾士大學 AI 研究所首席科學家 Toby Walsh 認為,這是把 " 貓和鴿子 " 放在一起,事實證明,西方和中國最好的 AI 之間真的沒有差距," 一場誰的錢最多的競賽 " 格局被完全打開,程維任何人都可以做到的一場 AI 比賽,很多人将能夠以适中的成本重新構建 AI 模型。未來,如果 AGI 終極目标不是在數據中心上構建 AI,而是構建可以在手機上運行 AI 技術,這将貼近我們的生活,并成為一個新的發展标準。
中歐國際工商學院決策科學與管理信息系統教授譚寅亮對钛媒體 AGI 表示,對于 DeepSeek 這樣的產品來說,其成功更多依賴于高效的算力調度和模型優化能力,而非單純堆積硬體資源,因此外部限制并不一定會阻礙本土大模型的長期競争力和全球化擴張。DeepSeek 的成功表明,中國企業在 AI 應用層面和用戶體驗上具有強大的創新能力,尤其是在產品快速迭代和市場化方面更具優勢。
譚寅亮強調,DeepSeek 的崛起将進一步推動全球 AI 競争的動态化發展。
(本文首發于钛媒體 App,作者|林志佳)