今天小編分享的教育經驗:Grok 3正式發布,馬斯克現場演示超強AI能力,歡迎閲讀。
作者 | AI 深度研究員
來源 | AI 深度研究員 管理智慧
咨詢合作 | 13699120588
文章僅代表作者本人觀點
早些時候,馬斯克稱 Grok3" 聰明得有點可怕 ",能提出 " 完全沒有預料到的、非常不明顯的解決方案 "。今天,xAI 正式舉行 Grok3 發布會,這款被稱為 " 理解宇宙 " 的 AI 模型不僅使用了最多的計算資源進行訓練,更展現出驚人的推理能力。
在發布會現場,Grok3 展示了其卓越的數學推理能力,在 AIME(美國數學邀請賽)等權威測試中表現優異,甚至能解決博士級别的科學問題。更令人印象深刻的是,團隊通過兩個實時演示——計算地球到火星的往返軌道和即興創造全新遊戲,證明了 Grok3 不僅具備理論推理能力,還能将復雜概念轉化為實際應用。正如馬斯克所説," 這可能是最後一次有 AI 比 Grok 更優秀了。"
Grok3 能力突破
xAI 研究負責人 Jimmy 在發布會上表示,從啓動第一個模型到今天不到 17 個月,團隊實現了前所未有的進展速度。對比最初只有 3140 億參數的 Grok1,Grok3 展現出顯著提升:
" 距離我們啓動第一個模型還不到 17 個月。Grok1 當時對于現在的我們來説幾乎像是一個 ' 玩具 ' ——只有 3140 億參數。如果把時間畫在 X 軸,把性能指标畫在 Y 軸,你會看到我們整體的進展速度在整個 AI 領網域都可以説是前所未有的。"
三大核心能力驗證
Grok3 的評估聚焦三個關鍵方向:
通用數學推理:在 AIME(美國數學邀請賽)等權威測試中表現優異。值得注意的是,在 2025 年剛結束的 AIME 新題目中,Grok3 表現出了強大的泛化能力。
科學與 STEM 知識:能夠處理博士級别的科學問題,展現出深厚的專業知識儲備。
計算機編程實現:通過競争性編程和 LeetCode 等測試,驗證了強大的代碼能力。
DeepSearch:突破性搜索能力
發布會上,xAI 還介紹了 Grok3 的新功能 "DeepSearch"。這是一個革新性的搜索系統,能夠:
深度分析用户意圖
訪問并交叉驗證多個信息源
提供透明的搜索過程
支持用户自定義信息源
實時能力展示
為證明 Grok3 的實力,發布會現場進行了兩個實時演示:
物理軌道計算:即時計算并可視化地球到火星的往返軌道。
創新遊戲開發:現場将《俄羅斯方塊》和《寶石迷陣》融合,創造出一個全新的可玩遊戲。
這些演示展現了 Grok3 不僅具備理論推理能力,還能将復雜概念轉化為實際應用。正如 xAI 團隊所説,這些能力每天都在提升," 你可能會發現它幾乎每天都在變強,因為我們在不斷迭代更新,你甚至會在 24 小時内看到明顯的變化。"
技術基礎設施
在發布會上,ElonMusk 詳細介紹了 xAI 如何在短短 122 天内建成了一個擁有 10 萬片 H100GPU 的超級計算集群。這一速度遠超行業标準,正如 Musk 所説:" 剛開始我們想找别人托管數據中心,可一問得要 18-24 個月才能做好。等 18-24 個月再啓動訓練,那我們就輸定了。只能自己幹。"
關鍵挑戰解決方案
1、選址與空間:團隊找到了孟菲斯的一家閒置的伊萊克斯 ( Electrolux ) 工廠作為數據中心基地。這個決策避免了新建設施所需的漫長周期。
2、供電系統突破:" 我們需要電力。我們最初想要至少 120 兆瓦,但那棟樓只有 15 兆瓦的供電。後來我們想放到 20 萬張 GPU 時,需要 1/4 吉瓦(250 兆瓦)左右。" 為解決供電不足問題,團隊采取了三層解決方案:部署大量移動發電機;使用 TeslaMegapack 電池系統平滑功率波動;特殊編程優化電力管理。
創新的散熱方案
面對前所未有的密集計算資源,團隊采用了大規模液冷系統。如原文所述:" 為了實現這麼高的密度必須用液冷。而大規模液冷數據中心以前幾乎沒人做過,所以這是非常有挑戰的項目。"
同時,團隊租用了 " 全美移動冷卻能力的四分之一 " 來确保系統穩定運行。
網絡架構優化
為确保 10 萬片 GPU 的協同工作,團隊進行了大量網絡優化工作。正如 Igor 描述:" 我們要讓所有 GPU 協同通信,得排查無數網線問題。我們曾在凌晨四五點調試某個網卡或 BIOS 配置 ...... 整夜整夜地忙。"
未來擴展計劃
xAI 的野心不止于此。團隊已經開始籌備下一代集群,計劃将算力提升至現有規模的五倍,需要約 1.2 吉瓦的供電規模。Musk 幽默地表示:" 你知道《回到未來》裏那個時光車需要 1.21 吉瓦嗎,差不多就是這個數量級。我們會再一次打造世界上最強的訓練集群。我們并不會就此停下。"
這一基礎設施建設展現了 xAI 在 AI 領網域的決心和執行力,為 Grok3 的持續進化提供了堅實的硬體基礎。團隊表示,這種規模的算力不僅支持了當前的突破,更将支持未來更多的創新。
產品落地
根據發布會信息,Grok3 将通過多個渠道向用户開放:
1、XPremiumPlus 用户優先體驗:正如 Jimmy 在發布會上宣布:" 我們從今天起就開始面向 X(推特)上的 PremiumPlus 用户率先開放。"
2、SuperGrok 獨立訂閲:他們介紹:" 我們還宣布推出一個獨立的訂閲服務,叫 SuperGrok,面向那些真正的 Grok 粉絲。他們可以最早體驗到新功能,以及最先進的能力。" 多平台支持
3、grok.com 網頁版:提供最新、最完整的功能 iOS 應用:已上架 AppStore 注意事項:如 Igor 強調,"grok.com 上網頁版的功能通常是最新、最先進的,因為 App 上架需要額外審核流程,而手機端也有一些互動和算力限制。"
即将推出的重要功能
API 開放計劃:Igor 透露:"Grok3 的 API,将包括推理模型和 DeepSearch 功能,在接下來的幾周内會逐步放出。我們對企業級用例非常感興趣。"
端到端語音互動,語音功能特點:
完整的端到端模型;
支持個性化語音識别;
理解語氣、語速、情感。
如 Jimmy 分享:" 我今天早上還試了一下,效果不錯,但還需要再打磨一點。能做到你只要開口,Grok 就像真人在跟你聊天,非常酷。大概一周左右,我們就會把它放出來試試。"
個性化功能:
會話記憶功能;
多樣化角色定制:如 Igor 提到," 可能有人會想要一個 'Dr.Grok',或者一個 'Grok 廚子 '";
支持個性化設定和偏好保存。。
Beta 階段説明
Igor 特别強調:" 這裏要強調一下,現在還是 Beta 階段,也就是説一開始可能會有一些小瑕疵。我們會非常快地迭代,幾乎每天都會更新、變得更好。如果你想要更 ' 打磨 ' 得很好的版本,可以等一周左右。但基本上,你每一天都會看到它在進步。"
這種快速迭代的方式顯示了 xAI 對產品質量的追求,同時也為用户提供了清晰的期望管理。通過多樣化的接入方式和持續的功能更新,Grok3 正在逐步實現其 " 理解宇宙 " 的願景。
Grok3 發展規劃
在發布會上,xAI 團隊強調了 Grok3 的持續進化特性。如馬斯克所説:" 如果你在用 Grok3,你可能會發現它幾乎每天都在變強,因為我們在不斷迭代更新,你甚至會在 24 小時内看到明顯的變化。"
團隊認為這種快速迭代對于 AI 發展至關重要,尤其在以下幾個方面:
模型基礎能力提升;
推理功能增強;
工具接入擴展;
用户體驗優化;
硬體擴展計劃
xAI 已經開始規劃更大規模的硬體更新。根據發布會披露:" 這并不是我們建的最後一個集群,我們已經在籌備下一個了,大概會是現在算力的五倍,也就是差不多 1.2 吉瓦供電規模。" 這一擴展計劃包括:
擴大 GPU 集群規模;
提升供電能力;
優化散熱系統;
增強網絡架構;
開源策略
關于開源計劃,ElonMusk 在發布會上明确表示:" 我們的做法是:當新版本正式成熟時,就會開源上一代的版本。所以當 Grok3 完全穩定成熟後,可能幾個月左右吧,我們會開源 Grok2。" 這一開源策略反映了 xAI 的兩個重要理念:保持技術領先 ; 回饋開源社區長期發展願景
xAI 團隊在發布會結束時表達了他們的終極目标:" 讓我們一直努力下去的動力,就是能把 Grok3 提供給所有人,用得越多越好,我們想讓更多人用它并享受它,這才是我們每天起床的理由。" 這個願景包含幾個關鍵方面:
技術普及化;
應用場景擴展;
用户價值最大化;
推動 AI 技術發展。
通過這些規劃,xAI 展現了他們在 AI 領網域的長期承諾和清晰路徑,為 Grok3 的持續發展提供了明确方向。團隊的快速執行力和開放态度,将支持這些宏偉目标的實現。
馬斯克總結
在發布會最後,馬斯克分享了 Grok3 項目中最具挑戰性的環節——在 10 萬張 H100GPU 上進行模型訓練。正如其所説:" 這就像在和宇宙的最終 Boss 戰鬥,随時可能有宇宙射線翻轉一個比特,毀掉一次梯度更新。"
團隊用 122 天時間,完成了别人需要 18-24 個月才能實現的目标。但這僅僅是開始,xAI 已經在規劃五倍于當前規模的下一代計算集群。
最令人印象深刻的是團隊的終極願景。正如他們所説:" 讓我們一直努力下去的動力,就是能把 Grok3 提供給所有人,用得越多越好,我們想讓更多人用它并享受它,這才是我們每天起床的理由 "。