今天小編分享的互聯網經驗:号稱“地球上最聰明的AI”!馬斯克旗下xAI開發的大模型Grok3正式發布,歡迎閱讀。
2 月 18 日中午, 馬斯克旗下 XAI 舉行 Grok 3 發布會,超過 100 萬人在線觀看,馬斯克稱贊其為 " 地球上最聰明的人工智能 "。
發布會演示顯示,在數學推理、科學邏輯推理等多方面的性能表現上,Grok3 和 Grok-3 mini 都超過或媲美 Gemini、DeepSeek 和 ChatGPT 等對手,此外 xAI 還推出功能更為強大的 Grok3 Thinking 推理模式。
除了計算能力方面,在理解力和創造力方面,Grok3 表現同樣出色。演示包括實時解決復雜的物理問題,例如繪制行星際軌迹,構思視頻遊戲 ......
更驚喜的是,馬斯克透露,Grok-3 最佳體驗 " 大約一周之後 ",語音互動功能還在開發中,一周後用戶就可以擁有對話體驗。
馬斯克在發布會中表示,X 上的 Premium Plus 用戶開始,将是首批獲得訪問權限的群體,同時用戶也可以通過 Super Grok 單獨訂閱服務。
此外,為了支持 Grok3 訓練,xAI 在短短三個月将數據中心訓練集群翻倍 20 萬塊 GPU,并且 xAI 與戴爾達成 50 億美元協定,戴爾或将今年向 xAI 交付搭載英偉達 GB200 芯片的伺服器。
" 地球上最聰明的 AI"
據介紹,在數學推理、科學邏輯推理和代碼寫作等能力表現方面,Grok-3 在多項 benchmark 測試中均取得了比 DeepSeek-v3、GPT-4o、Gemini-2 pro 更優的效果。據悉,目前 Grok 3 已經在 xAI 内部運行了 2 周。
xAI 工程師介紹,雖然 Grok 起步較晚,但在 MMLU 得分上以超快地速度追上了 ChatGPT。
馬斯克及其團隊表示,Grok 3 也将具有類似 DeepSeek R1 和 OpenAI o3 Mini 的推理能力。
馬斯克團隊指出,大約一個月前,Grok 3 的預訓練已經完成,從那時起其一直在努力将推理能力融入 Grok 3 模型中。Grok 3 推理迷你版的訓練時間更長,表現略優于 Grok 3 推理模型,這表明 Grok 3 推理模型具有巨大的潛力。
從各項指标來看 grok 3 一舉超越所有模型,排名世界第一,有推理模式,有 deep research 功能。上周,馬斯克在迪拜世界政府峰會的視頻通話中宣布了 Grok 3 的推出,并稱該聊天機器人具有 " 非常強大的推理能力 " 并且是 " 地球上最聰明的人工智能 "。
Grok 3 比 Grok 2 快十倍,在 Grok3 中大規模安裝更多計算能力使其能夠在更短的時間内運行大數據集,同時提供更高的準确性。
具體演示來看,Grok3 現場為太空發射生成動畫 3D 圖,展現了其理解復雜物理知識的能力。
馬斯克團隊輸入提示要求要求 Grok-3 現場生成代碼,運行代碼後畫面上顯示出了飛船在地球和火星間往返的動畫。
另一段演示中,Gork-3 制作一款類似于俄羅斯方塊和寶石迷陣的遊戲,展現了其出色的創造力。
馬斯克還透露稱,我們将在 xAI 推出一個人工智能遊戲工作室。如果你有興趣加入我們并開發人工智能驅動的遊戲,請加入我們。
xAI 通過修改 Grok3 的訓練過程(而不僅僅是硬體改進)為 Grok3 實現了更好的功能。更新後的模型實現了合成數據集、自我校正和強化學習,以提高其性能。
訂閱試用方面,馬斯克表示,Grok3 測試版現已面向 X Premium 用戶開放,并且推出 SuperGrok 訂閱服務。
此外,xAI 計劃在最新版本完全成熟後立即開源其 Grok 模型的先前版本,馬斯克預計 Grok-3 的過渡将在幾個月内完成。
xAI 與戴爾達成 50 億美元協定,三個月将數據中心容量翻倍
值得一提的是,xAI 計劃與戴爾達成 50 億美元協定,為 Grok 3 提供 AI 伺服器支持。xAI 即将與戴爾科技達成協定收購價值超過 50 億美元的配備英偉達 GB200 芯片的 AI 優化伺服器,此次收購旨在滿足 Grok 3 和其他 AI 應用程式日益增長的計算需求。
見聞此前文章指出,知情者稱,若達成交易,戴爾将今年向 xAI 交付搭載英偉達 GB200 芯片的伺服器,用于優化 AI 工作。
在發布會上,馬斯克團隊還透露,xAI 在短短三個月将數據中心容量翻倍,使用了 20 萬個英偉達 H100 GPU 打造出最佳 AI。
馬斯克團隊表示,去年 4 月馬斯克決定 xAI 要想取得成功并打造出最佳 AI,唯一的辦法就是創建自己的數據中心。我們花了 122 天的時間才讓第一批 10 萬個 GPU 啟動并運行。我們很快意識到要構建我們設想的 AI,需要将集群規模擴大一倍。因此啟動了另一個階段,我們在短短 92 天内就将容量翻了一番。
網友熱評:有史以來第一個突破 1400 分的模型、性價比超 Gemini
網友們對于 Gork-3 的發布也滿懷激動,AI 大佬 Andrej Karpathy 試用後稱贊說,Grok3+Thinking 大概和 OpenAI 最強的模型(比如 o1-pro,月費 200 美元)相當,比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 略好一些。
還有網友誇贊稱,Grok-3 是有史以來第一個 Chatbot Arena 突破 1400 分的模型,其性能優于 OpenAI 和 Google 的最佳公開推理模型。而 xAI 成立于 Deepmind 晚 13 年,比 OpenAI 晚 8 年,現在領先于兩者。
有網友則對 AI 信心十足,Grok3 似乎非常強大,這很好地證明了縮放定律實際上并沒有結束,非常看好人工智能的未來。
也有網友指出了其缺點,Grok3 不擅長編碼。
此外,更有網友猜測,這會不會激起一輪大模型價格戰呢?