今天小編分享的科技經驗:反擊梁文鋒,馬斯克的“半成品”夠格嗎?,歡迎閱讀。
起猛了,差點分不清馬斯克和奧特曼。
北京時間 2 月 18 日中午,馬斯克旗下人工智能公司 xAI 搞了一場直播,進行新一代模型 Grok 3 的介紹和現場演示。
氣氛很輕松,馬斯克和 xAI 團隊的三名成員,圍坐在一張小桌前,背後是用來展示的大螢幕。不管是這個形式,還是這個畫面,都讓人聯想到 OpenAI。只不過 xAI 走的是暗黑極客風,OpenAI 則是溫馨家居風。
這倒也不奇怪,畢竟馬斯克從創辦 xAI 伊始,就死死盯住 OpenAI 的背影狂追。
而看起來小小的發布會,在一個小時的時間裡實則殺機滿滿:
xAI 的發展迅猛,2023 年 7 月成立,11 月就發布了首個大模型 Grok。次年 5 月,xAI 完成 60 億美元 B 輪融資,12 月又宣布完成 60 億美元 C 輪融資,估值超過 400 億美元。
從去年 9 月,xAI 建成包含 10 萬張英偉達 H100 的集群 Colossus 開始,外界就在期待 xAI 的下一代大模型的發布。從去年年底," 跳票 " 到今年年初,外界又多了新的變數,一邊是 OpenAI 開啟算力基礎建設的 " 星際之門 ",一邊是 DeepSeek 掀起低成本推理模型熱潮,Grok 3 的發布頂着巨大的壓力。
在 Grok 3 發布之前,馬斯克做足了預熱,稱其 " 聰明得吓人 "" 最聰明的 AI",但從發布會來看,xAI 尚未結束追趕狀态。馬斯克的 AI 路,還未到一馬平川之境。
就在馬斯克鼓足熱情發布 Grok 3 之際,奧特曼也暗戳戳來搶熱度,在 X 上發起投票,詢問網友對于 OpenAI 下一個開源項目的看法,是做一個相當小但仍需要在 GPU 上運行的 o3-mini 級模型更有用,還是做一個能做得最好的手機大小的端側模型更有用。
超 3 萬名參與投票的網友中,超過一半的票投向了端側模型。畢竟,趕在奧特曼前面,大熱的 DeepSeek,已經搶先掀起了一波在智能手機和新能源汽車等終端,部署端側模型的浪潮。
Grok 3 發布會之前,外界也很關心特斯拉汽車是否會接入 Grok。1 月初,馬斯克曾經給出肯定的回答,稱 Grok 會登陸特斯拉。但可惜的是,本次發布會中,馬斯克并未回應特斯拉接入 Grok 的相關問題。
一
發布會一開始,xAI 就着重談了談 Grok 3 背後的 Colossus 超算。
該超算包含 10 萬張英偉達 H100 芯片,建立僅用三個月,是馬斯克的一大 " 偉業 "。連黃仁勳都表示,這堪稱 " 奇迹 "。
在發布會上,xAI 表示訓練進行到第 92 天時,集群的規模拓展到了 20 萬張芯片。這是該消息首次被披露。
得益于新計算集群,馬斯克在直播演講中表示:"Grok 3 的能力比 Grok 2 高出 10 倍。"
據 xAI 介紹,Grok 3 在包括 AIME 和 GPQA 在内的基準測試中勝過 GPT-4o。此外,Grok 3 的早期版本在 Chatbot Arena 中也獲得了有競争力的分數,是有史以來第一個突破 1400 分的模型。這是一項眾包測試,讓不同的 AI 模型相互競争,并讓用戶投票選出他們喜歡的答案。
準确地說,Grok 3 是一系列模型。
Grok 3 的較小版本 Grok 3 mini 可以更快地回答問題,但會犧牲一些準确性。
另外兩個版本 Grok 3 Reasoning 和 Grok 3 mini Reasoning,旨在仔細 " 思考 " 問題然後再提供解決方案,類似于 OpenAI 的 o3-mini 和 DeepSeek 的 R1 等 " 推理 " 模型。
推理模型在給出結果之前會徹底檢查自己,這有助于它們避免通常會絆倒模型的一些陷阱。
xAI 表示,Grok 3 Reasoning 在幾個流行的基準測試中超越了 OpenAI 的 o3-mini 的最佳版本—— o3-mini-high,其中包括一個名為 AIME 2025 的較新的數學基準測試。
推理模型可通過 Grok 應用程式訪問。用戶可以要求 Grok 3" 思考 ",或者利用 " 大腦 " 模式進行推理,該模式需要額外的計算。xAI 認為推理模型最适合數學、科學和編程相關的問題。
另一個明顯衝着 OpenAI 和 DeepSeek 來的是 "DeepSearch",直譯是 " 深度搜索 "。這是一個 AI 代理,由 xAI 的推理模型驅動,掃描互聯網和 X 平台來分析信息。演示顯示,DeepSearch 包含研究、頭腦風暴和數據分析等選項,會展示 " 思考 " 過程和計劃響應的方式。
就在兩周前,OpenAI 推出 AI 代理 "DeepResearch",直譯 " 深度研究 "。
與 DeepSeek R1 和現在的 OpenAI o3-mini 一樣,Grok 3 将顯示詳細的思維鏈,讓用戶可以看到聊天機器人是如何思考問題的。馬斯克證實,xAI 會稍微模糊思維,這樣其他公司就不能直接復制 xAI 的聊天機器人。
順帶一提,馬斯克表示,在 Grok 應用中,推理模型的一些 " 想法 " 被模糊化,以防止 " 蒸餾 ",即 AI 模型開發人員從另一個模型中提取知識的方法。最近,DeepSeek 被指控蒸餾 OpenAI 的模型來創建自己的模型。
當然啦,新產品還是得 " 會員搶先用 "。
X 的 Premium+ 級别的訂戶将首先獲得 Grok 3,其他功能則由 xAI 的新計劃 SuperGrok 提供。SuperGrok 的價格為每月 30 美元或每年 300 美元,可解鎖額外的推理和 DeepSearch 查詢,并提供無限的影像生成。
馬斯克表示,未來,Grok 将獲得 " 語音模式 ",這将為 Grok 提供合成語音。幾周後,Grok 3 模型将與 DeepSearch 功能一起出現在 xAI 的企業 API 中。幾個月後,馬斯克表示,xAI 将開源 Grok 2。
" 我們的一般做法是,當下一個版本完全發布時,我們将開源最後一個版本。" 馬斯克說。" 當 Grok 3 成熟穩定時,可能在幾個月内,我們就會開源 Grok 2。"
二
從演示及 xAI 給出的基準測試結果來看,Grok 3 确實實力不俗,但這場發布會還是略有 " 倉促 " 之感。
一向樂于畫餅、擅長于把 80 分宣傳成 101 分的馬斯克,也在這次發布會時給用戶 " 打預防針 ":" 這只是一個測試版本,剛開始可能會有些不完美。如果你想要更完善的版本,可能需要等上一周。"
此外,語音模式沒有發布也值得注意。發布前的幾個小時,希馮 · 齊利斯—— Neuralink 高管,同時也是和馬斯克育有一對雙胞胎的孩子媽,在 X 上大贊和 Grok 3 進行的對話,稱 " 是我一生中最出乎意料、最值得的時光之一 ",公開了 Grok 3 有語音功能。
但随後馬斯克回復稱語音模式還有一些問題,還需要一周左右時間才能發布。在發布會上,結束時壓軸的也是一小段 Grok 3 語音對話的畫面,看起來語音模式是被臨時從這次發布會中取消的。
大家都明白這次發布對馬斯克和 xAI 來說都很重要,Grok 3 必須支棱。
Grok 3 原本定于去年年底推出,但被推遲。根據馬斯克的說法,Grok 3 在今年一月初完成了訓練。
按理說這樣的推遲并不算久,但剛跨進新年,今年一月接連發生兩件大事:一是 OpenAI 宣布攜手軟銀和甲骨文,共建 " 星際之門 ",預計投入 5000 億美元夯實 AI 基建。二是中國殺出個 DeepSeek,其推理模型 R1 因低成本高性能表現驚豔大洋彼岸的矽谷。
可能也正因如此,馬斯克這次硬是整出了蘋果發布會的排場,在 Grok 3 發布之前就預熱不斷。馬斯克在各個場合以及 X 上都大贊新一代模型,以視頻接入迪拜世界政府峰會時稱 "Grok 3 的表現優于我們所知的任何已發布產品 ",周末在 X 上宣稱 Grok 3 是 " 地球上最聰明的 AI"。
這也可以解釋為什麼這次語音模式沒有完全準備好、Grok 3 也尚處于測試階段,xAI 就急着隆重召開發布會——同行的獠牙,八成已經閃得馬斯克睡不着覺了。
三
馬斯克不停地強調 " 再等一周 ",但一周之内世界會發生什麼真不好講。
在 DeepSeek 于 1 月底開始打出知名度之後,OpenAI 的應對措施就火速跟上,先是給免費用戶開放 o3-mini,又發布 DeepResearch 深度研究的功能。此外,OpenAI 的 CEO 山姆 · 奧特曼前不久還發布長推文,公布 GPT-5 的計劃。
在更大的競争場中,中國的科技大廠如騰訊、百度等,以及出海的中國初創 AI 公司如 MiniMax,都紛紛接入 DeepSeek 的模型,眼瞅着有打造 " 技術共同體 " 之态,形成競争合力。
好在馬斯克也有打造 " 馬斯克共同體 " 的潛力。其名下企業眾多,借由 xAI 正在加速彼此打通的進程。
圖源:AI 制作
一開始,似乎是馬斯克名下其他幾個企業當 " 扶弟魔 ",喂養 xAI。陸續傳出過特斯拉顯卡、X 平台數據被 xAI 使用的消息。如今 xAI 也有了回饋的趨勢。
Grok 從一開始就是 X 訂閱用戶的 " 特權 ",在去年底,Grok 開始提供給 X 的免費用戶,甚至是未注冊用戶,只是模型選擇與提問數量的限制有高低之分。今年 1 月,Grok 的獨立應用也在蘋果商店上線,正式和 ChatGPT 展開角逐。
本次直播期間,打開 X 的 APP,相關入口在頂部高亮顯示。托 X 的福,這場直播在進行半個小時後就已經有 200 萬次觀看,一小時後這個數字達到 300 萬。從前期宣傳、發布會直播到後期嵌入,馬斯克算是把 X 玩明白了。
要知道,據 X 官方消息,2024 年 3 月時平台日活 2.5 億,月活 5.5 億。相比而言,據《紐約 . 時報》,ChatGPT 去年 6 月的月活為 3.5 億。X 對于 xAI 來說,是一個巨大的流量池。
此次發布會之前,外界也很關心特斯拉汽車是否會接入 Grok。還是在 1 月初,馬斯克曾經給出肯定的回答,稱 Grok 會登陸特斯拉,你可以和特斯拉對話,提出任何要求。
但可惜的是,本次發布會中沒有涉及特斯拉接入 Grok 的問題,倒是有一名 xAI 的工作人員問馬斯克 Grok 何時會被接入 SpaceX 的火箭,馬斯克回答 " 兩年 "。
不管怎樣,xAI 接下來一周,都得祈禱 AI 界不要再有 " 炸場 " 的同行。再稍久一些的未來,則得期待 Grok 3 的表現足以打動華爾街,畢竟 xAI 正在考慮以 750 億美元估值融資 100 億美元,而與此同時,OpenAI 據傳正在進行一輪 400 億美元的融資,目标估值衝着 3400 億美元而去。
Grok 3 是否是 " 地球上最聰明的 AI",又是否能長久成為 " 地球上最聰明的 AI",好戲還在後頭。