今天小编分享的科技经验:反击梁文锋,马斯克的“半成品”够格吗?,欢迎阅读。
起猛了,差点分不清马斯克和奥特曼。
北京时间 2 月 18 日中午,马斯克旗下人工智能公司 xAI 搞了一场直播,进行新一代模型 Grok 3 的介绍和现场演示。
气氛很轻松,马斯克和 xAI 团队的三名成员,围坐在一张小桌前,背后是用来展示的大螢幕。不管是这个形式,还是这个画面,都让人联想到 OpenAI。只不过 xAI 走的是暗黑极客风,OpenAI 则是温馨家居风。
这倒也不奇怪,毕竟马斯克从创办 xAI 伊始,就死死盯住 OpenAI 的背影狂追。
而看起来小小的发布会,在一个小时的时间里实则杀机满满:
xAI 的发展迅猛,2023 年 7 月成立,11 月就发布了首个大模型 Grok。次年 5 月,xAI 完成 60 亿美元 B 轮融资,12 月又宣布完成 60 亿美元 C 轮融资,估值超过 400 亿美元。
从去年 9 月,xAI 建成包含 10 万张英伟达 H100 的集群 Colossus 开始,外界就在期待 xAI 的下一代大模型的发布。从去年年底," 跳票 " 到今年年初,外界又多了新的变数,一边是 OpenAI 开启算力基础建设的 " 星际之门 ",一边是 DeepSeek 掀起低成本推理模型热潮,Grok 3 的发布顶着巨大的压力。
在 Grok 3 发布之前,马斯克做足了预热,称其 " 聪明得吓人 "" 最聪明的 AI",但从发布会来看,xAI 尚未结束追赶状态。马斯克的 AI 路,还未到一马平川之境。
就在马斯克鼓足热情发布 Grok 3 之际,奥特曼也暗戳戳来抢热度,在 X 上发起投票,询问网友对于 OpenAI 下一个开源项目的看法,是做一个相当小但仍需要在 GPU 上运行的 o3-mini 级模型更有用,还是做一个能做得最好的手机大小的端侧模型更有用。
超 3 万名参与投票的网友中,超过一半的票投向了端侧模型。毕竟,赶在奥特曼前面,大热的 DeepSeek,已经抢先掀起了一波在智能手机和新能源汽车等终端,部署端侧模型的浪潮。
Grok 3 发布会之前,外界也很关心特斯拉汽车是否会接入 Grok。1 月初,马斯克曾经给出肯定的回答,称 Grok 会登陆特斯拉。但可惜的是,本次发布会中,马斯克并未回应特斯拉接入 Grok 的相关问题。
一
发布会一开始,xAI 就着重谈了谈 Grok 3 背后的 Colossus 超算。
该超算包含 10 万张英伟达 H100 芯片,建立仅用三个月,是马斯克的一大 " 伟业 "。连黄仁勋都表示,这堪称 " 奇迹 "。
在发布会上,xAI 表示训练进行到第 92 天时,集群的规模拓展到了 20 万张芯片。这是该消息首次被披露。
得益于新计算集群,马斯克在直播演讲中表示:"Grok 3 的能力比 Grok 2 高出 10 倍。"
据 xAI 介绍,Grok 3 在包括 AIME 和 GPQA 在内的基准测试中胜过 GPT-4o。此外,Grok 3 的早期版本在 Chatbot Arena 中也获得了有竞争力的分数,是有史以来第一个突破 1400 分的模型。这是一项众包测试,让不同的 AI 模型相互竞争,并让用户投票选出他们喜欢的答案。
准确地说,Grok 3 是一系列模型。
Grok 3 的较小版本 Grok 3 mini 可以更快地回答问题,但会牺牲一些准确性。
另外两个版本 Grok 3 Reasoning 和 Grok 3 mini Reasoning,旨在仔细 " 思考 " 问题然后再提供解决方案,类似于 OpenAI 的 o3-mini 和 DeepSeek 的 R1 等 " 推理 " 模型。
推理模型在给出结果之前会彻底检查自己,这有助于它们避免通常会绊倒模型的一些陷阱。
xAI 表示,Grok 3 Reasoning 在几个流行的基准测试中超越了 OpenAI 的 o3-mini 的最佳版本—— o3-mini-high,其中包括一个名为 AIME 2025 的较新的数学基准测试。
推理模型可通过 Grok 应用程式访问。用户可以要求 Grok 3" 思考 ",或者利用 " 大腦 " 模式进行推理,该模式需要额外的计算。xAI 认为推理模型最适合数学、科学和编程相关的问题。
另一个明显冲着 OpenAI 和 DeepSeek 来的是 "DeepSearch",直译是 " 深度搜索 "。这是一个 AI 代理,由 xAI 的推理模型驱动,扫描互联网和 X 平台来分析信息。演示显示,DeepSearch 包含研究、头腦风暴和数据分析等选项,会展示 " 思考 " 过程和计划响应的方式。
就在两周前,OpenAI 推出 AI 代理 "DeepResearch",直译 " 深度研究 "。
与 DeepSeek R1 和现在的 OpenAI o3-mini 一样,Grok 3 将显示详细的思维链,让用户可以看到聊天机器人是如何思考问题的。马斯克证实,xAI 会稍微模糊思维,这样其他公司就不能直接复制 xAI 的聊天机器人。
顺带一提,马斯克表示,在 Grok 应用中,推理模型的一些 " 想法 " 被模糊化,以防止 " 蒸馏 ",即 AI 模型开发人员从另一个模型中提取知识的方法。最近,DeepSeek 被指控蒸馏 OpenAI 的模型来创建自己的模型。
当然啦,新产品还是得 " 会员抢先用 "。
X 的 Premium+ 级别的订户将首先获得 Grok 3,其他功能则由 xAI 的新计划 SuperGrok 提供。SuperGrok 的价格为每月 30 美元或每年 300 美元,可解锁额外的推理和 DeepSearch 查询,并提供无限的影像生成。
马斯克表示,未来,Grok 将获得 " 语音模式 ",这将为 Grok 提供合成语音。几周后,Grok 3 模型将与 DeepSearch 功能一起出现在 xAI 的企业 API 中。几个月后,马斯克表示,xAI 将开源 Grok 2。
" 我们的一般做法是,当下一个版本完全发布时,我们将开源最后一个版本。" 马斯克说。" 当 Grok 3 成熟稳定时,可能在几个月内,我们就会开源 Grok 2。"
二
从演示及 xAI 给出的基准测试结果来看,Grok 3 确实实力不俗,但这场发布会还是略有 " 仓促 " 之感。
一向乐于画饼、擅长于把 80 分宣传成 101 分的马斯克,也在这次发布会时给用户 " 打预防针 ":" 这只是一个测试版本,刚开始可能会有些不完美。如果你想要更完善的版本,可能需要等上一周。"
此外,语音模式没有发布也值得注意。发布前的几个小时,希冯 · 齐利斯—— Neuralink 高管,同时也是和马斯克育有一对双胞胎的孩子妈,在 X 上大赞和 Grok 3 进行的对话,称 " 是我一生中最出乎意料、最值得的时光之一 ",公开了 Grok 3 有语音功能。
但随后马斯克回复称语音模式还有一些问题,还需要一周左右时间才能发布。在发布会上,结束时压轴的也是一小段 Grok 3 语音对话的画面,看起来语音模式是被临时从这次发布会中取消的。
大家都明白这次发布对马斯克和 xAI 来说都很重要,Grok 3 必须支棱。
Grok 3 原本定于去年年底推出,但被推迟。根据马斯克的说法,Grok 3 在今年一月初完成了训练。
按理说这样的推迟并不算久,但刚跨进新年,今年一月接连发生两件大事:一是 OpenAI 宣布携手软银和甲骨文,共建 " 星际之门 ",预计投入 5000 亿美元夯实 AI 基建。二是中国杀出个 DeepSeek,其推理模型 R1 因低成本高性能表现惊艳大洋彼岸的硅谷。
可能也正因如此,马斯克这次硬是整出了苹果发布会的排场,在 Grok 3 发布之前就预热不断。马斯克在各个场合以及 X 上都大赞新一代模型,以视频接入迪拜世界政府峰会时称 "Grok 3 的表现优于我们所知的任何已发布产品 ",周末在 X 上宣称 Grok 3 是 " 地球上最聪明的 AI"。
这也可以解释为什么这次语音模式没有完全准备好、Grok 3 也尚处于测试阶段,xAI 就急着隆重召开发布会——同行的獠牙,八成已经闪得马斯克睡不着觉了。
三
马斯克不停地强调 " 再等一周 ",但一周之内世界会发生什么真不好讲。
在 DeepSeek 于 1 月底开始打出知名度之后,OpenAI 的应对措施就火速跟上,先是给免费用户开放 o3-mini,又发布 DeepResearch 深度研究的功能。此外,OpenAI 的 CEO 山姆 · 奥特曼前不久还发布长推文,公布 GPT-5 的计划。
在更大的竞争场中,中国的科技大厂如腾讯、百度等,以及出海的中国初创 AI 公司如 MiniMax,都纷纷接入 DeepSeek 的模型,眼瞅着有打造 " 技术共同体 " 之态,形成竞争合力。
好在马斯克也有打造 " 马斯克共同体 " 的潜力。其名下企业众多,借由 xAI 正在加速彼此打通的进程。
图源:AI 制作
一开始,似乎是马斯克名下其他几个企业当 " 扶弟魔 ",喂养 xAI。陆续传出过特斯拉显卡、X 平台数据被 xAI 使用的消息。如今 xAI 也有了回馈的趋势。
Grok 从一开始就是 X 订阅用户的 " 特权 ",在去年底,Grok 开始提供给 X 的免费用户,甚至是未注册用户,只是模型选择与提问数量的限制有高低之分。今年 1 月,Grok 的独立应用也在苹果商店上线,正式和 ChatGPT 展开角逐。
本次直播期间,打开 X 的 APP,相关入口在顶部高亮显示。托 X 的福,这场直播在进行半个小时后就已经有 200 万次观看,一小时后这个数字达到 300 万。从前期宣传、发布会直播到后期嵌入,马斯克算是把 X 玩明白了。
要知道,据 X 官方消息,2024 年 3 月时平台日活 2.5 亿,月活 5.5 亿。相比而言,据《纽约 . 时报》,ChatGPT 去年 6 月的月活为 3.5 亿。X 对于 xAI 来说,是一个巨大的流量池。
此次发布会之前,外界也很关心特斯拉汽车是否会接入 Grok。还是在 1 月初,马斯克曾经给出肯定的回答,称 Grok 会登陆特斯拉,你可以和特斯拉对话,提出任何要求。
但可惜的是,本次发布会中没有涉及特斯拉接入 Grok 的问题,倒是有一名 xAI 的工作人员问马斯克 Grok 何时会被接入 SpaceX 的火箭,马斯克回答 " 两年 "。
不管怎样,xAI 接下来一周,都得祈祷 AI 界不要再有 " 炸场 " 的同行。再稍久一些的未来,则得期待 Grok 3 的表现足以打动华尔街,毕竟 xAI 正在考虑以 750 亿美元估值融资 100 亿美元,而与此同时,OpenAI 据传正在进行一轮 400 亿美元的融资,目标估值冲着 3400 亿美元而去。
Grok 3 是否是 " 地球上最聪明的 AI",又是否能长久成为 " 地球上最聪明的 AI",好戏还在后头。