今天小编分享的科技经验:8分钟,Grok 3破解美国大學生最难数赛题!马斯克要用100万GPU反超「星际之门」?,欢迎阅读。
【新智元导读】马斯克旗下 xAI 扩张步伐不停!继孟菲斯后,xAI 在亚特兰大的秘密数据中心浮出水面。海量英伟达 GPU 集结,这背后是 Grok 3 用户激增的压力,还是马斯克挑战 OpenAI、谷歌的雄心壮志?甚至是超越「星际之门计划」的野心。
上周,马斯克发布了其号称「地表最强」的 Grok 3 模型。
一经发布便引爆全网,经过网友实测,发现其性能果然强悍!
物理学家 Luis Batalha 在 x 上表示,2025 年的普特南竞赛上,即使是前 500 名的顶尖选手,也无人能完整攻克下面这道难题。而 Grok 3(Think)仅用了约 8 分钟就找到了答案。
不只是解数学题,计算机博士 Alvaro Cintas 称 Grok 3 是一款令人难以置信的 AI 编码助手。
他在只用了几个小时,就用 Grok 3 写了超过 1000 行代码,做出了一个功能齐全的 2D 垂直跳跃游戏。
该游戏拥有不同的英雄、怪物、平台、难度和生命。以下是他的提示和游戏画面,可以看出游戏制作得非常精美!
的确,由于 Grok 3 性能过于强悍,大量用户正在抛弃 ChatGPT 并转投 Grok 3。
网友调侃说,他妻子嫉妒 Grok 3,因为他跟 Grok 3 说的话比跟他妻子还多。
23 号,知名 AI 投资人 The AI Investor 在 x 上预测,几天后,马斯克会发布一些关于 Grok 3 使用量的统计数据。
由于用户的疯狂涌入,马斯克很可能得出结论,现在的 20 万个 GPU 集群远远不能满足需求。
也许 xAI 的百万级 GPU 集群正在形成中。
在发布 Grok 3 时,马斯克阐述了 xAI 在将其大规模 GPU 集群(包含 20 万个英伟达 GPU)进行扩容时所遇到的工程难题。并表示他们计划将该集群扩容至 100 万个 GPU 的规模。
对此消息,网友纷纷表示「利好英伟达」。
甚至有网友认为,xAI 的数据中心规模将会大于 Stargate 项目所宣称的。
超越「星际之门计划」?
就在上个月,特朗普刚刚正式官宣「星际之门计划」,号称要在未来 4 年内砸 5000 亿美金,重塑美国在 AI 界领导地位。
这项计划将由 OpenAI、软银、甲骨文牵头,首期先部署 1000 亿美元。纽 * 约时报称,首批 10 座数据中心目前已在得克萨斯州开建,未来将扩展到其他州。
此前,奥特曼提到的「已经在建设中」的星际之门计划园区,即为 Oracle/Crusoe 阿比林园区。
该园区将容纳供 OpenAI 使用的 10 万台 GB200 算力集群。这个开发项目以及计划在第二季度和第三季度交付的 GB200 伺服器,将部署在 Oracle/Crusoe 的数据中心内。
下面是 2024 年 12 月 29 日,拍摄的园区高清照片。
4 个约 11,150 平方米的「模块」组成了一栋 44,600 平方米的建筑,目前仅有两栋建筑在建,关键 IT 负载容量约为 180 兆瓦。为了让大家理解这一规模,整个由 20 栋建筑组成的园区将包含 80 个这样的「模块」!
除了正在部署的 10 万台 GB200 算力集群外,分析师估计,他们还将在整个园区部署另外 20 万台 GB300 和约 40 万台 VR200(英伟达计划在 2026 年推出的超算,分别对应 Vera CPU 和 Rubin GPU)。
他们根据园区 1,000 亿美元总拥有成本(TCO)投资,以及人工智能 TCO 模型中的部門成本,计算出了 Vera Rubin 处理器的隐含数量。
约 70 万台 GPU 的总 IT 功率为 1.8GW,这与 Oracle/Crusoe 阿比林园区 1,800 兆瓦的容量相符。
OpenAI 研究员称「星际之门」将是有史以来最大的基础设施投资之一,将为 AGI 创造计算和能源。其规模已经可以与阿波罗计划和曼哈顿计划相媲美。
不过在这项目标远大的规划中,并没有看到马斯克的 xAI 参与其中。
也许老马有他自己的小算盘。当人们还在热议 xAI 孟菲斯数据中心的「全球最大」称号时,马斯克已经在亚特兰大悄然布下另一颗棋子。
马斯克低调开建 xAI 第二个超算中心
在亚特兰大,xAI 一直在悄悄地建立数据中心(与 X 共同运营),将其业务版图扩展到其在孟菲斯的大型数据中心之外。
根据与亚特兰大经济发展机构之一 Develop Fulton 签署的協定中列出的设备清单,两家公司将共同部署约 12,000 个英伟达 GPU,其中大部分将被用于 AI 计算。
对此,Develop Fulton 制定了一个市政债券融资方案,为这个单一设施中价值 7 亿美元的芯片、线缆和其他设备提供融资。
其中,4.42 亿美元分配给 X,2.58 亿美元给 xAI。
内部详情
知情的数据中心解决方案架构师和 AI 硬體专家表示,亚特兰大数据中心拥有相当可观的计算能力。其规模可与谷歌或亚马逊等超大规模科技企业建立的数据中心相媲美。
X 的代表将其描述为一个能够计算「万亿参数 AI」的百亿亿次级(exascale)数据中心。
但与 xAI 绰号为 Colossus(巨人)的「世界最大超算」相比,这个设施的容量就显得小了很多。
根据檔案显示,佐治亚州设施将安装约 12,448 个英伟达 GPU。其中绝大多数是 Hopper 架构的 H100 GPU,每个伺服器机架(含 8 枚芯片)的价格在 27.7 万至 50 万美元之间。
约 3% 的芯片是英伟达性能较低的 A100 GPU,同样配置的 8 枚芯片价格为 14.7 万美元。其中,X 提供了所有的 A100,以及 11,000 个 H100。
这两种芯片设计都不需要液冷系统,而液冷一直是马斯克公司在孟菲斯面临的一个棘手问题。当全负载运行时,Colossus 项目预计将成为该市最大的用水消费者之一。
除了 H100 芯片外,xAI 还提供了同样购自英伟达的 Mellanox 交换机和光学器件——这些高带宽网络设备可以提升芯片间的协同运算速度。
据估计,亚特兰大设施将需要 20 兆瓦的总功率,这一用电量可以从现有电网获得。
X 和 xAI 的合作
亚特兰大设施是马斯克整合资源打造 X 和 xAI 的典型案例。其中,X 为该数据中心贡献了 90% 的硬體,而 xAI 贡献了 10%。
根据檔案显示,这些设备将用于训练 X 平台的大语言模型和语义搜索产品。LinkedIn 资料显示,X 在该地区拥有约 16 名员工。
根据公司内部组织架构图,xAI 在佐治亚州设施配备了 1 名员工,另有 2 名员工被列为「X Corp 合作伙伴」。
与 Develop Fulton 达成的協定显示,该设施将保持现有的 24 个工作岗位,暂不增加新岗位。
马斯克正努力将 xAI 打造成能够与 OpenAI 和谷歌等科技巨头抗衡的主要竞争者,甚至从特斯拉挖来了一些人才。
据此前报道,在过去一年中,公司已招募了数百名数据标注人员来训练其聊天机器人,并计划在未来几个月内将招聘规模扩大到数千人。