号称“地球上最聪明的AI”！马斯克旗下xAI开发的大模型Grok3正式发布

今天小编分享的互联网经验：号称“地球上最聪明的AI”！马斯克旗下xAI开发的大模型Grok3正式发布，欢迎阅读。

2 月 18 日中午，马斯克旗下 XAI 举行 Grok 3 发布会，超过 100 万人在线观看，马斯克称赞其为 " 地球上最聪明的人工智能 "。

发布会演示显示，在数学推理、科学逻辑推理等多方面的性能表现上，Grok3 和 Grok-3 mini 都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手，此外 xAI 还推出功能更为强大的 Grok3 Thinking 推理模式。

除了计算能力方面，在理解力和创造力方面，Grok3 表现同样出色。演示包括实时解决复杂的物理问题，例如绘制行星际轨迹，构思视频游戏 ......

更惊喜的是，马斯克透露，Grok-3 最佳体验 " 大约一周之后 "，语音互動功能还在开发中，一周后用户就可以拥有对话体验。

马斯克在发布会中表示，X 上的 Premium Plus 用户开始，将是首批获得访问权限的群体，同时用户也可以通过 Super Grok 单独订阅服务。

此外，为了支持 Grok3 训练，xAI 在短短三个月将数据中心训练集群翻倍 20 万块 GPU，并且 xAI 与戴尔达成 50 亿美元協定，戴尔或将今年向 xAI 交付搭载英伟达 GB200 芯片的伺服器。

" 地球上最聪明的 AI"

据介绍，在数学推理、科学逻辑推理和代码写作等能力表现方面，Grok-3 在多项 benchmark 测试中均取得了比 DeepSeek-v3、GPT-4o、Gemini-2 pro 更优的效果。据悉，目前 Grok 3 已经在 xAI 内部运行了 2 周。

xAI 工程师介绍，虽然 Grok 起步较晚，但在 MMLU 得分上以超快地速度追上了 ChatGPT。

马斯克及其团队表示，Grok 3 也将具有类似 DeepSeek R1 和 OpenAI o3 Mini 的推理能力。

马斯克团队指出，大约一个月前，Grok 3 的预训练已经完成，从那时起其一直在努力将推理能力融入 Grok 3 模型中。Grok 3 推理迷你版的训练时间更长，表现略优于 Grok 3 推理模型，这表明 Grok 3 推理模型具有巨大的潜力。

从各项指标来看 grok 3 一举超越所有模型，排名世界第一，有推理模式，有 deep research 功能。上周，马斯克在迪拜世界政府峰会的视频通话中宣布了 Grok 3 的推出，并称该聊天机器人具有 " 非常强大的推理能力 " 并且是 " 地球上最聪明的人工智能 "。

Grok 3 比 Grok 2 快十倍，在 Grok3 中大规模安装更多计算能力使其能够在更短的时间内运行大数据集，同时提供更高的准确性。

具体演示来看，Grok3 现场为太空发射生成动画 3D 图，展现了其理解复杂物理知识的能力。

马斯克团队输入提示要求要求 Grok-3 现场生成代码，运行代码后画面上显示出了飞船在地球和火星间往返的动画。

另一段演示中，Gork-3 制作一款类似于俄罗斯方块和宝石迷阵的游戏，展现了其出色的创造力。

马斯克还透露称，我们将在 xAI 推出一个人工智能游戏工作室。如果你有兴趣加入我们并开发人工智能驱动的游戏，请加入我们。

xAI 通过修改 Grok3 的训练过程（而不仅仅是硬體改进）为 Grok3 实现了更好的功能。更新后的模型实现了合成数据集、自我校正和强化学习，以提高其性能。

订阅试用方面，马斯克表示，Grok3 测试版现已面向 X Premium 用户开放，并且推出 SuperGrok 订阅服务。

此外，xAI 计划在最新版本完全成熟后立即开源其 Grok 模型的先前版本，马斯克预计 Grok-3 的过渡将在几个月内完成。

xAI 与戴尔达成 50 亿美元協定，三个月将数据中心容量翻倍

值得一提的是，xAI 计划与戴尔达成 50 亿美元協定，为 Grok 3 提供 AI 伺服器支持。xAI 即将与戴尔科技达成協定收购价值超过 50 亿美元的配备英伟达 GB200 芯片的 AI 优化伺服器，此次收购旨在满足 Grok 3 和其他 AI 应用程式日益增长的计算需求。

见闻此前文章指出，知情者称，若达成交易，戴尔将今年向 xAI 交付搭载英伟达 GB200 芯片的伺服器，用于优化 AI 工作。

在发布会上，马斯克团队还透露，xAI 在短短三个月将数据中心容量翻倍，使用了 20 万个英伟达 H100 GPU 打造出最佳 AI。

马斯克团队表示，去年 4 月马斯克决定 xAI 要想取得成功并打造出最佳 AI，唯一的办法就是创建自己的数据中心。我们花了 122 天的时间才让第一批 10 万个 GPU 启动并运行。我们很快意识到要构建我们设想的 AI，需要将集群规模扩大一倍。因此启动了另一个阶段，我们在短短 92 天内就将容量翻了一番。

网友热评：有史以来第一个突破 1400 分的模型、性价比超 Gemini

网友们对于 Gork-3 的发布也满怀激动，AI 大佬 Andrej Karpathy 试用后称赞说，Grok3+Thinking 大概和 OpenAI 最强的模型（比如 o1-pro，月费 200 美元）相当，比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 略好一些。