今天小编分享的互联网经验:号称“地球上最聪明的AI”!马斯克旗下xAI开发的大模型Grok3正式发布,欢迎阅读。
2 月 18 日中午, 马斯克旗下 XAI 举行 Grok 3 发布会,超过 100 万人在线观看,马斯克称赞其为 " 地球上最聪明的人工智能 "。
发布会演示显示,在数学推理、科学逻辑推理等多方面的性能表现上,Grok3 和 Grok-3 mini 都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手,此外 xAI 还推出功能更为强大的 Grok3 Thinking 推理模式。
除了计算能力方面,在理解力和创造力方面,Grok3 表现同样出色。演示包括实时解决复杂的物理问题,例如绘制行星际轨迹,构思视频游戏 ......
更惊喜的是,马斯克透露,Grok-3 最佳体验 " 大约一周之后 ",语音互動功能还在开发中,一周后用户就可以拥有对话体验。
马斯克在发布会中表示,X 上的 Premium Plus 用户开始,将是首批获得访问权限的群体,同时用户也可以通过 Super Grok 单独订阅服务。
此外,为了支持 Grok3 训练,xAI 在短短三个月将数据中心训练集群翻倍 20 万块 GPU,并且 xAI 与戴尔达成 50 亿美元協定,戴尔或将今年向 xAI 交付搭载英伟达 GB200 芯片的伺服器。
" 地球上最聪明的 AI"
据介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3 在多项 benchmark 测试中均取得了比 DeepSeek-v3、GPT-4o、Gemini-2 pro 更优的效果。据悉,目前 Grok 3 已经在 xAI 内部运行了 2 周。
xAI 工程师介绍,虽然 Grok 起步较晚,但在 MMLU 得分上以超快地速度追上了 ChatGPT。
马斯克及其团队表示,Grok 3 也将具有类似 DeepSeek R1 和 OpenAI o3 Mini 的推理能力。
马斯克团队指出,大约一个月前,Grok 3 的预训练已经完成,从那时起其一直在努力将推理能力融入 Grok 3 模型中。Grok 3 推理迷你版的训练时间更长,表现略优于 Grok 3 推理模型,这表明 Grok 3 推理模型具有巨大的潜力。
从各项指标来看 grok 3 一举超越所有模型,排名世界第一,有推理模式,有 deep research 功能。上周,马斯克在迪拜世界政府峰会的视频通话中宣布了 Grok 3 的推出,并称该聊天机器人具有 " 非常强大的推理能力 " 并且是 " 地球上最聪明的人工智能 "。
Grok 3 比 Grok 2 快十倍,在 Grok3 中大规模安装更多计算能力使其能够在更短的时间内运行大数据集,同时提供更高的准确性。
具体演示来看,Grok3 现场为太空发射生成动画 3D 图,展现了其理解复杂物理知识的能力。
马斯克团队输入提示要求要求 Grok-3 现场生成代码,运行代码后画面上显示出了飞船在地球和火星间往返的动画。
另一段演示中,Gork-3 制作一款类似于俄罗斯方块和宝石迷阵的游戏,展现了其出色的创造力。
马斯克还透露称,我们将在 xAI 推出一个人工智能游戏工作室。如果你有兴趣加入我们并开发人工智能驱动的游戏,请加入我们。
xAI 通过修改 Grok3 的训练过程(而不仅仅是硬體改进)为 Grok3 实现了更好的功能。更新后的模型实现了合成数据集、自我校正和强化学习,以提高其性能。
订阅试用方面,马斯克表示,Grok3 测试版现已面向 X Premium 用户开放,并且推出 SuperGrok 订阅服务。
此外,xAI 计划在最新版本完全成熟后立即开源其 Grok 模型的先前版本,马斯克预计 Grok-3 的过渡将在几个月内完成。
xAI 与戴尔达成 50 亿美元協定,三个月将数据中心容量翻倍
值得一提的是,xAI 计划与戴尔达成 50 亿美元協定,为 Grok 3 提供 AI 伺服器支持。xAI 即将与戴尔科技达成協定收购价值超过 50 亿美元的配备英伟达 GB200 芯片的 AI 优化伺服器,此次收购旨在满足 Grok 3 和其他 AI 应用程式日益增长的计算需求。
见闻此前文章指出,知情者称,若达成交易,戴尔将今年向 xAI 交付搭载英伟达 GB200 芯片的伺服器,用于优化 AI 工作。
在发布会上,马斯克团队还透露,xAI 在短短三个月将数据中心容量翻倍,使用了 20 万个英伟达 H100 GPU 打造出最佳 AI。
马斯克团队表示,去年 4 月马斯克决定 xAI 要想取得成功并打造出最佳 AI,唯一的办法就是创建自己的数据中心。我们花了 122 天的时间才让第一批 10 万个 GPU 启动并运行。我们很快意识到要构建我们设想的 AI,需要将集群规模扩大一倍。因此启动了另一个阶段,我们在短短 92 天内就将容量翻了一番。
网友热评:有史以来第一个突破 1400 分的模型、性价比超 Gemini
网友们对于 Gork-3 的发布也满怀激动,AI 大佬 Andrej Karpathy 试用后称赞说,Grok3+Thinking 大概和 OpenAI 最强的模型(比如 o1-pro,月费 200 美元)相当,比 DeepSeek-R1 和 Gemini 2.0 Flash Thinking 略好一些。
还有网友夸赞称,Grok-3 是有史以来第一个 Chatbot Arena 突破 1400 分的模型,其性能优于 OpenAI 和 Google 的最佳公开推理模型。而 xAI 成立于 Deepmind 晚 13 年,比 OpenAI 晚 8 年,现在领先于两者。
有网友则对 AI 信心十足,Grok3 似乎非常强大,这很好地证明了缩放定律实际上并没有结束,非常看好人工智能的未来。
也有网友指出了其缺点,Grok3 不擅长编码。
此外,更有网友猜测,这会不会激起一轮大模型价格战呢?