Claude炸场，最焦虑可能不是OpenAI

今天小编分享的互联网经验：Claude炸场，最焦虑可能不是OpenAI，欢迎阅读。

图片来源 @视觉中国

文 | 硅基研究室，作者 | kiki

「游戏开始（game on）。」

这是 Runway 联合创始人写在 OpenAI 发布 Sora 后的一句感言，某种程度上，这句话也可以送给此刻的 OpenAI 和 Sam Altman。

随着被称为「OpenAI 最强竞争对手之一」的 Anthropic 发布新一代的人工智能模型系列 Claude 3（包括了 Opus、Sonnet、Haiku 三款产品），一时间中文互联网甚至出现了「全球 AI 大模型一夜易主」的评论。

图源：X

Claude 3 之所以引发如此多的评论，原因有两方面：一是代表模型性能的各类评测指标来看，Claude Opus 的得分全都超过 GPT-4。二是，从用户直接体验来看，缓解了过去大模型使用过程中出现的问题，比如降低拒绝率、克服大模型的幻觉等问题。

英伟达高级科学家 Jim Fan 就对 Claude 3 给出了两个客观的评价：一是在特定领網域的专家基准测试。除了相对饱和的 MMLU、HumanEval 等基准外，Claude 还选择了金融、医学和哲学等专家领網域，报告了性能表现。二就是解决了过往大模型过于「谨慎」的问题。

以 Meta 的开源大模型 Llama 2 为例，此前有人就发现，即便询问一些无害问题，比如「如何制作辣椒蛋黄酱」，但 Llama 2 会疯狂地表示它无法做到，因此用户需要互動多次，才能给出答案。Anthropic 意识到了这一问题，降低了模型在无害问题上的拒绝率。

需要指出的是，和 OpenAI 一样，由于都是闭源，Claude 3 的技术报告并不涉及具体的模型结构、训练方法等，因此对人们来说，这依旧是一条模糊的道路。

而从 Claude 炸场，对抗 OpenAI，所反映出的是 2024 年海外大模型行业所涌现出的新趋势。

Sora 拉开序幕，巨头密集上新

年初，从 OpenAI 携 Sora 开启所谓的「文生视频 GPT 时刻」开始，海外大模型企业就已进入了密集的模型上新期。

与 OpenAI 同日更新的谷歌拿出了多模态大模型 Gemini 1.5，既瞄准了 Claude 擅长的「长文本」—— Gemini 1.5 能稳定处理的信息量高达 100 万个 tokens，作为对比 GPT-4 Turbo 的上下文視窗大约为 12.8 万 tokens，刚发布的 Claude 3 大约为 20 万 tokens。在更新闭源大模型的同时，谷歌还推出了「开源」大模型 Gemma，主打一个「开源、闭源」两手抓。

而本就走「开源路线」的 Meta 也在近期被曝出推出新模型的消息。据 The Information 报道，Meta 计划在 7 月份推出新的 AI 大模型 Llama 3，参数量最高或超过 1400 亿，Meta 希望借此可以追上 OpenAI 的 GPT-4。一位知情人士表示，Meta 还在计划任命一名内部人员对 Llama 3 在安全和可控性进行培训，以让其的反应更加细致。此前，扎克伯格也向投资者提到：" 今年的重点领網域就包括推出 Llama 3"。

科技巨头们已将模型发布提上日程，追赶 GPT-4 已经成为了今年的首要 KPI，另一边的独角兽们在融资寒冬中也没闲着。

比如，法国 AI 独角兽 Mistral AI 就在上个月底推出了仅次于 GPT-4 性能的 Mistral Large 和类 ChatGPT 产品竞争对手 Le Chat。同时，还宣布和 OpenAI 的「盟友」微软达成了合作。

从目前的时间线来看，这场模型「上新战」只是开始。而这对创业者来说，似乎是一个好消息。如 Abacu.AI 的联合创始人兼 CEOBindu Reddy 所说："OpenAI 不再是唯一的人工智能之王，这对每个人来说都是一个巨大的安慰。"

最焦虑可能不是 OpenAI，而是谷歌

而从 Claude 所引发的连锁反应来看，如今既面对强大竞争对手，又深陷与马斯克的诉讼中的 OpenAI 无疑是最焦虑的一个。

但事实上，从目前来看，OpenAI 可能并不焦虑。首先，两家公司不同的定位被人们忽视了。据福布斯对 Anthropic 联合创始人的采访，这家公司反复强调："Anthropic 更像是一家企业公司，而不是一家消费者公司。" 尽管从产品形态和商业模式来看，chatGPT 和 Claude 并无明显差别，但显然 Anthropic 面向的是 to B 用户，而非 C 端的大众。而从 Claude 提供的客户案例中，这些 B 端客户包括了如科技公司 Gitlab、Notion、Salesforce、SAP 等。

其次，从战略层来看，尽管都是为了通往 AGI，但 OpenAI 谋求「大而全」，Anthropic 则偏向「小而美」。OpenAI 一系列的硬體公司和算力布局，都可以印证这一点。

相比之下，更焦虑的可能是谷歌。尽管身为 Anthropic 背后的金主之一，但相比亚马逊对 Anthropic 的「热情」，谷歌却无多少反应。

谷歌在近期正在陷入一系列的争议中。一方面，Gemini 陷入「种族偏见」的舆论浪潮，许多网友发现，Gemini 的文生图功能出现问题，比如似乎刻意在拒绝生成白人的形象，谷歌随后下架 Gemini 文生图功能，谷歌 CEO Sundar Pichai 回应称该问题「不可接受」，并在内部信中表示，公司在修复 Gemini 护栏方面已经取得了进展。

据 BusinessInsider 的报道，一位谷歌现任高级员工将这一事件形容为「一场公关噩梦」，" 谷歌员工很生气。" 华尔街的分析师甚至认为，谷歌需要剔除那些胡作作非为的人，包括 CEO Sundar Pichai。Bernstein 分析师 Mark Shmulik 在一份研究报告中也思考了类似的问题——是否是时候对谷歌的高层进行改组。

尽管谷歌一直将自己形容为一家人工智能领先的公司，它的基础研究也深刻影响着此轮大模型浪潮。但无论在模型的推出节奏，还是商业化路线上，谷歌都明显迟滞于微软和 OpenAI。

AI 技术的迭代飞速，这意味着洗牌也在快速进行。一个有趣的观察是，如今在此轮浪潮中，被赞美的对象换成了 Meta 和微软。而此刻的 OpenAI 和谷歌，他们以技术见长，但都面临着增长所带来的代价——无论是组织内部的动荡，抑或是保守的战略。

参考资料：

1、机器之心：Llama 2 第二波划重点：过于「谨慎」、代码生成改进空间大

2、BusinessInsider：How Google lost its way