Claude炸場，最焦慮可能不是OpenAI

今天小編分享的互聯網經驗：Claude炸場，最焦慮可能不是OpenAI，歡迎閲讀。

圖片來源 @視覺中國

文 | 硅基研究室，作者 | kiki

「遊戲開始（game on）。」

這是 Runway 聯合創始人寫在 OpenAI 發布 Sora 後的一句感言，某種程度上，這句話也可以送給此刻的 OpenAI 和 Sam Altman。

随着被稱為「OpenAI 最強競争對手之一」的 Anthropic 發布新一代的人工智能模型系列 Claude 3（包括了 Opus、Sonnet、Haiku 三款產品），一時間中文互聯網甚至出現了「全球 AI 大模型一夜易主」的評論。

圖源：X

Claude 3 之所以引發如此多的評論，原因有兩方面：一是代表模型性能的各類評測指标來看，Claude Opus 的得分全都超過 GPT-4。二是，從用户直接體驗來看，緩解了過去大模型使用過程中出現的問題，比如降低拒絕率、克服大模型的幻覺等問題。

英偉達高級科學家 Jim Fan 就對 Claude 3 給出了兩個客觀的評價：一是在特定領網域的專家基準測試。除了相對飽和的 MMLU、HumanEval 等基準外，Claude 還選擇了金融、醫學和哲學等專家領網域，報告了性能表現。二就是解決了過往大模型過于「謹慎」的問題。

以 Meta 的開源大模型 Llama 2 為例，此前有人就發現，即便詢問一些無害問題，比如「如何制作辣椒蛋黃醬」，但 Llama 2 會瘋狂地表示它無法做到，因此用户需要互動多次，才能給出答案。Anthropic 意識到了這一問題，降低了模型在無害問題上的拒絕率。

需要指出的是，和 OpenAI 一樣，由于都是閉源，Claude 3 的技術報告并不涉及具體的模型結構、訓練方法等，因此對人們來説，這依舊是一條模糊的道路。

而從 Claude 炸場，對抗 OpenAI，所反映出的是 2024 年海外大模型行業所湧現出的新趨勢。

Sora 拉開序幕，巨頭密集上新

年初，從 OpenAI 攜 Sora 開啓所謂的「文生視頻 GPT 時刻」開始，海外大模型企業就已進入了密集的模型上新期。

與 OpenAI 同日更新的谷歌拿出了多模态大模型 Gemini 1.5，既瞄準了 Claude 擅長的「長文本」—— Gemini 1.5 能穩定處理的信息量高達 100 萬個 tokens，作為對比 GPT-4 Turbo 的上下文視窗大約為 12.8 萬 tokens，剛發布的 Claude 3 大約為 20 萬 tokens。在更新閉源大模型的同時，谷歌還推出了「開源」大模型 Gemma，主打一個「開源、閉源」兩手抓。

而本就走「開源路線」的 Meta 也在近期被曝出推出新模型的消息。據 The Information 報道，Meta 計劃在 7 月份推出新的 AI 大模型 Llama 3，參數量最高或超過 1400 億，Meta 希望借此可以追上 OpenAI 的 GPT-4。一位知情人士表示，Meta 還在計劃任命一名内部人員對 Llama 3 在安全和可控性進行培訓，以讓其的反應更加細致。此前，扎克伯格也向投資者提到：" 今年的重點領網域就包括推出 Llama 3"。

科技巨頭們已将模型發布提上日程，追趕 GPT-4 已經成為了今年的首要 KPI，另一邊的獨角獸們在融資寒冬中也沒閒着。

比如，法國 AI 獨角獸 Mistral AI 就在上個月底推出了僅次于 GPT-4 性能的 Mistral Large 和類 ChatGPT 產品競争對手 Le Chat。同時，還宣布和 OpenAI 的「盟友」微軟達成了合作。

從目前的時間線來看，這場模型「上新戰」只是開始。而這對創業者來説，似乎是一個好消息。如 Abacu.AI 的聯合創始人兼 CEOBindu Reddy 所説："OpenAI 不再是唯一的人工智能之王，這對每個人來説都是一個巨大的安慰。"

最焦慮可能不是 OpenAI，而是谷歌

而從 Claude 所引發的連鎖反應來看，如今既面對強大競争對手，又深陷與馬斯克的訴訟中的 OpenAI 無疑是最焦慮的一個。

但事實上，從目前來看，OpenAI 可能并不焦慮。首先，兩家公司不同的定位被人們忽視了。據福布斯對 Anthropic 聯合創始人的采訪，這家公司反復強調："Anthropic 更像是一家企業公司，而不是一家消費者公司。" 盡管從產品形态和商業模式來看，chatGPT 和 Claude 并無明顯差别，但顯然 Anthropic 面向的是 to B 用户，而非 C 端的大眾。而從 Claude 提供的客户案例中，這些 B 端客户包括了如科技公司 Gitlab、Notion、Salesforce、SAP 等。

其次，從戰略層來看，盡管都是為了通往 AGI，但 OpenAI 謀求「大而全」，Anthropic 則偏向「小而美」。OpenAI 一系列的硬體公司和算力布局，都可以印證這一點。

相比之下，更焦慮的可能是谷歌。盡管身為 Anthropic 背後的金主之一，但相比亞馬遜對 Anthropic 的「熱情」，谷歌卻無多少反應。

谷歌在近期正在陷入一系列的争議中。一方面，Gemini 陷入「種族偏見」的輿論浪潮，許多網友發現，Gemini 的文生圖功能出現問題，比如似乎刻意在拒絕生成白人的形象，谷歌随後下架 Gemini 文生圖功能，谷歌 CEO Sundar Pichai 回應稱該問題「不可接受」，并在内部信中表示，公司在修復 Gemini 護欄方面已經取得了進展。

據 BusinessInsider 的報道，一位谷歌現任高級員工将這一事件形容為「一場公關噩夢」，" 谷歌員工很生氣。" 華爾街的分析師甚至認為，谷歌需要剔除那些胡作作非為的人，包括 CEO Sundar Pichai。Bernstein 分析師 Mark Shmulik 在一份研究報告中也思考了類似的問題——是否是時候對谷歌的高層進行改組。

盡管谷歌一直将自己形容為一家人工智能領先的公司，它的基礎研究也深刻影響着此輪大模型浪潮。但無論在模型的推出節奏，還是商業化路線上，谷歌都明顯遲滞于微軟和 OpenAI。

AI 技術的迭代飛速，這意味着洗牌也在快速進行。一個有趣的觀察是，如今在此輪浪潮中，被贊美的對象換成了 Meta 和微軟。而此刻的 OpenAI 和谷歌，他們以技術見長，但都面臨着增長所帶來的代價——無論是組織内部的動蕩，抑或是保守的戰略。

參考資料：

1、機器之心：Llama 2 第二波劃重點：過于「謹慎」、代碼生成改進空間大

2、BusinessInsider：How Google lost its way