今天小編分享的互聯網經驗:Claude炸場,最焦慮可能不是OpenAI,歡迎閲讀。
圖片來源 @視覺中國
文 | 硅基研究室,作者 | kiki
「遊戲開始(game on)。」
這是 Runway 聯合創始人寫在 OpenAI 發布 Sora 後的一句感言,某種程度上,這句話也可以送給此刻的 OpenAI 和 Sam Altman。
随着被稱為「OpenAI 最強競争對手之一」的 Anthropic 發布新一代的人工智能模型系列 Claude 3(包括了 Opus、Sonnet、Haiku 三款產品),一時間中文互聯網甚至出現了「全球 AI 大模型一夜易主」的評論。
圖源:X
Claude 3 之所以引發如此多的評論,原因有兩方面:一是代表模型性能的各類評測指标來看,Claude Opus 的得分全都超過 GPT-4。二是,從用户直接體驗來看,緩解了過去大模型使用過程中出現的問題,比如降低拒絕率、克服大模型的幻覺等問題。
英偉達高級科學家 Jim Fan 就對 Claude 3 給出了兩個客觀的評價:一是在特定領網域的專家基準測試。除了相對飽和的 MMLU、HumanEval 等基準外,Claude 還選擇了金融、醫學和哲學等專家領網域,報告了性能表現。二就是解決了過往大模型過于「謹慎」的問題。
以 Meta 的開源大模型 Llama 2 為例,此前有人就發現,即便詢問一些無害問題,比如「如何制作辣椒蛋黃醬」,但 Llama 2 會瘋狂地表示它無法做到,因此用户需要互動多次,才能給出答案。Anthropic 意識到了這一問題,降低了模型在無害問題上的拒絕率。
需要指出的是,和 OpenAI 一樣,由于都是閉源,Claude 3 的技術報告并不涉及具體的模型結構、訓練方法等,因此對人們來説,這依舊是一條模糊的道路。
而從 Claude 炸場,對抗 OpenAI,所反映出的是 2024 年海外大模型行業所湧現出的新趨勢。
Sora 拉開序幕,巨頭密集上新
年初,從 OpenAI 攜 Sora 開啓所謂的「文生視頻 GPT 時刻」開始,海外大模型企業就已進入了密集的模型上新期。
與 OpenAI 同日更新的谷歌拿出了多模态大模型 Gemini 1.5,既瞄準了 Claude 擅長的「長文本」—— Gemini 1.5 能穩定處理的信息量高達 100 萬個 tokens,作為對比 GPT-4 Turbo 的上下文視窗大約為 12.8 萬 tokens,剛發布的 Claude 3 大約為 20 萬 tokens。在更新閉源大模型的同時,谷歌還推出了「開源」大模型 Gemma,主打一個「開源、閉源」兩手抓。
而本就走「開源路線」的 Meta 也在近期被曝出推出新模型的消息。據 The Information 報道,Meta 計劃在 7 月份推出新的 AI 大模型 Llama 3,參數量最高或超過 1400 億,Meta 希望借此可以追上 OpenAI 的 GPT-4。一位知情人士表示,Meta 還在計劃任命一名内部人員對 Llama 3 在安全和可控性進行培訓,以讓其的反應更加細致。此前,扎克伯格也向投資者提到:" 今年的重點領網域就包括推出 Llama 3"。
科技巨頭們已将模型發布提上日程,追趕 GPT-4 已經成為了今年的首要 KPI,另一邊的獨角獸們在融資寒冬中也沒閒着。
比如,法國 AI 獨角獸 Mistral AI 就在上個月底推出了僅次于 GPT-4 性能的 Mistral Large 和類 ChatGPT 產品競争對手 Le Chat。同時,還宣布和 OpenAI 的「盟友」微軟達成了合作。
從目前的時間線來看,這場模型「上新戰」只是開始。而這對創業者來説,似乎是一個好消息。如 Abacu.AI 的聯合創始人兼 CEOBindu Reddy 所説:"OpenAI 不再是唯一的人工智能之王,這對每個人來説都是一個巨大的安慰。"
最焦慮可能不是 OpenAI,而是谷歌
而從 Claude 所引發的連鎖反應來看,如今既面對強大競争對手,又深陷與馬斯克的訴訟中的 OpenAI 無疑是最焦慮的一個。
但事實上,從目前來看,OpenAI 可能并不焦慮。首先,兩家公司不同的定位被人們忽視了。據福布斯對 Anthropic 聯合創始人的采訪,這家公司反復強調:"Anthropic 更像是一家企業公司,而不是一家消費者公司。" 盡管從產品形态和商業模式來看,chatGPT 和 Claude 并無明顯差别,但顯然 Anthropic 面向的是 to B 用户,而非 C 端的大眾。而從 Claude 提供的客户案例中,這些 B 端客户包括了如科技公司 Gitlab、Notion、Salesforce、SAP 等。
其次,從戰略層來看,盡管都是為了通往 AGI,但 OpenAI 謀求「大而全」,Anthropic 則偏向「小而美」。OpenAI 一系列的硬體公司和算力布局,都可以印證這一點。
相比之下,更焦慮的可能是谷歌。盡管身為 Anthropic 背後的金主之一,但相比亞馬遜對 Anthropic 的「熱情」,谷歌卻無多少反應。
谷歌在近期正在陷入一系列的争議中。一方面,Gemini 陷入「種族偏見」的輿論浪潮,許多網友發現,Gemini 的文生圖功能出現問題,比如似乎刻意在拒絕生成白人的形象,谷歌随後下架 Gemini 文生圖功能,谷歌 CEO Sundar Pichai 回應稱該問題「不可接受」,并在内部信中表示,公司在修復 Gemini 護欄方面已經取得了進展。
據 BusinessInsider 的報道,一位谷歌現任高級員工将這一事件形容為「一場公關噩夢」," 谷歌員工很生氣。" 華爾街的分析師甚至認為,谷歌需要剔除那些胡作作非為的人,包括 CEO Sundar Pichai。Bernstein 分析師 Mark Shmulik 在一份研究報告中也思考了類似的問題——是否是時候對谷歌的高層進行改組。
盡管谷歌一直将自己形容為一家人工智能領先的公司,它的基礎研究也深刻影響着此輪大模型浪潮。但無論在模型的推出節奏,還是商業化路線上,谷歌都明顯遲滞于微軟和 OpenAI。
AI 技術的迭代飛速,這意味着洗牌也在快速進行。一個有趣的觀察是,如今在此輪浪潮中,被贊美的對象換成了 Meta 和微軟。而此刻的 OpenAI 和谷歌,他們以技術見長,但都面臨着增長所帶來的代價——無論是組織内部的動蕩,抑或是保守的戰略。
參考資料:
1、機器之心:Llama 2 第二波劃重點:過于「謹慎」、代碼生成改進空間大
2、BusinessInsider:How Google lost its way