别跟馬斯克扯頭花了，“叛徒”Anthropic解決了困擾OpenAI的難題

今天小編分享的互聯網經驗：别跟馬斯克扯頭花了，“叛徒”Anthropic解決了困擾OpenAI的難題，歡迎閱讀。

圖片來源 @視覺中國

文｜适道

2024 年 LLM 競賽正式拉開，被稱為 OpenAI" 最強競争對手 " 的大模型公司 Anthropic 帶着 Claude 3 系列閃亮登場。而它的對手們，一個正和馬斯克 " 扯頭花 "；另一個因為 Gemini 政治過分正确而焦頭爛額。

一時間，" 全面碾壓 GPT-4"" 全球最強模型易主 " 等字眼鋪滿螢幕，似乎一年前由 OpenAI 開辟的盛世終于轉交給了 Anthropic。

别忘了，GPT-4 已經是一年前的產物，GPT-5 還在路上；谷歌也不是 Anthropic 的 " 對手 "，是其背後第二大 " 金主爸爸 "。有消息稱，去年 12 月，谷歌對 Anthropic 的投資擴大到了 20 億美元。

而在這場 " 你追我趕 " 的遊戲中，還有微軟 " 小兒子 "Mistral AI 已經發布的 Mistral Large，以及被 Meta 列為 2024 年重點任務的 Llama 3 等等。只不過，無論是 Mistral AI 還是 Meta 目前都是被 GPT-4 壓着打，只有 " 脫胎 " 于 OpenAI 的 Anthropic 拿出了可以與之一戰的 " 殺器 "。

這也表明了，暫時的排名只是先來後到，今年的 LLMs 将全面開花，。因此，鋪天蓋地的 "Open AI 被追平比分 " 僅僅是 Anthropic 新品發布的一個噱頭，重點應該放在人工智能公司選擇的商業化路徑上——當 Inflection、Character.AI，甚至 OpenAI 等公司進一步探向 to C 消費者用例時，Anthropic 卻一頭扎向了 to B。這條思路在其剛剛發布的 Claude 3 系列的突出性能、定價策略上均有所體現。

" 田忌賽馬 " 式定價，瞄準 to B 領網域

Claude 3 系列包含三個模型—— Opus、Sonnet、Haiku，性能從高到低。

根據 Anthropic 公布的技術報告，Opus 在知識測試 MMLU、推理測試 GPQA、基礎數學測試 GSM8K 等一系列基準測試中，均優于 GPT-4。Sonnet 的性能與 GPT-4 不相上下；Haiku 則略遜于 GPT-4。不過，這項測試中沒有包含剛剛更新的 GPT-4 Turbo 和 Gemini 1.5 Pro。

值得注意的是，MMLU（本科常識）/ GSM8K （小學數學）/ HumanEval （計算機代碼）等指标上已嚴重飽和，幾乎所有的模型都表現相同。真正有區分度的為 MATH（數學問題解答能力）和 GPQA（領網域專家能力），後者可以體現模型在企業服務方面的能力。

據悉，Claude3 選擇了金融、法律、醫學和哲學作為專家領網域。其中，Opus 的 GPQA 準确率達到了 60%，這意味着其能力接近于同一領網域且能夠上網的人類博士準确率（65% — 75%）。Sonnet 達 40.4%；Haiku 達 33.3%。而 GPT-4 僅為 35.7%。

對此，英偉達資深 AI 科學家 JimFan 指出：我建議所有 LLM 的模型卡都應該效仿這種做法，這樣不同的下遊應用就能知道可以期待什麼。

同時，考慮到企業客戶需要處理很多 PDF、PPT、流程圖，Claude3 系列在視覺能力、準确性、長文本輸入和安全方面，均有所進步。

例如，在準确性方面，Anthropic 使用了大量復雜的事實問題來針對當前模型中已知的弱點，将答案分為正确答案、錯誤答案（幻覺）、承認 " 不知道 "。相應地，Claude3 可以表示自己不知道答案，而不是提供不正确的信息。除了更準确的回復，Claude 3 甚至還能 " 引用 "，指向參考材料中的精确句子來驗證他們的答案。

在定價策略上，以 GPT-4 Turbo 的 40 美元 /1M tokens；GPT-3.5 Turbo 的 2 美元 /1M tokens 為對比。

最強能力 Opus —— 90 美元 /1M tokens，适合最尖端的企業和機構。其接近人類的理解能力，适用于需要高度智能和復雜任務處理的場景，如企業自動化、市場分析和制定策略、復雜的數據分析和金融預測、生物醫學研究和開發等。

最高性價比 Sonnet —— 18 美元 /1M tokens，适合大多數企業客戶規模化使用，消費者客戶也可以負擔。其純文本任務表現與 Opus 相當，更适用于數據處理、代碼生成、個性化營銷，圖文解析等中等復雜度的工作。

最快速度 Haiku —— 1.5 美元 /1M tokens，适合消費者客戶使用。其具備近乎即時的響應能力，在大多數純文本任務上表現仍然相當出色，且包含多模态能力（比如視覺），适用于與用戶實時互動、内容管理、物流庫存管理、文本翻譯等工作任務。

綜合來看，Claude 3 的高端線 Opus 比 OpenAI（GPT-4 Turbo）更貴，低端線 Haiku 比 OpenAI（GPT-3.5 Turbo）更便宜。

如此一來，成敗似乎集中在了中端線 Sonnet 上。如果 " 更少的幻覺 "" 更專業的領網域行家 "" 更高的性價比 " 更吸引企業客戶。那麼，GPT-4 Turbo 的地位将會變得不尴不尬，直到局勢被 GPT-5 打破。

目前，用戶可以免費體驗中等性能的 Sonnet，最強版 Opus 僅供 Claude Pro 付費用戶使用（20 美金 / 月），性能稍弱的 Haiku 即将推出。

PS：适道在 Poe 上使用同樣的提示語，讓 Opus、Sonnet、GPT-4 Turbo 随機做了一段簡單的新聞翻譯。結果，Sonnet 的表現居然最好，甚至翻譯出了縮寫！Opus 水平巨中，而 GPT-4 直接忽略了主語。。。

總之，這一套組合拳下來，正如 Anthropic 聯合創始人 Amodei 兄妹所言："Anthropic 更像是一家企業公司，而不是一家消費者公司。"

目前，Claude 的客戶包括科技公司 Gitlab、Notion、Quora 和 Salesforce（Anthropic 的投資者）；金融巨頭橋水公司（Bridgewater）和企業集團 SAP，以及商業研究門戶網站 LexisNexis、電信公司 SK Telecom 和丹娜法伯癌症研究所（Dana-Farber Cancer Institute）。

根據 Anthropic 高管 Eric Pelz 的一份聲明：在 Claude 3 的早期測試用戶中，生產力軟體制造商 Asana 發現初始響應時間縮短了 42%；軟體公司 Airtable 表示，公司已将 Claude 3 Sonnet 集成到自己的人工智能工具中，以幫助加快内容創建和數據匯總。

可以預見的是，在 Claude 3 發布之後，Anthropic 的 to B 商業化之路将更加明晰，并與 OpenAI 等頭部大模型公司走上不同的道路，盡管最後可能殊途同歸。

十字路口的大模型公司

" 賺的多，花的多 " 是頭部大模型公司的真實寫照。事實上，Anthropic 的 to B 之路既是自願選擇，也是形勢所迫。

截至 2023 年 12 月，OpenAI 的 ARR 已超 16 億美元，2022 年的 ARR 則為 3000 萬美元，增速高到驚人。

雖然尚無數據顯示 Anthropic 的 2023 年 ARR ，但在 2023 年 10 月，Anthropic 和投資人洽談時表示到 2023 年年底，将實現 2 億美元 ARR，每月近 1700 萬美元的營收。另外，根據 Anthropic 最新預測，到 2024 年底，其 ARR 将至少達到 8.5 億美元。

确實得益于快速的收入增長，2023 年 Anthropic 籌集了數十億美元，估值超過 150 億美元。

但根據 Information 報道，有兩位知情人士透露，在支付客戶支持和 AI 伺服器成本後，2023 年 12 月 Anthropic 的毛利率在 50% — 55%，根據 Meritech Capital 的數據，這遠低于雲軟體公司 77% 的平均毛利率。

還有一位重要股東預測，Anthropic 長期毛利率将在 60% 左右，且該毛利率未反映訓練 AI 模型的伺服器成本，因為這些成本是被 Anthropic 納入其研發費用中。

而根據 Sam Altman 的說法，每個模型成本可高達 1 億美元。不過，Altman 自己也笑不出來，因為 OpenAI 的毛利率可能更低。畢竟 ChatGPT 還有免費版，白白花掉一批伺服器成本。

上述事實均表明，即便你強如 OpenAI，Anthropic，但 AI 初創公司普遍的利潤率可能比現在的 SaaS 公司還低。

不過，現在問題還沒顯現，畢竟大模型在風口，投資人更關注其驚人的增速。這些 AI 初創公司也會以其樂觀的收入預測為依據，按照未來一年收入的 50 — 100 倍的估值進行融資。

當然，只要 AI 創業能保持這種增長勢頭，投資人是可以忽略虧損。直到，你的收入增長掉進 30% — 40%。一位 VC 合夥人表示：到那時，如果一家公司的經營現金流為負，并在短期内沒有将至少 10% 的收入轉化為現金流，就很難吸引新的投資人入局。

根據 Meritech Capital 數據，上市軟體公司的中位數是未來收入的 6 倍。也就是說，随着時間的推移，對于初創公司來說，維持這樣的收入倍數将越來越困難。

具體到 Anthropic 和 OpenAI 這對 " 大冤種 " 身上，兩家公司的增長和利潤率部分依賴于主要雲服務提供商。

例如，谷歌和亞馬遜向 Anthropic 投了數十億美元，并将 Anthropic 的軟體出售給其雲客戶。目前尚不清楚這些雲廠商在銷售中獲得的提成比例，但如果改成是 Anthropic 直接向客戶賣模型，利潤率可能會更高。

而微軟雖然用更低的利潤租給 OpenAI 雲伺服器，但 OpenAI 必須将直賣給客戶的部分收入返給微軟。而且，當微軟将 OpenAI 軟體賣給自己的雲客戶時，也會抽掉大部分收入。

因此，對于上述 " 冤種 "AI 創業公司來說，想要拿到高毛利。一方面，通過更新技術，降低運行成本，就像 OpenAI 已經實現的；另一方面，像 Anthropic" 田忌賽馬 " 戰略一樣，找準切口，聚焦企業客戶，盡可能創收，并保持高增速。

據 Forbes 報道，Anthropic 最近以 184 億美元的估值融資 7.5 億美元，該公司計劃在未來幾個月内增加代碼解釋、搜索功能和源代碼引用等功能。其創始人 Amodei 兄妹說：" 我們将繼續擴大模型規模，讓它們變得更加智能，同時也繼續努力讓更小、更便宜的模型變得更智能、更高效。一整年都會有不同程度地更新。"

大模型公司會否下場做選手？

為了更深入理解 Anthropic 的商業化路線，适道節選了一期創始人 Dario Amodei 訪談中的 " 商業化 " 部分，原文如下。

Dwarkesh Patel ：你認為目前的 AI 產品是否有足夠時間在市場上獲得長期穩定收入？還是随時可能被更先進的模型取代？或者到時候整個行業格局會變得完全不同？

Dario Amodei ：這取決于對 " 大規模 " 的定義。目前已經有幾家公司的年收入 1 億— 10 億美元，但能否達到每年數百億，甚至萬億級别，則難以預測。因為這還取決于很多不确定的因素。現在有些公司正在 " 大規模 " 應用創新型 AI，但這不能代表剛開始用就一步到位，達到最佳效果。而且，即使有收入也并不完全等于創造了經濟價值，整個產業鏈的協同發展是一個長期過程。

Dwarkesh Patel ：從 Anthropic 角度來看，如果 LLM 的進步如此迅速，那麼理論上公司的估值應該增長得很快？

Dario Amodei ：即使我們注重模型安全性研究而非直接商業化，在實踐中也能明顯感受到技術水平在以幾何級數上升。對那些将商業化視為首要目标的公司來說，進步肯定比我們更快。（xswl 在内涵 OpenAI ）。

雖然我們承認 LLM 進步神速，但對比整個經濟體系的深度應用過程，技術積累依然處于較低的起點階段。決定未來走向是這二者間的競速——技術本身進步速度、被有效整合和應用，并進入實體經濟體系的速度。這二者都很可能高速發展，但結合順序和微小差異都可能導致相當不同的結果。

Dwarkesh Patel ：科技巨頭可能會在未來 2-3 年投入高達 100 億美元進行模型訓練，這會對 Anthropic 帶來什麼樣的影響？

Dario Amodei ：情況 1 ——如果因為成本問題無法保持前沿地位，那麼我們将不會繼續堅持開發最先進的模型。相反，我們會研究如何從前幾代的模型中獲取價值。

情況 2 ——接受被制衡。我認為這些情況的正面影響可能比它們看起來的要更大。

情況 3 ——當模型訓練到達這種量級後，可能開始會出現新的風險，比如 AI 濫用。

總結一下，雖然 Dario 堅信 LLM 的能力會得到快速且顯著的提升，但可能受制于社會因素、創新采納效率，最終減緩其被 " 大規模 " 應用的速度，無法發揮 LLM 的真正潛力。

據此，Anthropic 的 to B 之路看起來也更加穩妥。一方面，利用自己的 " 安全性 " 長處，切入金融、法律、醫學等領網域；另一方面，尋找偏重 " 技術應用 "，可以長期合作的企業客戶，盡可能消除 C 端消費者采用的不确定性。

說到這裡，我們可以大膽預測一下，如果真如 Dario 預測的 " 社會采納速度低于模型發展速度 "，那麼，未來會否出現一批大模型公司親自下場做應用？尤其在國内。