今天小編分享的科技經驗:DeepSeek頭号黑粉這下爽到了,歡迎閱讀。
還真讓 DeepSeek 頭号黑粉美到了。
北京時間 2 月 25 日,Anthropic 傳來兩個好消息。
第一個好消息是,Anthropic 發布首個 " 混合模型 "Claude 3.7 Sonnet。在騰訊、阿裡、xAI 等紛紛跟上 DeepSeek 的腳步,推出推理模型的時候,Anthropic 說 " 我都要 ",将及時應答和深度思考結合,抛棄了多模型堆砌的做法。
第二個好消息是,在 Claude 3.7 Sonnet 發布的幾乎同時,《華爾街 . 日報》稱 Anthropic 接近完成 35 億美元的新一輪融資,估值可能達到 615 億美元,是此前 180 億美元估值的 3 倍有餘。
Anthropic 有很多頭銜。這家公司是 OpenAI" 叛軍 " 代表,是矽谷明星人工智能初創公司。同時,在近一個月,該公司還成為了 "DeepSeek 頭号黑粉 ",不僅質疑 V3 的 600 萬美元訓練成本,還由聯合創始人之一親自上陣撰寫檄文,呼籲加強美國的芯片出口管制。
如今新模型發布,再加上融資即将超額完成的消息,Anthropic 暫時頂住了 DeepSeek 帶來的壓力。
這不僅是屬于 Anthropic 的好消息,實際上,在華爾街和大眾都因 DeepSeek 質疑矽谷的高支出 AI 戰略時,Anthropic 的表現證明着神話還未破滅。對 OpenAI 等也在融資的企業來說,也無疑是一個積極的信号。
一
DeepSeek R1 推理模型的推動下,OpenAI 火速上線 o3 mini,馬斯克的 xAI 也在上周發布 Grok 3 時帶上了 Grok Reasoning。
而 Anthropic 此時選擇:來個混合大招。
此前一直傳聞 Claude 4 即将發布,但 Anthropic 這次實際上發布的是 Claude 3.7 Sonnet。
Anthropic 稱,Claude 3.7 Sonnet 是市面上首款 " 混合模型 ",并将立即投入使用。
此 " 混合 ",指的是業界首個在單一架構上整合實時應答和深度思考的模型。相比而言,不管是 DeepSeek 的 R1 模型,還是 OpenAI 的 o3-mini,都是嚴格的推理模型。
在使用 R1 和 o3-mini 時,思考過程是強制的,用戶只能等待,由此拖慢獲取答案的時長。但有的問題實際上并不需要長時間地思考,這時候需要用戶來判斷并切換到及時應答的模型。
但在 Claude 3.7 Sonnet 這種混合模型中,用戶不必切換即可獲取實時應答或者深度思考。
" 這個模型融合了所有功能——我們的目标是擁有一個統一的 AI,能适用于各種場景。這樣對我們的客戶而言會更簡單一些。"Anthropic 聯合創始人兼首席科學家賈雷德 · 卡普蘭表示。
卡普蘭将其比作人類大腦的運行方式:有的問題需要深度思考,有的問題需要快速作答。Claude 3.7 Sonnet 将這兩種能力整合在同一個模型中,而不是完全分開。
除此之外,用戶可以利用 " 草稿 " 功能,在問題比較復雜時,指導模型進行更準确的思考;API 用戶還可以精細控制 Claude 3.7 Sonnet 的思考時長,甚至控制思考的預算,如告訴 Claude 在回答時最多思考多少個 tokens。
在模型表現上,相較于上一代 Claude 3.5 Sonnet:"Claude 3.7 Sonnet 在遵循指令、一般推理、多模态能力和自主編碼方面表現出色,擴展思維在數學和科學方面提供了顯著提升。" 值得一提的是,其數學、編碼能力提高 10%。其中編碼能力尤為突出,在多個測試中有所展現。
根據 SWE Bench 測試數據,Claude 3.7 的代碼能力大幅超越 DeepSeek R1、OpenAI 的 o1、o3 模型。專注 AI 編程的 Cursor 已經宣布集成 Claude 3.7 Sonnet。
Claude 3.7 Sonnet 已經全面上線,支持免費版、專業版、團隊版和企業版,此外可以在 Anthropic API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 上使用。不過免費用戶目前無法使用擴展思考模式。
在定價方面,Claude Sonnet 3.7 的價格為:輸入 3 美元 / 百萬 tokens,輸出 15 美元 / 百萬 tokens。這與前代模型保持一致,并顯著高于競争對手的純推理模型,如 OpenAI o3 mini 和 DeepSeek R1。
在此基礎之上,Anthropic 也同步發布了專注于代碼的 Agent Claude Code,可以直接在終端運行,幫開發者完成編程任務。
從搜索、閱讀代碼、編輯檔案、編寫代碼、運行測試,一直到将代碼提交到 GitHub。不過,目前 Claude Code 僅作為有限的研究預覽版提供。
二
在發布大模型的同時,Anthropic 正在進行的融資也傳來好消息:
《華爾街 . 日報》報道:"Claude 背後的公司克服了因中國 DeepSeek 的成功引發的投資者擔憂,估值達到 615 億美元。"
據稱,Anthropic 即将完成一輪 35 億美元的融資,估值将達到 615 億美元。最新一輪融資的投資者包括風投公司 Lightspeed Venture Partners、General Catalyst 和 Bessemer Venture Partners。總部位于阿布扎比的投資公司 MGX 也在洽談參與事宜。
這個數字雖然離 OpenAI 的 1570 億美元估值還有距離,但是超過了 xAI 去年底的 400 億美元估值。xAI 也正在尋求融資,預計估值 750 億美元。
要知道,這次融資之前 Anthropic 的估值還只有 180 億美元。
知情人士向《華爾街 . 日報》透露,Anthropic 最初計劃籌集 20 億美元,但在和投資者談判期間成功提高了這一數額。
Anthropic 迎頭趕上,甚至拿出 " 要超越你們所有人 " 的架勢,這并不令人意外。可以說,今天的兩個好消息,都在夯實 Anthropic 被貼在身上的标籤。
Anthropic 自 2021 年成立之初,就因其由 OpenAI 前員工創辦,而喜提 "OpenAI 叛軍 " 的稱号。
之前 Anthropic 已經多次搶先 OpenAI 一步。如去年的 " 代理 " 功能,OpenAI 在 Anthropic 之後跟進。
這次發布混合模型,高舉 " 反多模型堆砌方案 " 的大旗,也不禁讓人想到了 OpenAI CEO 山姆 · 奧特曼前不久發布的 GPT 5 計劃。彼時奧特曼就表示,意識到模型和產品功能太復雜,未來将統一。不承想又被 Anthropic 搶先一步了。
Anthropic 的聯合創始人卡普蘭和邁克 · 克裡格 都表示,預計競争對手很快也會轉向這種混合模型的方向。
另一方面,在 DeepSeek R1 橫空出世之後,Anthropic 俨然化身 "DeepSeek 頭号黑粉 "。
對 DeepSeek 的态度,矽谷大佬們大多是贊許中帶着苦澀,但言語上還算客氣。
如馬斯克在 Grok 3 發布前,一邊贊許 DeepSeek R1 很強,給中國工程師點贊,但也表示 DeepSeek 帶來的不算 AI 領網域的一次突破,并順勢誇贊了自家的模型。
奧特曼一邊大贊 DeepSeek" 無疑是令人印象深刻的模型 ",一邊暗戳戳地表示 DeepSeek 用 OpenAI 專有模型訓練自己的模型,可能違反了其服務條款。後來又 " 大方 " 表示 " 沒有起訴 DeepSeek 的計劃 "。
而 Anthropic 就很不客氣了,不僅壓根不相信 DeepSeek V3 的訓練成本僅有 600 萬美元,甚至創始人之一的達裡奧 · 阿莫迪還發布了檄文《關于 DeepSeek 和出口控制》。
文章的核心思想就是,由于 DeepSeek V3 不可能只花了 600 萬美元成本,而咱們又聽說他們走私了芯片,因此咱們得好好管制一下芯片出口。之前只管 H100 和 H800 這些高端芯片顯然是不夠的,咱得把 H20 也管起來。
Anthropic 當然不願意認,雖叫 "OpenAI 叛軍 ",但背靠巨頭燒錢這方面,二者如出一轍。OpenAI 前有微軟後有軟銀,而 Anthropic 則抱上了谷歌和亞馬遜的大腿。
尤其是亞馬遜,2023 年就向 Anthropic 投資了 40 億美元,2024 年又承諾投資 40 億美元。
而 DeepSeek 的大火又恰逢 Anthropic 進行新一輪融資之時,着急上火也是情理之中的。左手檄文打壓 DeepSeek,右手發布及時應答 + 深度思考的混合模型,總算穩住了局面,如果不出意外,這一輪 Anthropic 将超額完成融資目标。
三
Anthropic 的兩個好消息,也可以讓矽谷暫時松口氣了。
正在融資的不止有 Anthropic。
據《華爾街 . 日報》等媒體,OpenAI 正在洽談巨額融資,拟融資額至多 400 億美元,估值可能被推高至 3000 億美元。此外,xAI 也在進行新一輪融資,以 750 億美元估值尋求 100 億美元融資。他們無疑也都感受到了 DeepSeek 帶來的投資者擔憂。
Anthropic 至少證明了,在當下矽谷搞投入的 AI 路徑尚未神話破滅," 大力出奇迹 " 在某種程度上依然可以打動人心,雖然可能需要付出比之前多的遊說成本。
但戰争遠沒有結束。
一方面,Anthropic 依然面臨着商業化難題,而這一點在後 DeepSeek 時代顯得更加刺眼。Anthropic 此前估值和收入比達到 68.6 倍,而 OpenAI 大概在 42.4 倍的水平。
據 The Information,Anthropic 的收入預計将從 2025 年的 22 億美元激增到 2027 年的 120 億美元。挑戰在于開支,今年 Anthropic 預計 " 燒錢 "30 億美元,已經比前一年的 56 億美元低了。公司高層表示,預計到 2027 年可以停止赤字開支,實現盈利。
另一方面,自身商業化難解的同時,外部競争也在加劇。
Grok 3 剛剛發布,Anthropic 發布混合模型,緊接着谷歌的視頻生成模型 Veo 2 API 也曾宣布在年初發布,還有 OpenAI 的 GPT-4.5 随時可能降生,以及 GPT-5 預計在 5 月底發布。
開源的戰場也越來越熱鬧。馬斯克的 xAI 延續新代發布、開源上一代模型的做法,宣布将開源 Grok 2。而 OpenAI ——此前和 Anthropic 一起被視為 " 閉源 " 的代表——也松了口,奧特曼面對 DeepSeek 的大火,直接坦言過去站在了 " 錯誤的一邊 ",在社交媒體上發起投票,釋放将有一個 " 開源項目 " 的信号。
而眼下,DeepSeek 也沒有坐以待斃,而是宣布啟動 " 開源周 ",目前已經開源 FlashMLA 的代碼,以及 EP 通信庫。
Anthropic 頂住了 DeepSeek 的壓力,發布混合模型、傳出超目标融資的消息。但要讓好消息延續,仍有諸多挑戰。