今天小編分享的互聯網經驗:OpenAI勁敵出手!Claude 3正式發布,超越GPT-4,一口氣讀15萬單詞,歡迎閱讀。
OpenAI 創始人奧特曼都還沒來得及和馬斯克掰扯完新仇舊恨,沒關系,還有其他人會悄悄出手——
北京時間 3 月 4 日晚間,Anthropic,毫無預警地發布了最新一代大模型 Claude 3,距離上一代的 Claude 2 發布,僅相隔 8 個月。
Anthropic 是 OpenAI 的勁敵,其核心團隊同樣是 OpenAI 的創業原班人馬。團隊因為與 OpenAI 理念不合而分家,于 2021 年成立了新公司 Anthropic。
僅在 2023 年,Anthropic 就連續獲得五輪,共計 73 億美元的融資。在大模型訓練上,Anthropic 可以說是業内第一梯隊,同樣備受矽谷關注。
這次,毫無疑問,Claude 3 直接對标 OpenAI 當前最強大的模型 GPT-4,多模态能力配齊,并且直接甩出超過 46 頁的技術報告,自豪表示:
全面超越 GPT-4!
△來源:Claude 來源:
新一代的 Claude 3 分為三個版本,分别為 Haiku、Sonnet、Opus 三款模型。從模型尺寸來看,可以理解為模型的中杯、大杯、超大杯。
雖然 Anthropic 并沒有給出模型的具體參數,不過給出了三款模型所适用的場景:
Haiku:是相應速度最快的模型,也是成本最低的選項,在大多數純文本任務上的表現仍然相當出色,也同時包含多模态能力(比如視覺)
Sonnet:适用于需要平衡性能和成本的場景,它在純文本任務上的表現與後面的 Opus 相當,但在成本上更為經濟,适合于那些需要性能稍微好點,但預算有限的企業和個人用戶
Opus:具有強大的推理、數學和編碼能力,接近人類的理解能力,适用于需要高度智能和復雜任務處理的場景,如企業自動化、復雜金融預測、研究和開發等。
從本周開始,Claude 會向 159 個國家開放。其中,Opus 和 Sonnet 模型的 API 均已上線,開發者已經可以直接使用。經濟性能兼顧的 Sonnet,就在官網上提供免費體驗,Opus 則可供 Claude Pro 訂閱者使用。
盡管 OpenAI 憑借 Sora 在文生視頻領網域打了一場漂亮的翻身仗,但視頻賽道所在的發展階段更早。如今的主戰場仍在大語言模型(LLM)上,離產品化也更近。
圈内人也看熱鬧不嫌事大。近期不少報道顯示,馬斯克将 OpenAI 告上法庭,讓 OpenAI 不得不内部推遲有關 GPT-5 的發布—— GPT-5 被認為能夠實現 AGI(通用人工智能)。著名 AI 圈網紅、英偉達的首席 AI 科學家 Jim Fan 就表示:
Claude 3 剛剛發布了,坐等幾個小時後 OpenAI 精心安排的 GPT-5 發布。
△來源:Twitter(X)
2024 年才剛剛過去兩個月,我們就已經見證谷歌 Gemini Pro、OpenAI 的 Sora,再到如今的 Claude 發布……巨頭混戰再度拉開序幕,大有愈演愈烈之勢。
一口氣讀 15 萬單詞,還能自己拆解復雜問題
如果是 OpenAI 是大模型領網域的 " 六邊形戰士 ",無論是模型視頻、商業化綜合水平一騎絕塵,那麼 Anthropic 從風格上看更為低調,也更強調專才,但這次的能力提升确實巨大。
有看客甚至表示:
Claude 3 終結了 GPT-4 時代。
這次 Claude 3 的兩大更新亮點,一個是長文本,二是多模态能力。
長文本就是 Anthropic 的一個顯著優勢,體現為在讀論文、小說等字數更多的文本時,Anthropic 更擅長理解和回答用戶的相關問題。
這次,Claude 3 大大提升了上下文對話視窗,達到 200k ——可以理解為單次和模型對話能夠輸入的文本。
具體而言,Claude 3 200k 的對話長度,相當于能夠單次處理超過 15 萬英文單詞,而 GPT-4 Turbo 的上下文視窗為 128k,大約是 9.6 萬個英文單詞。
并且,Claude 3 也第一次允許影像和文檔上傳。和 ChatGPT 一樣,Claude 3 能夠 " 認 " 出來圖裡的是什麼東西,直接描述,回答用戶的問題。
而更令人印象深刻的還是,Claude 3 在分析一些復雜問題時,已經能夠和人一樣,先拆解問題,并且交由子模型來進行調度。
在 Anthropic 的演示視頻裡,就舉了一個需要用 python 模拟經濟形勢走向的例子。當把 " 分析美國十年 GDP 未來趨勢 " 的任務交給 Claude 3 之後,Claude 就默默地做了這些事:
先打開一個名為 "webview" 的工具,跳到這個問題相關的資料網址裡
因為有多模态能力,所以能夠把 " 看到 " 的信息,無論是文字還是圖表,都扒拉下來,用來解決問題
然後自己寫 python 程式、渲染趨勢圖,讓人類看是否正确
最有趣的就是,網頁中如果看到一個數據圖表,沒有明确數據的,Claude 3 甚至能通過識别影像,來估算每個階段大概數據是多少,進行還原。
△搜索引擎中的數據圖表
△ Claude 3 還原的折線圖,估算了每個時間節點的具體 GDP
AI 安全也是 Anthropic 區别于 OpenAI 的一點。在 OpenAI 和 Anthropic 團隊分家的時候,其最重要分歧正是包含對 AI 安全的考慮,Anthropic 希望建立一個 " 更可信 " 的模型,而 OpenAI 顯然希望用商業化驅動模型更快地前進,路線上更為激進。
對此,Anthropic 采取的措施包括但不限于:制定了一套框架,用于評估和減輕 AI 模型可能帶來的潛在災難性風險,比如繼續擰自動化評估和紅隊測試,以确保 AI 不會發展出可能造成傷害的能力。
2023 年 4 月,Anthropic 甚至開源憲法人工智能(Constitutional AI)引起了圈内轟動,這是一個限制模型行為遵守特定憲法原則的 AI。
以及 2024 年也是美國大選年, Anthropic 也在準備開發和執行關于在政治和選舉背景下使用工具的政策,評估模型對選舉錯誤信息、偏見和其他濫用的反應,确保用戶能夠在選定國家獲得準确和最新的投票信息。
不過,Anthropic 也因為太過重視 AI 安全,很多問題的評估上很謹慎,甚至直接不回答,惹來一片用戶吐槽。這次,Anthropic 表示,Claude 3 在這個問題上大有改進。
比如,Claude 3 的對無害信息的拒絕回復率,普遍來到了 10% 附近,比 Claude2.1 和 2.0 都有進步。
△來源:Anthropic
據 CNBC,Anthropic 拒絕透露訓練 Claude 3 到底花了多少時間和多少錢,但表示 Airtable 和 Asana 等知名 SaaS 公司有幫忙對模型進行了 A/B 測試,讓模型的可控性也有所改善。
技術以外,Anthropic 商業化還要再提速
盡管 Anthropic 技術上又一次拿出了看家實力,但大模型領網域如今已經走過了一年多時間的技術競争。如何從模型走向實際的產品落地,創造更大的商業價值,是懸在所有廠商頭上的劍。
如今 Anthropic 背後站着谷歌雲、亞馬遜,已經和 OpenAI(背靠微軟)形成鮮明的陣營對比。但從商業化角度,當前 Anthropic 遠趕不上 OpenAI,這意味着 Anthropic 在 2024 年會面臨更大壓力。
和 ChatGPT 一樣,Anthropic 也是 To B 和 To C 兩條腿走路。在企業側,Anthropic 已經服務了包括 Slack、Notion 和 Quora 等用戶。
而據 The Information 2023 年 12 月報道, Anthropic 預計到 2024 年底将產生超過 8.5 億美元的年化收入。相比起來,同樣截至 2023 年底,OpenAI 由于 ChatGPT 的強勁增長,年化收入從 10 月中旬的 13 億美元就增至 16 億美元。
往後,随着 OpenAI 商業化提速,差距還可能越來越大。The Information 援引一些 OpenAI 領導者的觀點,到 2024 年底,他們預計 OpenAI 年化收入可以達到 50 億美元,而其他人則認為可以達到更高的數字。
技術上的軍備競賽遠未結束。在 2023 年 12 月,Anthropic 還在進行新一輪高達 7.5 億美元的融資,估值為 184 億美元,相比 2023 年初 41 億美元的估值,漲了 4.5 倍。