今天小編分享的互聯網經驗:ChatGPT強敵Claude發布全新版本:免費,記性還更好,歡迎閱讀。
作者 | 周愚
編輯 | 鄧詠儀
OpenAI 的最大競争對手之一—— Anthropic,又有大動作。
美國時間 7 月 11 日,這家由 OpenAI 前高管共同創立的人工智能企業,正式發布全新 AI 模型 Claude 2 及其網頁測試版。網頁測試版可以免費使用,且支持中文對話,但目前僅對美國和英國用戶開放。
Anthropic 還稱,面向企業的 Claude 2 API 價格與 Claude 1.3 相同(每生成 1000 個單詞約 0.0465 美元),并希望在未來幾個月内将 Claude 2 推廣至全球範圍。
Claude 2 此次更新,值得注意的是提高了單次可輸入的長度——達 10 萬 token,這幾乎是目前商業可用模型中最大的。10 萬 Token,意味着 Claude 2 可以一次性處理大約 75000 個單詞,這相當于數百頁的技術文檔,甚至是書籍。
此外,模型的編程、數學、推理技能也得到了改善。在 Codex HumanEval(Python 編程測試)中,Claude 的得分從 1.3 的 56.0% 上升到了 2 的 71.2%。在小學數學問題(GSM8K)、多學科問答(MMLU)、科學問題(ARC-Challenge)等方面,Claude 2 較之前也均有所提升。
來源:Anthropic
與 Claude 1.3 一樣,Claude 2 可以實現文檔搜索、總結,代碼分析和編碼等功能。
根據官網給出的示例,用戶只需上傳需要分析的文檔,然後給出相應的指令,Claude 就會自動閱讀文檔,并作出回答。示例中的兩個 pdf 大小總計近 300k,包含超過 83000 個 token,但 Claude 2 仍然成功地完成了任務。
36 氪嘗試輸入了一個英文文檔,并用中文下達指令。Claude 2 雖然給出了較為清晰的答案,但可以明顯感受到滿滿的翻譯腔,并不能達到自然的中文對話水平。
閱讀 pdf,并回答問題。來源:Anthropic
來源:Claude 2 使用截圖
另外,Anthropic 在其發布的論文中表示,Claude 2 具有支持 20 萬 token 上下文的潛力,但目前暫未對外開放。
為了進一步檢測 Claude 2 的中文能力,36 氪向 Claude 2 提出了高難度的 " 諧音梗 " 問題。Claude 2 起初顯然沒有意識到問題的本質,還在嘗試給出符合現實邏輯的答案。
而當 36 氪給出正确答案—— " 巴黎世(是)家 " 時,Claude 2 雖然意識到,問題可能是個 " 諧音梗 ",但卻開始一本正經地胡說八道了起來。
而在代碼方面,官方展示了如何利用 Claude 2,在一幅靜态地圖上加入互動的動效。使用者只需将靜态地圖的 js 檔案輸入聊天框,就可以要求 Claude 2 分析代碼的功能,而後輸入想要實現的新功能,Claude 2 就會自動生成對應的代碼。
36 氪也嘗試用中文提問,要求 Claude 2 生成一個五子棋遊戲的代碼。Claude 2 雖然快速生成了能夠運行的代碼,但還不能判斷勝負邏輯。不過,Claude 2 也給出了相應的解釋,提示用戶繼續編拓展其他代碼。
分析代碼功能。來源:Anthropic
生成新代碼。來源:Anthropic
此次更新還使用了最新的數據集,包括網站、第三方授權數據集和 2023 年初用戶自願提供的數據。相較之下,OpenAI 的 ChatGPT 未聯網時,數據集還停留在 2021 年底。
不過,Anthropic 上市負責人 Sandy Banerjee 在接受 TechCrunch 時表示,Claude 2 與 1.3 在模型上并沒有什麼不同,只是 " 不斷迭代的模型開發方法的產物 "。
截至目前,Anthropic 聲稱已有 " 數千客戶 " 以及一批合作夥伴。公司的投資者之一谷歌,已承諾投資 3 億美元,以換取該公司 10% 的股權。
Anthropic 還表示,要繼續研發大模型,未來兩年内公司還需要約 50 億美元,其中大部分資金将用于計算。