大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

大模型競賽加劇,OpenAI最大對手發布Claude 3,可預測美國經濟

2024-03-06 简体 HK SG TW

今天小編分享的互聯網經驗:大模型競賽加劇,OpenAI最大對手發布Claude 3,可預測美國經濟,歡迎閲讀。

圖片來源:Anthropic 官網

當地時間 3 月 4 日,沒有任何預告,位于美國硅谷的人工智能創業公司 Anthropic 在社交平台 X 上宣布發布大模型 Claude 3,宣稱全方位超越 GPT-4。Anthropic 被視為 OpenAI 最大的競争對手,最初由 OpenAI 前高管層創立,背後的大投資者有谷歌和亞馬遜,與 OpenAI 背後的微軟形成陣營對比。

Anthropic 表示,Claude 有先進的高級推理、視覺分析、代碼生成、多語言處理等功能。目前 Anthropic 發布了 Claude 3 的三個版本:Claude 3 Haiku(Haiku 意指俳句)、Claude 3 Sonnet(Sonnet 意指十四行詩)和 Claude 3 Opus(Opus 意指藝術作品),這三個版本功能依次增強,價格成本也依次上升,Opus 版本最強大。

據 Anthropic 官方發布的視頻,Claude 可以使用一系列工具,來預測美國 GDP 走勢。Claude3 Opus 可以使用網頁視圖工具,進入網頁的 URL 鏈接并利用多模态中的視覺能力查看網 頁信息。Claude 3 Opus 還使用 Python 解釋器來寫出代碼,渲染影像,将數據生成折線圖。結果顯示 Claude 預測的 GDP 走向的準确度在 5% 以内。

Claude 3 預測的 GDP 走向準确度在 5% 以内。圖片來源:Anthropic 官方 YouTube

在讓 Claude 3 分析世界上幾大經濟體的 GDP 變化時,Claude 3 還使用了調度子代理的工具,能自行建立多個子模型代理(相當于 Claude 3 自身的多個版本),Claude3 給這些子模型寫提示詞,指揮幾個代理平行進行 GDP 的運算和預測。

據博主 " 數字生命卡茲克 " 測評,Claude 有着目前大模型中一流的推理能力,甚至超越 GPT-4。Claude 官網給出的 Claude 3 測評結果顯示,在使用 MMMU 多語言數學推理測試集來測試時,Claude 3 Opus 達到 90.7% 的準确率,用的是 0-shot,GPT4 是 8-shot,達到了 74.5%。0-shot 意味着大模型沒有在 Prompt 裏給任何示例,就直接被要求完成任務。而 8-shot 則是在提示詞中給了 8 個示例。這説明 Claude 在不給出示例的情況下,利用提示詞裏的上下文來推理的能力更強,

Anthropic 表示,Claude 能處理超長的上下文,有着近乎完美的記憶力。Claude 3 系列型号在發布時最初将提供 200K 上下文視窗。然而,所有三種模型都能夠接受超過 100 萬個詞元的輸入。為了有效地處理長上下文提示,模型需要強大的回憶能力。

一種叫 " 大海撈針 "(NIAH)的評估,是測試 Claude 大模型從輸入的海量數據中準确回憶并找到某個細小信息的能力。Anthropic 使用開源文檔,每個提示詞中放置 30 個随機問題針,來訓練 Claude,結果 Claude 3 Opus 不僅實現了近乎完美的召回率,超過 99% 的準确率,而且在某些情況下,它甚至識别出提示詞中的 " 針 " 語句似乎是人類特意插入到原文中的,并識别這個測試本身的局限性。

據科技自媒體 " 平凡的平凡 " 測評,把劉慈欣 2 萬字的小説《鄉村醫生》分别給到 Claude 3 和 GPT-4 後,提問歷史學家的名字,Claude 3 找出了歷史學家名字所在段落,而 GPT-4 沒找到。

另外,Anthropic 的官方視頻還顯示,最輕量的 Haiku 版本 Claude 3,可以做到将數千個掃描文檔,這些 PDF 是掃描版而非文字版,即使對于不清晰的字迹,Claude 大模型可以用視覺能力,通過上下文的推理來識别文字。随後,Claude 3 分析并提取關鍵詞,來轉化為結構化的數據。這将簡化出版商、醫療供應商、律師事務所的繁重的檔案處理業務。

Anthropic 由 OpenAI 前高管 Daniela Amodei 和 Dario Amodei 兄妹于 2021 年創立。2023 年 9 月,亞馬遜宣布投資高達 40 億美元,谷歌随後在次月承諾投資 20 億美元。2024 年 2 月,風險投資公司 Menlo Ventures 完成了一項額外投資 7.5 億美元的交易。據紐約時報報道,Anthropic 在一年内融資 73 億美元。

據 The Atlantic 報道,2022 年 11 月,當 OpenAI 高層得知 Anthropic 要發布 Claude 聊天機器人時,決定提前上線 ChatGPT,随後這場席卷全球的 AI 風暴就此開啓。2023 年秋天,當 OpenAI 的首席執行官 Sam Altman 被董事會戲劇性地解雇時,董事會曾在那個混亂的周末邀請過 Anthropic 的首席執行官 Dario Amodei 來擔任 OpenAI 的代理 CEO,但是被 Dario 拒絕。

在 Claude 3 發布的幾天前,3 月 1 日,特斯拉首席執行官 Elon Musk 起訴 OpenAI 及其首席執行官 Sam Altman,稱 OpenAI 放棄了最初的造福人類的非盈利使命,轉向為盈利而開發人工智能。Claude 3 發布後,彭博社科技采訪 Anthropic 聯合創始人 Daniela Amodei,問及 Elon Musk 起訴 OpenAI 一事時,Daniela 表示 Anthropic 作為一家公益公司,致力于平衡 AI 的潛在力量,同時保證產品的可靠、安全,執行公司最初的願景,即提高人工智能行業的水平,保證投入市場的模型產品盡可能安全。

熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們