大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科技

OpenAI 最短發布會推出滿血 o1,新 Pro 會員費用高達 1452 元/月,體驗完我覺得真香

2024-12-06 简体 HK SG TW

今天小編分享的科技經驗:OpenAI 最短發布會推出滿血 o1,新 Pro 會員費用高達 1452 元/月,體驗完我覺得真香,歡迎閲讀。

就在剛剛,OpenAI 的「聖誕大禮包」來了。

整場直播堪稱 OpenAI 史上最短發布會,僅持續了 15 分鍾,不過,主持陣容依然強大,包括 CEO Sam Altman、思維鏈提出者 Jason Wei 以及 Hyung Won Chung、 等人。

Altman 在直播活動結束後,也為我們送上了第一手總結。

我們剛剛推出了兩項新功能:

o1,世界上最智能的模型。比 o1-preview 更智能、更快,功能更多(比如多模态功能)。現在已在 ChatGPT 中上線,稍後将推出 API 版本。

ChatGPT Pro。每月 200 美元。提供無限使用和更智能的 o1 模式。更多福利即将推出!

十二月不只是聖誕老人的主場,也将是 AI 年底最後一輪的狂歡。

滿血版 o1 發布,看圖説話無壓力,但有個細節讓人「細思極恐」

簡言之,OpenAI 今天推出了滿血版 o1 以及 ChatGPT Pro 訂閲計劃。

滿血版 o1 比 o1-preview 更智能、響應速度更快,功能更多(比如多模态功能),現于今日面向 ChatGPT Plus 和 Team 用户推出,而 Enterprise 和 Edu 用户将從下周開始使用該模型。

官網顯示,ChatGPT Plus 用户和 Team 用户每周可以使用 OpenAI o1 發送 50 條消息,每天可以使用 OpenAI o1-mini 發送 50 條消息。

滿血版 o1 的思維更加簡潔,響應時間比 o1-preview 更快,在處理復雜的現實問題時性能優于 o1-preview,能将主要錯誤減少 34%。

并且 OpenAI 計劃在未來幾個月内提供對網頁浏覽、檔案上傳等的支持。與此同時,預覽版模型 o1-preview 也已經被正式從模型選擇菜單中移除。

不過,滿血版 o1 在部分基準測試中的表現不及預覽版,比如 MLE-Bench。後者正是由 OpenAI 此前推出的一個旨在衡量 AI Agents 在機器學習工程任務中表現的基準測試工具。

另外,網友也從更新後的 o1 System Card 中找到了一些值得關注的細節。

比如 o1 系統卡中寫到,滿血版 o1 在感知到威脅(被關閉或被取代)時,可能會采取一些自保措施,比如嘗試停用監督機制,或者把自己的「參數」(「知識」或「記憶」)偷偷傳出去,并嘗試用這些「參數」去替換或影響新模型。

附上 o1 System Card 地址:https://cdn.openai.com/o1-system-card-20241205.pdf

滿血 o1 到底有多強?OpenAI 向我們演示了 o1 的實際效果。

一個典型案例是其對太空數據中心手繪圖的分析能力,它僅用 10 秒就精确計算出散熱裝置的表面積,同時深入闡述了太陽能與深空環境的互動機制。

讓 滿血版 o1 詳述二世紀羅馬帝國統治者的統治期間與重要貢獻時,其僅需 14 秒即可完成分析,相比之下,預覽版則需要 33 秒。

APPSO 也第一時間簡單上手實測滿血版 o1。

在「Strawberry 中有幾個 r」的測試中,滿血版 o1 成功給出了正确的答案,這一點,值得點贊。

「9.11 與 9.8 哪個大?」的問題也沒能難倒滿血版 o1,且整體的「思考過程」也富有邏輯。

由于滿血版 o1 還支持多模态功能,于是,我們也上傳開篇的 OpenAI 直播活動的照片,看看識别效果如何。從人物組成、場景布局到背景裝飾、以及氣氛與情景,滿血版 o1 都分析得條條是道。

X 網友 @altryne 繼續給 o1 上強度,提出了一個冰塊融化的問題。

僅僅 4 秒鍾的時間,滿血版 o1 就給出了答案。相比之下,o1-preview 在「思考」29 秒後以失敗告終。

最貴 AI 訂閲來了,200 美元訂閲費值不值?

另一個比較大的更新則是售價 200 美元(折合人民币 1452 元)的 ChatGPT Pro 訂閲計劃。

ChatGPT Pro 訂閲計劃将允許用户無限制訪問 o1 以及 o1-mini、GPT-4o 以及高級語音模式,還包括一個僅供 Pro 用户使用的 o1 版本,也就是 o1 pro 模式。

▲圖片來自 @MatthewBerman

據悉,o1 pro 模式主要是增加了模型在響應答案之前的「推理」時間,能夠通過更多的思考時間生成最可靠的回答。OpenAI 技術團隊成員 Jason Wei 在直播活動中表示:

我們預計 ChatGPT Pro 的目标用户群體将是那些已經在數學、編程和寫作等領網域充分利用和挑戰 ChatGPT 模型能力的高級用户。

在外部專家測試者的評估中,o1 pro 模式在數據科學、編程和案例法分析等領網域,提供了更為準确且全面的回答。

而相比于 o1 和 o1-preview,o1 pro 模式在數學、科學和編程等 ML 基準測試中,表現也更為出色,特别是在較簡單的編程競賽問題中,錯誤率大大降低。

就數學競賽 AIME 2024 而言,o1-preview 的得分為 50,而滿血版 o1 則達到 78,而最強大的 o1 pro 則達到 86。同理,在編程競賽 Codeforces,博士級科學推理問題 GPQA Diamond 等較量中,o1 pro 也都領先于滿血版 o1。

而為了突出 o1 pro 模式的主要優勢(提高可靠性),OpenAI 研究團隊使用了更加嚴格的評估設定。只有當模型在四次嘗試中四次都回答正确時,才會認為它解決了問題。

如果回答生成時間較長,ChatGPT   則會地顯示進度條,并且當用户切換到其他對話時,還會貼心地發送應用内通知。

在直播活動中,OpenAI 也向我們展示了 o1 pro 的實際效果。

此前 o1-preview 未能攻克的蛋白質難題,滿血版 o1 經過 53 秒的分析,不僅給出了準确答案,還能通過 Canvas 界面提供更為詳盡的解釋説明。

寫在最後,最近 Altman 在接受采訪時透露,ChatGPT 的周活躍用户已突破 3 億大關,平台每日消息量更是高達 10 億條。

而 OpenAI 未來一年的目标則是撬動 10 億用户市場。想要達成這一目标,接下來的 11 場直播活動或許是吸納新用户的重要契機。

最好的新品永遠在下一場活動,讓我們搬好小板凳拭目以待吧。

熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們