今天小編分享的科技經驗:永别了,GPT-4,歡迎閱讀。
新智元· 2025 年 04 月 13 日 09:50
猝不及防地,GPT-4 就這樣退出歷史舞台了。
【新智元導讀】GPT-4 時代,落幕了!它将被 GPT-4o 完全取代。而下周,我們也極有可能迎來 GPT-4.1、o3 滿血版以及 o4-mini 這些新模型。大模型進化史,再次迎來關鍵節點。
猝不及防地,GPT-4 就這樣退出歷史舞台了。
4 月 10 日,OpenAI 正式宣布,即将從 ChatGPT 中移除兩年前推出的 GPT-4。
從 4 月 30 日起,GPT-4 将被當前的默認模型 GPT-4o 完全取代。
當然,懷念 GPT-4 的用戶們也不必悲傷,它仍然可以通過 OpenAI API 繼續使用。
不過,在 GPT-4 退役之前,人們的注意力很可能就會轉向 ChatGPT 的新模型。
如今各種爆料已經傳得漫天飛,據說,GPT-4.1(包括 GPT-4.1-mini、GPT-4.1-nano 和 GPT-4.1),去年 12 月宣布的 o3 「推理」模型,以及 o4-mini 全新推理模型都要來了。
遙想 2023 年 3 月 14 日,GPT-4 正式發布,席卷全球,在全球掀起滔天巨浪,然後在兩年内,引爆了全球 AI 大模型的寒武紀大爆發。
它的出現,開啟了一個全新的時代,見證了一場技術井噴的大爆發,鋪墊了後續無數 OpenAI 大模型的繁榮。
如今,這座燈塔終于要退出了。
GPT-4,已成歷史塵埃
Perplexity CEO Aravind Srinivas 最近表示,AI 的進步已經跨越了臨界點——三個月的時間,仿佛就已經跳過了一章歷史。
「我們應該期待,在今年剩餘的時間裡,變化會來得更快。」
的确,就在過去短短三個月裡,我們迎來了 DeepSeek R1、原生影像生成、o3-mini 等重磅炸彈,如今 2025 年也不過剛過去了四個月。
在 AI 圈的眾多消息中,連 GPT-4 的退出都顯得不那麼驚爆了。
昨天的更新日志中,OpenAI 表示,現在 GPT-4o 已經成為了 GPT-4 合格的繼任者。
近期的更新,提升了它的指令跟随、問題解決和對話流暢性。評估中,GPT-4o 在寫作、編碼、STEM 等方面始終優于 GPT-4。
确實,現在很多人都已經不記得,自己上一次用 GPT-4 是什麼時候了。
雖然它确實給很多人帶來了美好的回憶,甚至讓人一度以為 AGI 已經來了。
還記得 2023 年 3 月,GPT-4 推出時全網歡呼的盛況嗎?
當時,它在 ChatGPT 和微軟的 Copilot 網頁版聊天機器人中上線,引起全網驚呼。
這個模型具備多模态能力,能同時理解影像和文本,正式開啟了 AI「看圖說話」的時代,這在 OpenAI 的模型中尚屬首次,可謂石破天驚。
相比于 GPT-3.5,GPT-4 是一次更重大的認知躍遷。
它是首個在專業學術基準中達到哈佛、斯坦福畢業生水平的大模型。
它在數學、醫學、法律之類的考試中擊敗大多數人類;在 SAT、LSAT、美國律師資格考試中交出驚人答卷,能達到 TOP 10%。
它的多模态架構,也為後續的模型演進提供了核心藍本。
從此,大模型能力的阈值徹底提升至可用級,引爆了全球的 AI 應用生态,将生成式 AI 市場從百億規模推升至萬億的量級。
它推動了 Code Interpreter 的誕生,為開發者提供了無限助力,間接推動了開源生态。
那時,幾乎每天一個勁爆消息。那是 OpenAI 的高光時刻,它的一舉一動都牽動着全世界的目光。
當時,全網都在猜測 GPT-4 的訓練成本。後來奧特曼透露,GPT-4 的訓練成本超過了 1 億美元。
終于,在 23 年 11 月,速度更快、成本更低的 GPT-4 Turbo 上線,接替了它的地位。
GPT-4,經典高光時刻
還記得這些輝煌時刻嗎?
2023 年 3 月 14 日,GPT-4 誕生,首個多模态大模型震驚全世界,在 GRE 等各類考試中取得滿分,憑自己就能考上斯坦福。
2023 年 3 月 16 日,GPT-4 全面接入微軟 Office 全家桶,颠覆 10 億打工人,人類與電腦互動方式徹底改變。
2023 年 3 月 17 日,OpenAI 發布 35 頁論文官宣:GPT 時代,80% 的美國人就業将受 AI 影響。
2023 年 3 月 22 日,微軟 154 頁研究刷屏,GPT-4 已經可以被視為一個通用人工智能的早期版本。
2023 年 5 月 4 日,GPT-4 正式聯網,微軟開放搭載 GPT-4 的全新 Bing 聊天機器人,全面開放插件系統,無需排隊人人可用。
2023 年 7 月 7 日,Code Interpreter 官宣向 Plus 用戶全面開放,實測案例驚人。
下一個模型是 GPT-4.1
就在前一天,The Verge 獨家爆料稱,OpenAI 正準備發布一系列全新模型——包括 GPT-4.1(含 GPT-4.1 mini 和 GPT-4.1 nano)、滿血版 o3,以及神秘的 o4 系列(o4-mini、o4-mini-high)。
其中,作為多模态模型 GPT-4o 改進版的 GPT-4.1,最快将在下周面世。
目前,AI 工程師 Tibor Blaho 已經在 ChatGPT 網頁代碼中發現了對這些模型的引用。
不過,GPT-4.5 都來了,為什麼下一個卻是 GPT-4.1?這個越來越倒退的命名規則,實在令人摸不到頭腦。
它在 OpenAI 大模型譜系上有點前不着村後不着店,不知該放在什麼位置。
有人贊嘆道:看到從 GPT-1 到 o 系列以及更高級别的演變,展示了不斷增加的復雜性和能力。這就像觀察人工智能的進化史!
關于 GPT-4.1,現在坊間已經有了蛛絲馬迹。
比如有人發現,在 ChatGPT 的模型列表中,竟然已經出現了 GPT-4.1 這個選項。
這就意味着,此前洩露的小道消息是真的!這就讓大家非常興奮。
但也有人懷疑該網友是造假,把網址從 GPT-4o 改為了 GPT-4.1。
為了自證清白,這名網友大方分享出了自己和 GPT-4.1 的對話鏈接。
因此大家确認,這名網友并沒有撒謊,或偽造截圖,因為順着這個對話鏈接檢查,會發現 model-slug 确實是 GPT-4.1。
很快,有越來越多的人發現自己也能用 GPT-4.1 了。
此外,也有網友推測,奧特曼口中的「Quasars Alpha」,就是 GPT-4.1。
為保 o3 發布,測試時間大幅縮短
而 FT 的報道也再次證實,滿血版 o3 下周很可能再次上線。
知情人士透露,由于 Meta、谷歌、xAI 這些對手逼得實在太緊,OpenAI 為了保持自己的技術優勢并從中獲利,不得不加快模型的發布速度。
為此,曾經需要數月時間進行的模型「評估」——測試模型的風險和性能,如今已被壓縮到了只有短短的幾天。
比如即将退役的 GPT-4,就有着長達 6 個月的評估期。其中一些危險能力,正是在測試進行了兩個月後才被發現的。
但現在給到的時間和資源,已經不足以進行全面的測試來識别和規避風險了。
此前,OpenAI 曾承諾構建定制版的模型來評估潛在的濫用風險,例如是否可能助長生物病毒提高傳播能力。
但這種方法成本很高,不僅要聘請外部專家,還要創建諸如病毒學這類的專業信息數據集,并将其「喂」給模型來進行微調,消耗大量的工程師和計算資源。
很明顯,OpenAI 不想在這件事上花太多精力——他們只對能力較弱的舊模型做了微調,沒有用到更強、更先進的模型上。
比如,在 1 月份發布的 o3-mini 安全與性能報告中,僅僅提到了 GPT-4o 只會在微調後才能執行某項生物學任務。至于 o1 和 o3-mini 如何,OpenAI 卻只字未提。
另外,還有一個令人擔憂的問題是,安全測試針對的并不是最終向公眾發布的模型,而是更為早期的「檢查點」(checkpoints)。在這之後,模型還會繼續更新來提升性能和能力。
面對這些質疑,OpenAI 回應稱,其評估流程已通過引入自動化測試等方式提高了效率,從而縮短了所需時間。
「雖然目前還沒有一套公認的方案,但 OpenAI 采用的方法肯定是最優的,并且已在報告中公開透明地進行了說明。」
此外,OpenAI 還表示,測試所用的檢查點與最終發布的版本「基本一致」。
編輯:Aeneas 好困