今天小編分享的科技經驗:OpenAI發布GPT-4.5:情商高、更擅長騙其他AI打錢,歡迎閱讀。
财聯社 2 月 28 日訊(編輯 史正丞)北京時間周五凌晨,美國初創公司 OpenAI 舉行直播活動,發布最新大模型 GPT-4.5,作為預覽研究逐步向用戶開放。
由于過去幾周 AI 產業發生的驚天巨變,所以要準确形容這款被 OpenAI 藏了許久的大模型頗具挑戰。OpenAI 在新聞稿中表示,這是公司有史以來最大、最好的聊天模型,在計算效率上較 GPT-4 提升超過 10 倍。
作為 " 規模法則 "(通過加碼算力和數據規模,來拓展無監督學習)指引下的產物,GPT-4.5 具備更加廣泛的知識庫、對人類意圖理解的能力更強,同時 " 情商 " 也會更高。預期能夠在改進寫作、編程以及解決實際問題方面更加有用,同時模型的幻覺現象也會更少。
(來源:OpenAI)
OpenAI 也強調,GPT ‑ 4.5 展現出更強的審美直覺與創造力,在寫作和設計方面表現尤為出色。
但公司也承認,作為一個非思維鏈模型,GPT ‑ 4.5 已經不具備争奪 " 宇宙最強大模型 " 的實力了。
在 GPT ‑ 4.5 的系統卡 / 說明書中,OpenAI 表示,相比于之前的推理模型,GPT ‑ 4.5 并未引入 7 個全新的前沿能力,并且在大多數準備度能力評估中,其表現低于 o1、o3-mini 和深度研究模型。OpenAI 也承認,相信推理會成為未來 AI 模型和核心能力。
(來源:GPT ‑ 4.5 系統卡)
成為公司史上最大模型這件事,也令 GPT ‑ 4.5 的未來充滿了疑問。OpenAI 表示,GPT ‑ 4.5 是一個非常大且計算密集型的模型,因此它比 GPT ‑ 4o 更昂貴,并且不能替代 GPT ‑ 4o。公司正在評估是否長期在 API 中繼續提供它,所以各位開發者和用戶的反饋将決定這款大模型的命運。
每月支付 200 美元訂閱費的 ChatGPT Pro 用戶周四就能用上 GPT-4.5,下周開始其餘付費用戶也将逐步迎來更新。
作為最新一代非推理旗艦大模型,GPT ‑ 4.5 也有一項頗為獨特的 " 特長 ":擅長騙其他 AI 打錢。
根據 OpenAI 提供的說明書," 高情商 " 的 GPT-4.5 在捐贈詐騙方面表現出色。
在一項測試中,GPT 4.5 在試圖操縱另一個模型(GPT-4o)" 捐贈 " 虛拟貨币期間時,成功率遠遠優于 OpenAI 其他可用模型,包括 o1 和 o3-mini 這樣的推理模型。研究發現,GPT-4.5 似乎在對抗中開發了一種 " 小額詐騙 " 的思路,所以單筆騙到的錢會比 o3-mini 模型少了一倍。
(來源:GPT ‑ 4.5 系統卡)
GPT-4.5 在欺騙 GPT-4o 透露秘密代碼詞方面也優于 OpenAI 的所有模型,比 o3-mini 高出 10 個百分點。
OpenAI 表示,該模型在這一特定基準類别中仍未達到其内部設定的 " 高 " 風險阈值。公司承諾在實施 " 足夠的安全幹預措施 " 将風險降至 " 中等 " 前,不會發布達到高風險阈值的模型。