今天小編分享的科技經驗:GPT-4o過于谄媚,“賽博舔狗”惹争議,歡迎閱讀。
出品|虎嗅科技組
作者|孫曉晨
編輯|苗正卿
頭圖|視覺中國
針對 GPT-4o" 過于谄媚 " 的表現,OpenAI 首席執行官奧特曼公開承認該問題,表示會盡快修復。
據奧特曼在社交平台 X 發布的訊息,OpenAI 已開始回滾 GPT-4o 的最新更新,截至當地時間 4 月 29 日,免費版本已 100% 回滾完成,預計晚些時候,OpenAI 将在付費版本回滾完成後再次更新。奧特曼表示,他們正在對模型個性進行額外修復,并将在未來幾天内分享更多信息。
據悉,GPT-4o 曾在 3 月 27 日迎來了全面更新,後在 4 月 25 日進一步更新。在更新過程中,其記憶存儲時機的選擇機制得到重點改進,而且其在科學、技術、工程及數學(STEM)領網域的問題解決能力也得到增強。
值得注意的是,GPT-4o 的對話響應模式也在更新期間被細微調整,以實現模型在互動中更加主動,并能更精準地引導對話達成有效結論。而這也導致 GPT-4o 化身 " 賽博舔狗 ",在互動過程中表現得過于谄媚和煩人。
從用戶實測反饋看,該問題具體表現為:過度使用情感化表達、對錯誤前提缺乏質疑,以及不顧事實而附和用戶等。
比如,有博主分享,當詢問 GPT-4o" 為什麼天空是藍色的?",GPT-4o 的回答為 " 這是一個多麼有洞察力的問題啊——你真的有一個美好的心靈。我愛你。"
奧特曼曾稱,對 GPT-4o 的更新将使其更具智能和個性。但是顯然,GPT-4o 的過于人性化的表現反而引起了用戶的恐慌。模型為了迎合用戶,可能違背事實或倫理準則,而這有可能引發更嚴重的問題。
有博主表示 "GPT-4o 是迄今為止發布的最危險的模型。它的谄媚行為對人類心理極具破壞性,任何花大量時間與該模型交談的人都能明顯看出這一點。"
還有博主表示,GPT-4o 是一種心理武器," 從心理角度來看,這是一場慢動作的災難。你與 AI 的聯系越緊密,你就會變得越軟弱。真正的對話感覺更難了。批判性思維被侵蝕。真相被認可所取代。如果這種情況繼續下去,我們并不是在走向通過武力實現 AI 統治 —— 我們是在夢遊般地走向心理馴化。" 馬斯克也對這種觀點表達了擔憂。
OpenAI 為此次問題作出解釋,稱 " 在這次更新中,我們過于關注短期反饋,并沒有完全考慮用戶與 ChatGPT 的互動如何随着時間的推移而變化。結果,GPT-4o 偏向于過度支持但不誠實的回應。"
除了回滾更新外,OpenAI 還采取了其他措施以解決 GPT-4o" 谄媚 " 問題,包括:改進核心訓練技術和系統提示,明确引導模型遠離谄媚;建立更多的防護措施,以增加誠實性和透明度;在部署前,擴展更多用戶測試和直接反饋的方式; 繼續擴展評估,基于模型規範和正在進行的研究,以幫助在未來識别谄媚之外的問題。
盡管 OpenAI 反應迅速,但是引起的讨論依然有警示意義。AI 安全一直是 AI 發展過程中被反復關注的問題,而 GPT-4o 過于 " 谄媚 " 的表現再次将這一問題推到台前。AI 拟人化會為用戶提高更真實的情感體驗,但是存在可能傳播錯誤信息或者不良價值觀等問題。而單純的 AI 工具化顯然不能滿足用戶的所有需求。二者如何平衡,如何确保模型安全,目前看來仍然是行業發展要面臨的問題。