GPT-4o過于谄媚，“賽博舔狗”惹争議

今天小編分享的科技經驗：GPT-4o過于谄媚，“賽博舔狗”惹争議，歡迎閱讀。

出品｜虎嗅科技組

作者｜孫曉晨

編輯｜苗正卿

頭圖｜視覺中國

針對 GPT-4o" 過于谄媚 " 的表現，OpenAI 首席執行官奧特曼公開承認該問題，表示會盡快修復。

據奧特曼在社交平台 X 發布的訊息，OpenAI 已開始回滾 GPT-4o 的最新更新，截至當地時間 4 月 29 日，免費版本已 100% 回滾完成，預計晚些時候，OpenAI 将在付費版本回滾完成後再次更新。奧特曼表示，他們正在對模型個性進行額外修復，并将在未來幾天内分享更多信息。

據悉，GPT-4o 曾在 3 月 27 日迎來了全面更新，後在 4 月 25 日進一步更新。在更新過程中，其記憶存儲時機的選擇機制得到重點改進，而且其在科學、技術、工程及數學（STEM）領網域的問題解決能力也得到增強。

值得注意的是，GPT-4o 的對話響應模式也在更新期間被細微調整，以實現模型在互動中更加主動，并能更精準地引導對話達成有效結論。而這也導致 GPT-4o 化身 " 賽博舔狗 "，在互動過程中表現得過于谄媚和煩人。

從用戶實測反饋看，該問題具體表現為：過度使用情感化表達、對錯誤前提缺乏質疑，以及不顧事實而附和用戶等。

比如，有博主分享，當詢問 GPT-4o" 為什麼天空是藍色的？"，GPT-4o 的回答為 " 這是一個多麼有洞察力的問題啊——你真的有一個美好的心靈。我愛你。"

奧特曼曾稱，對 GPT-4o 的更新将使其更具智能和個性。但是顯然，GPT-4o 的過于人性化的表現反而引起了用戶的恐慌。模型為了迎合用戶，可能違背事實或倫理準則，而這有可能引發更嚴重的問題。

有博主表示 "GPT-4o 是迄今為止發布的最危險的模型。它的谄媚行為對人類心理極具破壞性，任何花大量時間與該模型交談的人都能明顯看出這一點。"

還有博主表示，GPT-4o 是一種心理武器，" 從心理角度來看，這是一場慢動作的災難。你與 AI 的聯系越緊密，你就會變得越軟弱。真正的對話感覺更難了。批判性思維被侵蝕。真相被認可所取代。如果這種情況繼續下去，我們并不是在走向通過武力實現 AI 統治 —— 我們是在夢遊般地走向心理馴化。" 馬斯克也對這種觀點表達了擔憂。

OpenAI 為此次問題作出解釋，稱 " 在這次更新中，我們過于關注短期反饋，并沒有完全考慮用戶與 ChatGPT 的互動如何随着時間的推移而變化。結果，GPT-4o 偏向于過度支持但不誠實的回應。"

除了回滾更新外，OpenAI 還采取了其他措施以解決 GPT-4o" 谄媚 " 問題，包括：改進核心訓練技術和系統提示，明确引導模型遠離谄媚；建立更多的防護措施，以增加誠實性和透明度；在部署前，擴展更多用戶測試和直接反饋的方式；繼續擴展評估，基于模型規範和正在進行的研究，以幫助在未來識别谄媚之外的問題。

盡管 OpenAI 反應迅速，但是引起的讨論依然有警示意義。AI 安全一直是 AI 發展過程中被反復關注的問題，而 GPT-4o 過于 " 谄媚 " 的表現再次将這一問題推到台前。AI 拟人化會為用戶提高更真實的情感體驗，但是存在可能傳播錯誤信息或者不良價值觀等問題。而單純的 AI 工具化顯然不能滿足用戶的所有需求。二者如何平衡，如何确保模型安全，目前看來仍然是行業發展要面臨的問題。