數月 → 幾天：OpenAI 被曝縮水模型安全測試，AI 競賽埋下隐患 - 大酷樂

今天小編分享的科技經驗：數月 → 幾天：OpenAI 被曝縮水模型安全測試，AI 競賽埋下隐患，歡迎閱讀。

IT 之家 4 月 12 日消息，金融時報（FT）昨日（4 月 11 日）發布博文，報道稱 OpenAI 大幅壓縮最新大型語言模型（LLM）安全測試時間，此前需要數月時間，而最新 o3 模型僅有幾天時間。

競争驅動，安全讓步

據八位知情人士透露，OpenAI 大幅壓縮模型的安全測試時間，留給員工和第三方測試團隊 " 評估 "（evaluations，即測試模型風險和性能）時間僅有數天時間，而此前通常會耗時數月時間。

IT 之家援引博文介紹，OpenAI 面臨來自 Meta、Google 及 xAI 等對手的激烈競争，需快速推出新模型以維持市場優勢。o3 模型計劃最早下周發布，留給測試者安全檢查時間不到一周，而此前 GPT-4 的測試期長達六個月。

一位測試過 GPT-4 的人士透露，過去安全測試更徹底，某些危險能力在測試兩個月後才被發現，而如今競争壓力迫使公司追求速度，忽視潛在風險。

測試不足，監管缺位

全球目前尚未統一 AI 安全測試标準，但歐盟《AI 法案》将于今年晚些時候上線，要求企業對其最強大的模型進行安全測試。

AI Futures Project 負責人 Daniel Kokotajlo 表示，由于缺乏強制監管，企業不會主動披露模型的危險能力，競争壓力進一步加劇了風險。

OpenAI 曾承諾構建定制模型版本，測試其潛在濫用風險，例如是否能協助制造更具傳染性的生物病毒。

這種測試需投入大量資源，包括聘請外部專家、創建特定數據集并進行 " 微調 "（fine-tuning）。但 OpenAI 僅對較老舊的模型進行有限微調，最新模型如 o1 和 o3-mini 未全面測試。前 OpenAI 安全研究員 Steven Adler 批評，若不兌現測試承諾，公眾有權知情。

安全測試未覆蓋最終模型

另一問題在于，安全測試通常基于早期 " 檢查點 "（checkpoints），而非最終發布模型。一位前 OpenAI 技術人員表示，發布未經測試的更新模型是 " 不良做法 "，而 OpenAI 辯稱，其檢查點與最終模型 " 基本一致 "，并通過自動化測試提高效率，确保安全。

熱門排行

王治郅：楊瀚森主要的問題是速度他的速度跟郟君昊 | 2025-05-05
貿易戰燒進電影院：特朗普拟重稅打擊外國電影習又夏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年寸飛蘭 | 2025-05-05
手機電池突破8000mAh？矽碳技術的回旋镖：「折衛青柏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年繁綺文 | 2025-05-05
任天堂對Genki提起Switch 2商标侵權訴訟，後郜萌運 | 2025-05-05
哪吒汽車APP和官網恢復正常知情人士：之前斷袁曼雁 | 2025-05-05
極越汽車 CEO 夏一平名下青島/義烏兩家公司集玲琳 | 2025-05-05
全國經濟第一大省明确，推動組建農商聯合銀行佼昌翰 | 2025-05-05
桑保利：亞馬爾有配合意識&有點像梅西姆巴佩甄正浩 | 2025-05-05
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裡面都有啥？衛青柏 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
解除資格！停止一切合作佼昌翰 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
200戶連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容溫柔郜萌運 | 2023-05-02