新V觀海外：Anthropic警示AI破壞力 - 大酷樂

今天小編分享的汽車經驗：新V觀海外：Anthropic警示AI破壞力，歡迎閲讀。

陳沛 / 文在 OpenAI 積極轉型營利機構加速 AI 應用落地的同時，被視為 OpenAI 主要競争對手的 Anthropic 新發布了一篇 AI 破壞力的報告，繼續引領 AI 安全對齊研究的前沿風向。

Anthropic 提出未來 AI 四類安全風險

Anthropic 這篇名為《前沿模型破壞能力風險評估》報告提出，目前 AI 安全研究主要聚焦限制惡意用途，而随着未來 AI 能力将超過人類，也要提前研究 AI 主動破壞風險。

Anthropic 具體研究了四類風險：通過安全可靠的方式誤導人類決策、在系統中插入難以發現的錯誤代碼、接受安全測試時故意隐藏危險能力、破壞人類建立的 AI 安全風險監測系統。

Anthropic 也對這四種風險分别提出了評估場景、測試步驟、風險阈值、分析結果和發展展望，并對自家 Claude-3-Opus、Claude-3.5-Sonnet 模型做了評估。

評估結果是目前模型的破壞風險可控，但随着未來模型能力提升，提前研究更強力的應對措施完全是有必要的。

Anthropic 的安全理念正吸引更多 AI 人才

Anthropic 自 2021 年由 Dario Amodei、Daniela Amodei 等前 OpenAI 研究負責人創立。他們在 OpenAI 期間積累了豐富的深度學習、自然語言處理、AI 安全研究經驗，但在 AI 安全和可解釋性方面理念不同，因此離開 OpenAI 自立門户。

Anthropic 公司名字直接體現了以人為中心的理念，更強調構建可解釋、安全可靠的 AI 系統，增強人們對 AI 的信任。

特别是去年 OpenAI 宣布由前首席科學家 Ilya Sutskever 和團隊負責人 Jan Leike 牽頭超級對齊研究後，立刻吸引大量關注。不過後來發生宮鬥，OpenAI 超級對齊負責人 Jan Leike 宣布加入更重視安全的 Anthropic。近期選擇加入 Anthropic 的還有 OpenAI 聯合創始人 John Schulman 等。

這些高層加入讓 Anthropic 實力大增，也表明 Anthropic 的安全理念開始獲得回應，延續超級對齊研究。

對未來超級智能的安全風險尚未形成共識

雖然 Anthropic 對 AI 可解釋性的探索可能對 AI 發展產生深遠影響，但目前來看，如何看待 AI 風險還遠沒有形成共識。

例如圖靈獎得主、Meta 首席 AI 科學家 Yann LeCun 最近表示，對 AI 可能威脅人類生存的擔憂完全是胡説八道。

此外，長期以來 AI 從業者中也有一種觀點，認為 AI 公司過分強調技術危險性是為了凸顯技術能力，以便在融資時獲得更高估值。

這些觀點與 Anthropic 的安全對齊研究其實不矛盾。因為安全對齊是假設未來超級智能出現，以此預測未來的未知風險，并站在今天的角度從底層開始分析和提前預防，因此很難直接下定論。

至少 Anthropic 的安全研究對我們能起到警示作用。在這次發布報告的結尾，Anthropic 指出，在 AI 工具默認會幫助人類的情況下，人類用户很難對 AI 提供的建議產生合理懷疑。而這一點在接下來 AI 智能體應用開發過程中，如果不嚴加管理和高度對齊，必将會引發新的安全風險隐患。

熱門排行

王治郅：楊瀚森主要的問題是速度他的速度跟郟君昊 | 2025-05-05
貿易戰燒進電影院：特朗普拟重税打擊外國電影習又夏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年寸飛蘭 | 2025-05-05
手機電池突破8000mAh？硅碳技術的回旋镖：「折衛青柏 | 2025-05-05
貸款追高炒黃金的人後悔了！有人一天虧掉6年繁綺文 | 2025-05-05
任天堂對Genki提起Switch 2商标侵權訴訟，後郜萌運 | 2025-05-05
哪吒汽車APP和官網恢復正常知情人士：之前斷袁曼雁 | 2025-05-05
極越汽車 CEO 夏一平名下青島/義烏兩家公司集玲琳 | 2025-05-05
全國經濟第一大省明确，推動組建農商聯合銀行佼昌翰 | 2025-05-05
桑保利：亞馬爾有配合意識&有點像梅西姆巴佩甄正浩 | 2025-05-05
高露現身上海虹橋機場黑色外套點綴亮色愛惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：處理器更新為天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懶癌”發病率上升，定期體檢别忽視幸聽楓 | 2023-05-02
宋慧喬獲百想視後韓素希發圖手動加愛心表賁芳蕤 | 2023-05-02
曹操墓，裏面都有啥？衛青柏 | 2023-05-02
十年了，他們終于要HE！惠惠君 | 2023-05-07
中央部署經濟工作，釋放5大信号郜萌運 | 2023-05-02
高德上線手機彎道會車預警功能習又夏 | 2023-05-02
陳自瑤抱病為愛女做蛋糕慶生，王浩信點贊沒露賁芳蕤 | 2023-05-02
等比例長大的童星，李蘭迪算一個郟君昊 | 2023-05-02
《雲襄傳》終于抬上來啦，男O女A讓人好上頭！集玲琳 | 2023-05-02
高端國產車：軍車血統，目前電動車越野的“天花謝飛揚 | 2023-05-02
這些被抓來做實驗的流浪狗，最終拯救了無數糖集玲琳 | 2023-05-02
與周立波夫婦鬧糾紛成老賴，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
21家A股遊戲公司2022年收入651億今年“遊衛青柏 | 2023-05-04
普京籤署總統令，批準對俄刑法典相關法條的修集玲琳 | 2023-05-02
信用風險釋放趨緩，結構性風險需重點關注 — 袁曼雁 | 2023-05-02
中銀證券給予南京銀行增持評級袁曼雁 | 2023-05-03
3699起聯想小新mini主機上架 13代酷睿标壓習又夏 | 2023-05-05
解除資格！停止一切合作佼昌翰 | 2023-05-02
前董事長被免，天山生物全面進入“中植系”時惠惠君 | 2023-05-02
瘋成這樣，怎麼還能被全網吹捧？郜萌運 | 2023-05-02
狂吼11次“讓一下”！交警咆哮開道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收購美國第一共和銀行謝飛揚 | 2023-05-02
台劇赢麻了，又來一部8.9 衛青柏 | 2023-05-02
事關農村土地承包和農民權益，《農村土地承包郟君昊 | 2023-05-02
下降45分，上漲35分！34所自劃線院校復試分數線袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好這件事是關鍵習又夏 | 2023-05-05
五一檔沒一個能打的集玲琳 | 2023-05-05
恐怖韓劇下神壇，這次膽小可入袁曼雁 | 2023-05-05
這劇是不是用ChatGPT寫的呀？惠惠君 | 2023-05-02
200户連夜疏散，原因讓人憤怒！“損失超一億”，袁曼雁 | 2023-05-03
性騷擾慣犯，滾出娛樂圈謝飛揚 | 2023-05-05
48歲何炅自曝已老花眼，黃磊睡前認老，《向往的佼昌翰 | 2023-05-02
一個《長月燼明》倒了，《狐妖》《長相思》《惠惠君 | 2023-05-02
當年輕人開始不随份子錢袁曼雁 | 2023-05-02
張天愛假期曬“酷”存照卷發披肩穿黑色吊嬴覓晴 | 2023-05-02
畢滢用8年時間成功逼宮？曾被傳已婚生子的她，幸聽楓 | 2023-05-03
宋慧喬獲視後首次曬照，拿獎杯笑容温柔郜萌運 | 2023-05-02