今天小編分享的科技經驗:斯坦福大學、華盛頓大學研究:1000個AI智能體預測人類行為,準确率最高可達85%,歡迎閱讀。
IT 之家 11 月 25 日消息,據 The Decoder 今日報道,斯坦福大學、華盛頓大學和 Google DeepMind 的研究人員聯合開發了一種 AI 智能體(AI Agent,也稱 "AI 代理 "),能夠在社會實驗中逼真地模拟人類行為。
研究指出,這類模拟系統可以作為一個虛拟實驗室,幫助驗證經濟學、社會學、組織學和政治科學中的理論。研究團隊通過對 1000 多名具有代表性的美國人(覆蓋多種年齡、性别、教育背景和政治立場)進行訪談,建立了這些 AI 智能體模型。
系統運行方式是将詳細的訪談記錄與 GPT-4o 模型結合。當用戶向智能體提問時,系統會加載訪談記錄并讓 AI 模仿受訪者的回答。為生成這些記錄,研究團隊對每位受訪者進行了長達兩小時的訪談,并通過 OpenAI 的 Whisper 技術将對話轉錄成文本。
研究團隊設計了多個測試,評估 AI 對人類行為的預測能力,涵蓋《通用社會調查》、大五人格評估以及若幹行為經濟學實驗。
結果顯示,基于訪談數據的 AI 在預測社會調查(GSS)問題時,準确率高達 85%,遠超單純依賴人口統計信息的 AI 智能體。
研究團隊在五項社會科學實驗中測試了人類與 AI 的表現,其中四項研究顯示,AI 的結果與人類高度一致。相關系數高達 0.98,表明 AI 對人類行為有極強的模拟能力。
與傳統的人口統計法相比,訪談驅動的 AI 顯示出顯著的優勢,尤其是在處理不同種族群體和政治觀點的預測時更加準确,同時也能有效減少人口統計類别之間的偏差。
研究團隊已将包含 1000 個 AI 模型的數據集開放至 GitHub,并建立了兩層訪問機制。綜合性數據對研究人員完全開放,而個别參與者的詳細數據則需經過特殊審批。