今天小編分享的遊戲經驗:不用喂數據,AI也能玩懂《逆轉裁判》了,歡迎閱讀。
這些年來,AI 打遊戲的出色表現已經讓人見怪不怪了。
2018 年《星際争霸》舉辦了 AI 挑戰賽,參賽隊伍八仙過海、各顯神通;2019 年,《王者榮耀》的絕悟在世界冠軍杯表演賽中打赢了五個現役職業選手;2022 年,《暗區突圍》推出了号稱全球首個能用語音指揮的 AI 隊友 F.A.C.U.L.,直接拉滿了競技類遊戲的最高配置。
不搶資源、配合指揮,而且會講冷笑話,簡直情緒價值拉滿
不過,這些 AI 玩家都屬于 " 單遊戲智能體 ",專門針對單一遊戲訓練,且需要海量數據支持。
說人話就是,這些 AI 必須提前學習識别場景中的建築、物體、裝飾、可互動物件,對局中的微操和戰術配合,也只能靠人工标記和強化訓練,投入遊戲中使用還會耗費大量算力。
即便是谷歌 2022 年推出的多遊戲智能體 Transformer,能玩 41 款雅達利遊戲,但也依賴于大量預先學習的數據。
說白了,它們都必須模仿人類,需要靠 " 看攻略 " 來維持智商。
但最近,加州大學聖地亞哥分校的 Hao AI 實驗室進行了一項特别的 AI 推理能力測試,他們選取了四個不同的 AI 模型,在沒有任預先前訓練的情況下,直接讓它們玩《逆轉裁判》——四位 " 參賽選手 " 分别是 Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverick 以及 OpenAI o1。
換句話說,整個過程需要 AI 自主理解遊戲畫面、劇情與機制,并推動遊戲進程——幾乎和第一次接觸這款遊戲的新玩家沒什麼區别。
而最終的結果也令人意外:Llama-4 Maverick 在遊戲一開始就早早出局,Gemini 2.5 Pro 和 Claude 3.7 Sonnet 進入了第二章《逆轉姐妹》,而 OpenAI o1 則是一口氣打到了第二集結尾,雖然沒有完全通關,但表現令人稱道。
四個模型同台競技最終成績
為什麼選擇《逆轉裁判》來考驗 AI?
根據 Hao AI 實驗室的解釋,主要目的有三個:一是為了考驗 AI 的長語境推理能力,《逆轉裁判》需要 AI 交叉引用先前的對話和證據,發現其中的矛盾;二是考驗視覺理解能力,觀察 AI 能否辨認出、反駁虛假陳述的影像;三是考驗動态決策能力,何時施壓、出示證據或隐瞞,AI 需要在有限的試錯次數内做出正确的選擇。
而最終,AI 也的确僅依靠自身的推理能力,就能夠表現出了接近人類的理解和處理問題能力。
AI 能理解證詞中的漏洞,自主決定打開菜單、出示證物
在打遊戲這件事上,AI 顯然變得越來越聰明了。
五個月前,在《精靈寶可夢 紅 / 綠》的測試中,Claude 3.0 Sonnet 還沒法走出真新鎮,如今迭代過的 Claude 3.7 Sonnet,已經能在遊戲中完成超過 30000 次互動,并自主擊敗三位道館館長。可以想見,OpenAI 通關《逆轉裁判》大概也只是時間問題。
Claude 3.7 Sonnet 玩《精靈寶可夢 紅 / 綠》的數據
X 軸為互動次數,y 軸為進度成就,包括收集道具、抵達區網域或擊敗 BOSS
武能架槍丢手雷,文能拍桌喊異議,随着 AI 特定遊戲走向跨遊戲泛用,或許在不久的未來,我們真能擁有一個全能的 AI 隊友,既能在 FPS 裡 " 指哪打哪 ",又能一起在 RPG 裡推理解謎,不拖後腿、不吵架、不掉線,最重要的是——永遠不會放你鴿子。
>