今天小編分享的科技經驗:AI產生自我意識,“古墓麗影”勞拉覺醒,電子遊戲革命來了!,歡迎閲讀。
一位外國 up 主,用 ChatGPT 給 AI 智能體注入了自我意識。產生「生命」的勞拉覺醒了,開始自己在「古墓麗影」中闖關。
如果遊戲角色被注入生命,電子遊戲會發展成什麼樣?
曾經,這是不少人的暢想,而如今,随着 AI 智能體的發展,這種想象已經開始走入現實。
最近,一位 YouTube 作者 Foxmaster 制作了一個經典遊戲「古墓麗影」的原版視頻。
而其中的女主角勞拉,居然是一個能控制自己角色的 AI 智能體!
可以説,利用機器視覺、定位、物體識别、動畫、文本和語音等各種 AI 工具,Foxmaster 為遊戲角色注入了數字生命。
就在前幾天,爆火 AI 社區的斯坦福智能體小鎮正式開源。25 個各具個性的 AI 智能體,在「西部世界」一般的沙盒虛拟城鎮中生活、上班、交友。
所以,或許這就是電子遊戲的未來?
01 「古墓麗影」女主有了意識
構建可以玩遊戲的虛拟 AI,這個概念已經很常見。不過,Formaster 想做的,是讓這個角色如同真人一樣。
因此,他選擇了「古墓麗影」這款遊戲,遊戲主角勞拉是一個人物性格鮮明、定義明确的角色。
而 Formaste 希望,這種個性會對遊戲的最終結局產生影響。
如何讓這個 AI 智能體 Lara Croft 在遊戲中真正產生自我意識?
Formaster 經過以下幾個步驟的探索,終于成功了。
學習遊戲規則
首先第一步,叫她學會遊戲規則。「古墓麗影」已經給出了教程,解釋了所有的遊戲控制過程。
作者讓 Lara 按照給出的方式去練習,像人類玩家一樣完成各個階段的教程。
教程在 Lara 離開泳池時結束,所以可以在那時重啓程式,做出改進。
開始時,改進 Lara 非常困難。
她有時會出現混亂,在地圖中随意走動,甚至有時候會卡在菜單欄中,一遍遍盯着她的指南針。
為了解決這個問題, 作者在一台虛拟機上,重新調整了主時鍾,将遊戲進程加速了 40 倍。這個辦法起作用力,AI 智能體終于在相對不錯的時間内,完成了教程。
然而,還存在一個問題:Lara 經常卡在一個位置,而且每個關卡都是由靜态元素組成,因此只有一條優化路徑。
這會導致她只知道不走哪些路徑,而不是想出更全面的方法來解題。但作者希望的是,Lara 學會自己去發掘探險過程。
考慮到 Lara 唯一掌握的知識,僅僅是每道關卡顯示的螢幕上的内容,作者觀察了從未玩過遊戲的人類玩家的行為。
有的人會看完整個教程,有的人先會探索周圍的環境,而這些選擇的差異,就是由不同人的「個性」決定的。
而 Lara 需要學習的,恰恰就是這種态度。
識别角色
為了給 AI 建立與 Lara 的聯系,就需要讓 AI 明白,她是一堆像素。人類玩家進入遊戲後,一下子有了這樣的意識。
對此,作者從各個角度,錄制了 24 個小時,Lara 朝着不同方向活動的視頻,以便 AI 智能體能夠識别任何給定角色。
就像自動駕駛汽車一樣,能夠以每秒 30 幀速度拍攝 24 小時視頻,得到 2592000 張參考影像,以識别道路标志。
首先,作者跟蹤頭部主要像素,然後是身體主要像素,來選擇相關區網域。
為了确保 Lara 出現在每張影像中,作者要求程式去識别那些不包含任何突出顯示的圖片。
當 Lara 占據整個螢幕時,或當一個二維物體擋在她面前,作者使用 AI 視覺捕獲來幫助識别 Lara,結果非常準确,足以識别螢幕上的角色。
環境互動
能夠識别 Lara 後,需要讓 AI 與環境互動。
整個遊戲環境都是由同樣的區塊組成,作者将其導入到立方體上,然後從各個角度捕獲環境,再運行識别過程,這樣 AI 智能體就能識别出環境,就像人類玩家解釋影像的過程。
紅色突出顯示的區網域是,未能識别的紋理。但是,AI 仍舊缺乏想去某個地方的意識,還需要知道自己距離周圍環境的距離。
有趣的是,這些未能識别的區網域,通常是遠離 Lara 的位置,或被其他 2D 物體遮擋的位置。
當我們觀察人類玩家的行為,看到這張影像後,我們能夠立即明白,箭頭所指向區網域是一個入口。
我們可能不知道下一個房間的大小,但我們知道這是存在的。
但是,這也可能是一種視覺錯覺。當我們去移動,入口區網域的紋理與其他地方不同,這是 3D 空間的特征。
因此,AI 智能體還得學會移動,并進行比較。從計算角度來看,可以使用多個影像來确定哪些紋理尺寸的變化最小。
這裏可以使用主多邊形的面積來算,它們的變化主要基于彼此之間距離成比例的概率。
想象
現在,AI 已經知道自己身在何處了,她必須做出決定,自己下一步要去哪裏。
通過識别紋理,可以讓她到達特定的位置,然而在關卡中導航,需要更簡單的東西。
最快的方法,就是簡化對比度,識别區網域中光線的突然變化。但是,人類玩家不一定會去這些地方。
當有多個開口時,AI 必須表現出足夠興趣,但不能導致她死亡。
比如,如果一個洞太深,就無法在不抓住周圍壁架的情況下跳下去。假如下面有水存在,倒是有可能值得這種冒險。
人類玩家知道什麼時候可以跳,但 Lara 的行動方針都是來源于教程,它必須準确估計自己和目标之間有多少個方塊,是否應該聚集自己的動量,以及在放手之前是否應該暫停一下。
總之,她必須像人類玩家一樣,做出準确評估。
如果她提前知道一個洞的大小,就會跑得非常快,這就并不符合我們的期望。
為了讓她多收集環境信息,作者鼓勵 AI,如果有疑惑,就應該旋轉相機,收集更多的信息。
但真實情況下,即便如此,AI 也可能卡在房間裏。
為了鼓勵她走出房間,作者補充了一些收集規則。
比如,每次遇到在該區網域成為優先級前從未見過的紋理時,她都必須以增加螢幕上這種紋理大小的方式來移動。
這樣,她就只能在關卡中前進。因為每個關卡中都有獨特的紋理,解鎖的唯一方式,就是進入下一個關卡。
總之,Lara 會不斷分析自己在螢幕上看到的内容——不同表面的紋理,她會移動自己的身體,定義新的興趣點(即目錄中尚未存在的紋理)。
在這個過程中,她會不斷驗證,去尋找丢失的紋理。
運動
然而,即使經過了上述改進,這個 AI 還是太像個機器人了,行動模式是顯而易見的。
為了改進它,作者再次觀察了人類玩家。
是什麼決定了人類玩家在遊戲中如何行動?就是我們的記憶,我們會記住動作是如何組合的。
因此,這個過程也需要植入到 AI 中,因為 Lara 必須意識到她自己的運動能力。
為此,作者把 AI 每一秒的動作都保存起來,來訓練它,然後添加一條規則,允許它同時執行這些保存的動作。
這樣,AI 的動作就變得平滑多了。
另外,因為每個動作的冷卻時間是已知的,就可以防止 AI 在執行不必要的動作時,仍然處于活動狀态。
在下圖中,火焰重新激活的速度如此之快,需要完成很大的跳躍才能穿過。
幸運的是,這些通道在視覺上被簡化了,很容易識别塊的邊緣。
AI 知道,Lara 總是會在方塊的第一部分激活時完成正确的跳躍,就像人類玩家理解的一樣。
02 ChatGPT 注入人格
接下來,就需要将 Lara 的個性灌輸給 AI 智能體。個性取決于經驗和記憶,這些因素的結合決定了 Lara 角色。
根據遊戲設定,她是一個著名的考古學家,從不畏懼冒險,願意接受分配的山區任務,甚至不要獎賞,完全出于熱愛。
另外,Lara 還特别有錢,剛剛搬進一座豪宅,屋内裝飾非常優雅,屋子裏還有一個訓練室。她還特别擅長教學,遊泳,攀爬,耐力非常強。
當冒險途中遇到危險,她能夠保持鎮靜,而且非常勇敢,會毫不猶豫幫助同伴。
面對狼群包圍,她用槍準确地射殺,還能用匕首殺死兇險的狼。她唯一拒絕的是,主動強行開鎖。
以上的一切,都是從遊戲設定中,了解到的 Lara 個性。
接下來,就是以真實的方式去評論她所看到的一切,對此,作者在數據庫中已經編譯 Lara 的性格特征。
為了使評論對實際情況有意義,程式需要将遊戲影像與現實生活中可識别的東西相關聯。
對于紋理細節通常較少的影像,可以通過谷歌逆向影像搜索進行匹配。
因此,當 AI 智能體檢測到足夠大的紋理,它就會啓動搜素。
為了識别單詞,作者将整個頁面復制到 ChatGPT。然後要求 ChatGPT 根據出現的次數對其進行分類,再将識别出的單詞添加到列表中。
最後要求 ChatGPT 根據這些單詞創建一個句子,并且要考慮到 Lara 個性。
這樣做,就是要 ChatGPT 去真是地評論,Lara 在現實生活中看到的東西。
比如,如果紋理被識别為海獅,ChatGPT 能夠将海獅與 Lara 個性特征聯系起來做出評論。
總得來説,Lara 智能體的人格是通過 ChatGPT 使用「勇敢」、「友好」或「聰明」等各種屬性設定。
Lara 在遊戲中,感知和評論的所有物體都會通過這個人格過濾器,并由 Lara 根據既定的性格反應出來。
就比如,如上的海豹,Lara 會提及海獅化石,或者出色的遊泳能力,并不會對其在馬戲團發表言論。
03 網友:AI 智能體讓電子遊戲變成了藝術品
有網友表示,這是讓角色自我發展最酷、最自然的感覺方式之一。當角色能夠活靈活現,你才可以真正體驗到電子遊戲是一件藝術品。
「她説話和分析周圍環境的方式非常可愛。讓 AI 機器人有能力評論周圍環境,無論它的實際水平如何,都會讓人覺得她是個活生生的人。」
「這太迷人了。她那超然的好奇心和一絲異想天開的想法,與我想象中的 Lara 的内心獨白驚人地相似。」
有人説,讓我感到驚奇的是,她的對話與她的行為相吻合。
這讓人覺得,寫對話的人工智能和控制角色的人工智能是同一個人。
前不久在斯坦福 AI 智能體小鎮開源時,網友們就十分激動,覺得 AGI 已來,各種 RPG 和模拟類遊戲都會很快用上這種技術。
而現在,Foxmaster 将 ChatGPT、計算機視覺和物體識别的結合,讓電子遊戲變得更有趣了。
或許在未來,電子遊戲角色可以被賦予更深、更靈活的個性,對環境做出更快的反應,以及許多我們無法想象的變化。