今天小編分享的科技經驗:清華造了個遊戲公司,平均成本僅需0.3美元,歡迎閱讀。
清華用 ChatGPT 打造了個「零人工含量」的「遊戲公司」,從老板到員工都是 AI 的那種!
只要你提出想法,從設計到測試的完整流程,都由 AI 幫忙搞定。
整個過程走下來,只要七分鍾就能完成,成本不到 0.3 美元 ( 人民币兩塊多一點 ) !
這個「公司」被命名為「ChatDev」,顧名思義,就是通過聊天來進行開發。
在「公司」中,十多個聊天機器人分别扮演着不同的角色,串聯在一起完成開發工作。
整個過程用 ChatGPT 就能完成,無需為每個環節專門訓練相應的模型。
這個「公司」開發一款遊戲的平均時間是 409.84 秒,最快的甚至不到三分鍾,最慢的也不過 17 分鍾。
消耗方面,ChatDev 使用的是 ChatGPT 的 API(3.5-turbo ) ,平均每款遊戲使用約 48.5K 個 token。
根據這一數據計算,用它來開發遊戲,平均每款的成本僅需 0.2967 美元。
那麼,這家「公司」是如何運轉的呢?
讓 AI 分工合作
研究團隊為這個「公司」設計了一套由 ChatGPT 串聯起的「ChatChain」。
每個 bot 分别扮演 CEO、程式員、設計師等不同角色,涵蓋了遊戲研發涉及的所有崗位。
為了避免出現失誤或幻覺,研發過程中的每一個步驟都由兩個 bot 共同完成。
具體而言,ChatDev 在制作遊戲時一共需要經歷設計 - 編程 - 測試 - 文檔這四個大環節。
在設計環節開始之前,人類會提供一個初步的想法,這也是唯一需要人類的地方。
這個想法将由 bot 扮演的 CEO、CTO 和 CP ( roduct ) O 共同進行分析評估。
CEO 會分别與 CPO 和 CTO 進行讨論,決定遊戲的呈現形式 ( Web/ 桌面 / 移動端… ) 和使用的編程語言。
此外,設計環節中,每個 bot 具體扮演的角色,是由兩個 instructor(也是 bot)分配的。
為了提高設計工作的質量,團隊還引入了「記憶流」和「自我反思」兩種工作機制。
「記憶流」會保存每輪對話的記錄,供各個 bot 随時翻閱,确保思路的連貫性。
「自我反思」機制是在 bot 們完成了各自的工作但沒有達到要求時,生成一個「偽我」,将問題和有關對話向 instructor 進行反饋。
設計工作結束之後,就進入到了編程環節,包括代碼撰寫和圖形界面設計。
CTO 向程式員提出要求和大致思路,然後程式員編寫代碼。
設計師會生成 GUI 方案,并調用有關工具生成影像資源,由程式員進行集成。
編程過程同樣引入了提升質效的工作機制,具體而言包括「代碼管理」和「思維指導」。
代碼管理機制可以保存開發工程中的多個版本,以便出現問題時能夠進行回滾。
而思維指導機制的兩點則是讓 CTO 和程式員「互換角色」,相互了解彼此的想法,當出現問題時能更好解決。
程式編好之後,就要進行測試了。
測試環節分為對代碼的審查和實際運行兩步,涉及「代碼審查員」和「測試工程師」兩個角色。
測試過程同樣引入了「思維指導」機制,當測試反饋不明确時,程式員和測試工程師會進行角色互換。
測試完成之後,遊戲的本體就大功告成了,接下來要做的是撰寫文檔。
文檔主要包括環境說明和用戶手冊兩類。
前者說明了遊戲運行所需依賴的環境,由 CTO 指導程式員完成。
而後者則由是 CEO 決定包含的内容,交由 CPO 進行生成。
到此,一款遊戲的開發工作就全部結束了。
除了提供開始的想法,整個流程再沒有出現過人類的影子。
當然,這個流程中的對話、代碼等信息對人類都是可見的,确保了開發的靈活性。
如有需要,也可以進行人工幹預,比如替換掉生成的 GUI。
以上就是關于 ChatDev 工作過程的全部介紹。
團隊簡介
ChatDev 由清華大學 NLP 實驗室孫茂松教授指導打造,他的研究方向是研究方向為自然語言理解、中文信息處理等。
該實驗室的劉知遠副教授是論文的共同通訊作者,他的研究方向為知識圖譜與語義計算、 社會計算與計算社會科學。
論文第一作者是清華軟體學院畢業的錢忱博士,2016 年從北京理工大學保送清華直博,2021 年畢業後到騰訊公司擔任應用研究員。
One More Thing
ChatDev 利用 AI 扮演的角色,模拟了公司這一社會場景。
不僅是這個「AI 遊戲公司」,用 AI 模拟人類社會已經成為了一種研究趨勢。
比如我們此前曾經介紹過的「遊戲版西部世界」,就用 AI 操控 NPC,在遊戲中構建了一個社會。
還有團隊利用 AI 控制角色,在南方公園的背景之下做出了一集電視劇。
你認為 AI 還能模拟出什麼樣的環境呢?歡迎評論區交流。