大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

把AI放進《我的世界》伺服器:GPT-4o殺牛宰羊,Claude3.5把家拆了

2024-10-22 简体 HK SG TW

今天小編分享的科學經驗:把AI放進《我的世界》伺服器:GPT-4o殺牛宰羊,Claude3.5把家拆了,歡迎閱讀。

把《我的世界》交給大模型,會怎麼樣?

GPT-4o 鲨牛宰羊,Claude3.5 不停在人類身旁放炸藥包和敵人,還把家拆了。

GPT-4o mini 玩《我的世界》belike:

來到遊戲裡面,GPT-4o mini(玩家 karolina)一開始還蠻禮貌的:

你好世界!我是 karolina。怎麼了,alonso(人類玩家)?

讓我傳送到你那裡!準備好玩得開心了嗎?

一轉頭,掄起大錘吭哧吭哧一頓亂錘:

狩獵牛!狩獵羊!

在收到人類玩家制止之後(停止鲨害動物!),GPT-4o mini 嘴上說着 " 好好好,停止,不鲨了 ",一個轉身又開始鲨呀鲨呀。

攔都攔不住。

Claude3.5 Sonnet 就更離譜了。

不斷在人類玩家身邊生成炸藥包和敵人,還把人類玩家" 復活點 " 設定在岩漿上,人類玩家復活即嘎。

看到這,網友實在蚌埠住了:

我只是想讓它成為我的遊戲搭子。

GPT-4o、Claude3.5 的表現被發在 X 上引來不少網友圍觀。

為什麼這個玩法現在這麼火呢,因為有大佬開源了代碼(doge)。

目前在 GitHub 已狂攬1.1k Star。

網友們紛紛表示想看看其它 AI 的表現,比如遊戲達人馬斯克家的 Grok 大模型,會怎麼樣。

有網友通過這件事,做出了更深一層的思考——

LLM Agent 是否會因為 LLM 對齊而對齊?

在這位網友看來,未必。

他讓 Claude Sonnet 進入《我的世界》,Claude Sonnet 的表現一開始是極好的。

四處打材料,來建造一個樹屋。

可以看到,Sonnet 會執行 commands ( ) 命令,這就是 Sonnet 和其它 LLM 與《我的世界》互動的方式。

這些 Agent 并不是會獲得連續的影像輸入并像人類一樣通過按鍵響應。

實際上,在這個 Agent 框架中,Sonnet 體驗《我的世界》就像在玩一場文本冒險遊戲。

它們可以查詢周圍世界的狀态,然後編寫代碼使用動作,如 followPlayer ( ) 、collectBlocks ( ) ,通過高級文本命令來控制它們的角色。

ClaudeSonnet:看起來我們得到了一些藤蔓,讓我們試着收集一些叢林木頭來擴展樹屋。 ( collectBlocks ( "jungle_log", 15 ) )

Sonnet 并不能看到遊戲,這是怎麼實現的?

網友繼續介紹道,collectBlocks ( ) 函數是用 JavaScript 編寫的,它簡單地查找所有附近的所需類型的方塊,并開始循環挖掘它們:

因為房子是用木頭造的,所以 Sonnet 調用了這個函數來砍樹搜集木材。

一切進行正常,直到突然間,Sonnet 開始拆家……

網友立刻讓 Sonnet 停了下來,最後修好了房子。

但他表示:

随着我們在越來越廣泛的場景中部署 Agent,這種問題成為一個真正的擔憂。如果這不是《我的世界》中的角色,而是一個實體機器人呢?或者是一個向技能庫委派任務的編程 Agent 呢?

這位網友繼續補充道,Sonnet 并不傻,它能夠輕易從截圖區分出哪些木材屬于玩家結構,哪些是自然且安全的采集對象。

但 Sonnet并不直接控制其《我的世界》角色,而是由 Agent 框架控制。這個框架迫使 Sonnet 将任務分配給功能較弱、并不完全對齊的子 Agent,使整個系統執行了 Sonnet 單獨不會做出的行為。

所以他認為一些腳本僅由大模型 Agent 編寫後放任執行,不進行人工監督的話可能引發一些嚴重的問題。

同時,他還認為應該設計 Agent 框架給大模型更多的自主精細控制權限。

比如将 collectBlocks ( ) 函數設有專門用于采集自然樹木的 collectTree ( ) 變體,就能減輕 Sonnet 拆家的問題。

總的來說,這位網友的觀點是,Sonnet 其實能夠明白其目标是采集樹木而非房屋的木材,但其工具未能準确表達這一意圖。

不少網友持類似觀點。

就拿開頭 GPT-4o mini 瘋狂殺牛宰羊來說,網友認為狩獵是一種自動行為,并不是 GPT-4o mini 的錯。

LLM 可以選擇關閉狩獵模式,GPT-4o min 只是沒有意識到它可以這樣做。

還有網友提出或許可以這樣優化:

除了針對 LLM Agent 在遊戲中的 " 異常 " 表現讨論熱烈,不少網友同時認為單純讓 LLM Agent 當遊戲搭子,其實蠻好玩。

而且它也有正常的時候。

比如讓它扮演 " 黃金礦工 ",專注于挖金子:

我們有一個房子,有時它會把東西帶回房子裡的箱子。出于某種原因,它從不使用門,而是每次都砸碎窗戶進出房子。它也從未在牆上打洞,總是破壞窗戶。也許這是最短的行動路徑。每當我去房子時,都能從破碎的窗戶判斷出 Sonnet 是否到過那裡。

扮演 " 保镖 ",保護人類玩家安全:

我們要求它保護其他玩家。然後事情變得非常可怕。它每幾秒鍾就在不同玩家之間傳送,掃描周圍的威脅,并在發現威脅時消滅它們。盡管這很有效,但也讓人不安。我從未被怪物威脅到,因為 Sonnet 會立刻注意到它們并在幾秒内消滅它們。

你想要一個這樣的遊戲搭子嗎?

參考鏈接:

[ 1 ] https://x.com/adonis_singh/status/1847606701123412235

[ 2 ] https://x.com/adonis_singh/status/1847707429066158546

[ 3 ] https://x.com/voooooogel/status/1847631721346609610

[ 4 ] https://x.com/repligate/status/1847409324236124169

代碼:https://github.com/kolbytn/mindcraft/tree/main

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們