清华商汤最新AI，征服了《我的世界》 - 大酷樂

今天小编分享的科学经验：清华商汤最新AI，征服了《我的世界》，欢迎阅读。

继 GPT-4 惊艳《我的世界》后，国产 AI 智能体也来了——

像人一样生存、探索和创作，并且通关了整个游戏！

从生存模式白手起家，不仅可以拿到主世界的所有物品、挖钻石，还能制作附魔书！

面对各类地形、环境、白天黑夜场景都能 hold 住，甚至遇到怪物也能自如应对。

不卖关子，全都是这个小东西干的，它的名字叫 Ghost in the Minecraft（GITM）。

由商汤科技联合清华大学、上海人工智能实验室等机构研究者们共同开发。

和以往的智能体相比，GITM 的特点可以用两个字来形容：更强。

能完成更多的任务：

在主世界的所有技术挑战上实现了 100% 的任务覆盖率。

更高的任务成功率：

在 " 获取钻石 " 任务上，也可以达到 67.5% 的高成功率。

看到这，你肯定会问：这么强，训练要花很长时间吧？

漏！单一 CPU 节点只需要训练两天！

打破 AI 发展限制

在 AI 发展进程中有一个非常有趣却有违常识的现象：

一些对人类而言相对困难的任务，例如下棋，对 AI 来说却相对容易实现；而在开放世界中与环境互動、进行规划和决策等对人类来说较简单的事，AI 却面临巨大挑战。

这就是莫拉维克悖论。

不过，这个通才 AI 智能体 GITM，据说已经成功打破了这一悖论限制：

它可以在复杂且类似于现实世界的环境中取得突破，能够像人类一样生存，探索和创造。

先来看一下它的具体表现怎么样：

在《我的世界》中，GITM 在主世界的所有技术挑战上实现了 100% 的任务覆盖率，也就是成功解锁了完整的科技树的 262 个物品。

而此前所有智能体的总和只能覆盖 30%。（以往所有智能体方法包括 OpenAI 和 DeepMind 在内总共只解锁了 78 个）

△红色代表其它代理也解锁了的物品，绿色代表只有 GITM 解锁的物品

在最受关注的 " 获取钻石 " 任务上，GITM 取得了 67.5% 的成功率，相比于目前最佳成绩（OpenAI VPT）提高了 47.5%。

然鹅，重点来了。

在训练效率上，GITM 也达到了新高度。环境互動步数只需已有方法的万分之一，单一 CPU 节点训练两天即可完成。

远远低于之前 OpenAI VPT 所需的 6480 个 GPU 天或 DeepMind DreamerV3 所需的 17 个 GPU 天。

不仅如此，GITM 还可以进一步应用在《我的世界》更加复杂的任务中，比如生存所需的避难所、农田、铁傀儡，创造自动化设备所需的红石电路、进入下界所需的下界传送门等。

GITM 强大的能力和可扩展性的背后是大语言模型（LLM）的加持。

GITM 的心脏：大语言模型

之前基于强化学习的代理程式所面临的最大困境在于：

如何将一个极长时網域和复杂目标映射成一系列键盘、滑鼠操作。

为了解决这个问题，GITM 的开发者采用了基于大语言模型（LLM）的代理程式。

与强化学习代理程式直接映射不同，他们基于 LLM 的代理程式采用了一种分层的方法：

首先将分解目标拆分为子目标，然后进一步拆分为结构化的操作，最后再拆分为键盘、滑鼠操作。

具体来说，基于 LLM 的代理程式包括 LLM 分解器、LLM 规划器和 LLM 界面，它们分别负责对子目标、结构化操作和键盘 / 滑鼠操作进行分解：

1）LLM 分解器首先根据从互联网收集到的基于文本的知识，将目标分解为一系列明确定义的子目标。

2）然后，LLM 规划器为每个子目标规划一系列结构化操作。LLM 规划器还会将成功的动作列表，记录并总结到基于文本的记忆中，来增强规划能力。

3）LLM 界面通过处理原始的键盘 / 滑鼠输入和接收原始的观察结果，执行结构化操作与环境进行互動。

此前，商汤基于监督学习和强化学习就炼成了可以在《星际争霸 2》中，对挑顶级水平玩家的 DI-star。

而训练一个 DI-star，就用了"16 万场录像 "和"1 亿局对战 "。

而这次，有了大语言模型的加持，事情又变得有意思了捏。

项目地址：https://github.com/OpenGVLab/GITM

熱門排行

王治郅：杨瀚森主要的问题是速度他的速度跟郟君昊 | 2025-05-05
贸易战烧进电影院：特朗普拟重税打击外国电影習又夏 | 2025-05-05
贷款追高炒黄金的人后悔了！有人一天亏掉6年寸飛蘭 | 2025-05-05
手机电池突破8000mAh？硅碳技术的回旋镖：「折衛青柏 | 2025-05-05
贷款追高炒黄金的人后悔了！有人一天亏掉6年繁綺文 | 2025-05-05
任天堂对Genki提起Switch 2商标侵权诉讼，后郜萌運 | 2025-05-05
哪吒汽车APP和官网恢复正常知情人士：之前断袁曼雁 | 2025-05-05
极越汽车 CEO 夏一平名下青岛/义乌两家公司集玲琳 | 2025-05-05
全国经济第一大省明确，推动组建农商联合银行佼昌翰 | 2025-05-05
桑保利：亚马尔有配合意识&有点像梅西姆巴佩甄正浩 | 2025-05-05
高露现身上海虹桥机场黑色外套点缀亮色爱惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
曹操墓，里面都有啥？衛青柏 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表賁芳蕤 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露賁芳蕤 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花謝飛揚 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖集玲琳 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游衛青柏 | 2023-05-04
信用风险释放趋缓，结构性风险需重点关注 — 袁曼雁 | 2023-05-02
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
普京签署总统令，批准对俄刑法典相关法条的修集玲琳 | 2023-05-02
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
解除资格！停止一切合作佼昌翰 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压習又夏 | 2023-05-05
前董事长被免，天山生物全面进入“中植系”时惠惠君 | 2023-05-02
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
事关农村土地承包和农民权益，《农村土地承包郟君昊 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线袁曼雁 | 2023-05-07
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
200户连夜疏散，原因让人愤怒！“损失超一亿”，袁曼雁 | 2023-05-03
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《惠惠君 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊嬴覓晴 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02