MIT推出拾物机器人「最强辅助」，少量训练样本即可实现自然语言控制 - 大酷樂

今天小编分享的科学经验：MIT推出拾物机器人「最强辅助」，少量训练样本即可实现自然语言控制，欢迎阅读。

MIT 的这项新成果，让取物机器人变得更聪明了！

不仅能理解自然语言指令，还可以拾取没见过的物体。

麻麻再也不用担心我找不到东西了！

研究人员将 2D 特征嵌入了三维空间，构建出了用于控制机器人的特征场（F3RM）。

这样一来，在 2D 影像中构建的影像特征和语义数据，就能被三维的机器人理解并使用了。

不仅操作简单，训练过程中需要的样本量也很小。

低训练样本实现轻松取物

我们可以看到，在 F3RM 的帮助下，机器人可以娴熟地拾取目标物体。

哪怕要找出机器人没遇见过的物体，同样不是问题。

比如……大白（玩偶）。

对于场景中的同种物品，可以根据颜色等信息进行区别。

比如分别拾取同一场景中蓝色和红色两种不同的螺丝刀。

不仅如此，还可以要求机器人抓取物体的特定位置。

比如这个杯子，我们可以指定机器人抓住杯身或者杯把。

除了拾取问题，还可以让机器人把拾到的东西放到指定位置。

比如把杯子分别放到木制和透明的支架上。

团队提供了完整的，没有经过筛选的实验结果。他们在实验室周边随机选取了 out-of-distribution （训练集外）测试样本。

其中使用 CLIP ResNet 特征的特征场在三成以上的测试样本中（78%）成功抓取和放置。在基于开放性人工语言指令的任务上，成功率在 60%。该结果没有经过人工选择（cherry-picking），因此对特征场在零微调情境下的表现有客观的描述。

那么，如何利用 F3RM 帮助机器人工作呢？

将 2D 特征投射到三维空间

下面这张图大致描述了利用 F3RM 帮助机器人拾取物品工作流程。

F3RM 是一个特征场，要想让它发挥作用，首先要得到有关数据。

下图中的前两个环节就是在获取 F3RM 信息。

首先，机器人通过摄像头对场景进行扫描。

扫描过程会得到多个角度的 RGB 影像，同时得到影像特征。

利用 NeRF 技术，对这些影像做 2D 密度信息提取，并投射到三维空间。

影像和密度特征的提取使用了如下的算法：

这样就得到了这一场景的 3D 特征场，可供机器人使用。

得到特征场之后，机器人还需要知道对不同的物体需要如何操作才能拾取。

这一过程当中，机器人会学习相对应的六个自由度的手臂动作信息。

如果遇到陌生场景，则会计算与已知数据的相似度。

然后通过对动作进行优化，使相似度达到最大化，以实现未知环境的操作。

自然语言控制的过程与上一步骤十分相似。

首先会根据指令从 CLIP 数据集中找到特征信息，并在机器的知识库检索相似度最高的 DEMO。

然后同样是对预测的姿势进行优化，以达到最高的相似度。

优化完毕之后，执行相应的动作就可以把物体拾起来了。

经过这样的过程，就得到了低样本量的语言控制取物机器人。

团队简介

研究团队成员全部来自 MIT 的 CSAIL 实验室（计算机科学与人工智能实验室）。

该实验室是 MIT 最大的实验室，2003 年由 CS 和 AI 两个实验室合并而成。

共同一作是华裔博士生 William Shen，和华人博后杨歌，由 Phillip Isola 和 Leslie Kaelbling 监督指导。他们来自于 MIT CSAIL（计算机和人工智能实验室）和 IAIFI（人工智能和基础相互作用研究院）。其中杨歌是 2023 年 CSAIL 具身智能研讨会 ( Embodied Intelligence Seminar ) 的共同筹办人 .

左：William Shen，右：杨歌

论文地址：

https://arxiv.org/abs/2308.07931

项目主页：

https://f3rm.github.io

MIT 具身智能团队

https://ei.csail.mit.edu/people.html

具身智能研讨会

https://www.youtube.com/channel/UCnXGbvgu9071i3koFooncAw

熱門排行

气炸中甲青岛红狮球员倒地未判点，主帅场边怒惠惠君 | 2025-04-26
HKC推出“Q7S”27 英寸显示器：2K 300Hz，1599 袁曼雁 | 2025-04-26
44岁的孙俪，她的事业危机才刚刚开始謝飛揚 | 2025-04-26
车企热衷插混和增程混动将是新能源汽车的袁曼雁 | 2025-04-26
7轮不败！蓉城2-1亚泰居第二韦世豪赛季第3球衛青柏 | 2025-04-26
保时捷 911 Carrera 新内饰套装重迎 Pasha 衛青柏 | 2025-04-26
蛮好的人生：直到被再次举报，胡曼黎才知，监视自幸聽楓 | 2025-04-26
“组队发育”，安徽在打什么算盘？賁芳蕤 | 2025-04-26
中国成为全球人工智能专利最大拥有国，占比 6 集玲琳 | 2025-04-26
被特朗普“赏识”，准备角逐FED主席？前理事沃寸飛蘭 | 2025-04-26
高露现身上海虹桥机场黑色外套点缀亮色爱惠惠君 | 2023-05-02
《歧路旅人2》：向光而生衛青柏 | 2023-05-02
vivo X90S曝光：处理器更新为天玑9200+ 安卓最袁曼雁 | 2023-05-05
“懒癌”发病率上升，定期体检别忽视幸聽楓 | 2023-05-02
宋慧乔获百想视后韩素希发图手动加爱心表賁芳蕤 | 2023-05-02
十年了，他们终于要HE！惠惠君 | 2023-05-07
曹操墓，里面都有啥？衛青柏 | 2023-05-02
中央部署经济工作，释放5大信号郜萌運 | 2023-05-02
高德上线手机弯道会车预警功能習又夏 | 2023-05-02
陈自瑶抱病为爱女做蛋糕庆生，王浩信点赞没露賁芳蕤 | 2023-05-02
等比例长大的童星，李兰迪算一个郟君昊 | 2023-05-02
高端国产车：军车血统，目前电动车越野的“天花謝飛揚 | 2023-05-02
《云襄传》终于抬上来啦，男O女A让人好上头！集玲琳 | 2023-05-02
这些被抓来做实验的流浪狗，最终拯救了无数糖集玲琳 | 2023-05-02
信用风险释放趋缓，结构性风险需重点关注 — 袁曼雁 | 2023-05-02
21家A股游戏公司2022年收入651亿今年“游衛青柏 | 2023-05-04
与周立波夫妇闹纠纷成老赖，唐爽被司法拘留15 寸飛蘭 | 2023-05-05
普京签署总统令，批准对俄刑法典相关法条的修集玲琳 | 2023-05-02
中银证券给予南京银行增持评级袁曼雁 | 2023-05-03
解除资格！停止一切合作佼昌翰 | 2023-05-02
3699起联想小新mini主机上架 13代酷睿标压習又夏 | 2023-05-05
前董事长被免，天山生物全面进入“中植系”时惠惠君 | 2023-05-02
疯成这样，怎么还能被全网吹捧？郜萌運 | 2023-05-02
狂吼11次“让一下”！交警咆哮开道嘶吼到吐寸飛蘭 | 2023-05-03
摩根大通收购美国第一共和银行謝飛揚 | 2023-05-02
台剧赢麻了，又来一部8.9 衛青柏 | 2023-05-02
下降45分，上涨35分！34所自划线院校复试分数线袁曼雁 | 2023-05-07
事关农村土地承包和农民权益，《农村土地承包郟君昊 | 2023-05-02
"三高"已盯上青少年，做好这件事是关键習又夏 | 2023-05-05
五一档没一个能打的集玲琳 | 2023-05-05
恐怖韩剧下神坛，这次胆小可入袁曼雁 | 2023-05-05
这剧是不是用ChatGPT写的呀？惠惠君 | 2023-05-02
200户连夜疏散，原因让人愤怒！“损失超一亿”，袁曼雁 | 2023-05-03
性骚扰惯犯，滚出娱乐圈謝飛揚 | 2023-05-05
48岁何炅自曝已老花眼，黄磊睡前认老，《向往的佼昌翰 | 2023-05-02
一个《长月烬明》倒了，《狐妖》《长相思》《惠惠君 | 2023-05-02
张天爱假期晒“酷”存照卷发披肩穿黑色吊嬴覓晴 | 2023-05-02
当年轻人开始不随份子钱袁曼雁 | 2023-05-02
毕滢用8年时间成功逼宫？曾被传已婚生子的她，幸聽楓 | 2023-05-03
宋慧乔获视后首次晒照，拿奖杯笑容温柔郜萌運 | 2023-05-02