大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

让机器人更像人类有了新方法!港科大新算法对齐人机动作形态,无需重复训练,轻量模块通用且适配

2025-04-12 简体 HK SG TW

今天小编分享的科学经验:让机器人更像人类有了新方法!港科大新算法对齐人机动作形态,无需重复训练,轻量模块通用且适配,欢迎阅读。

" 让机器人看懂世界、听懂指令、动手干活 " 正从科幻走向现实。

基于大规模人类视频数据进行视觉预训练,是开发真实场景可泛化机器人操作算法的有效途径。

核心在于人类操作与机器人动作序列高度相似,因此从人类视频习得的动态表征可迁移至机器人任务;然而 " 从人到机器人 " 的迁移面临关键阻碍,即人 - 机器人数据網域间差异(Human-Robot Domain Discrepancy)。尽管二者执行任务时动作看似相似,但其形态存在根本差异。

这种差异导致了一个重要问题:即便在海量人类数据上预训练了模型,这些模型一旦直接用于机器人任务时,其表现却往往大打折扣,甚至失败。

来自香港科技大学(广州)的团队提出了一个核心问题:

如何减少人 - 机器人之间的数据網域差异影响,使得从人类预训练中获得的视觉模型,能够更有效地帮助机器人完成实际任务?

在这一问题之下,他们提出人类视频预训练迁移新范式,利用匹配的人类 - 机器人操作视频,设计语义对齐方法弥合了这种跨網域鸿沟。

其中第一作者周佳明,香港科技大学广州二年级博士生,研究方向为人类视频动作模仿以及可泛化的机器人操作;通讯作者是梁俊卫,是香港科技大学广州助理教授。

传统做法(如图左)直接用在 Ego4D 等人类数据集上训练的模型去处理机器人任务,这种直接迁移的方法自然会受到人类 - 机器人数据網域差异的干扰。

本研究提出的新范式(如图右)通过利用语义对齐的人类 - 机器人视频对,在现有的人类视频预训练模型中插入 Adapter 微调模块,通过对比损失将机器人数据上调整的模型的语义和预训练模型中良好建模的人类动态语义进行对齐,从而减少網域差异的干扰。

HR-Align 跨越人机语义鸿沟的桥梁

根据提出的预训练适配新范式,该工作设计了 HR-Align(Human-Robot Semantic Alignment)方法。其核心思想非常简洁:

如果能够获取 " 同一个任务 " 的人类操作视频和机器人操作视频,并用它们之间的对应关系来引导模型微调,那就有可能建立起一个人 - 机器人之间的语义对齐机制。

1. 从 " 独立预训练 " 到 " 配对视频语义对齐 "

传统的视觉预训练方法是在纯人类视频上进行训练,然后将模型 " 冻结 ",直接应用于机器人任务。这种方式忽略了人和机器人领網域间的差异。HR-Align 打破了这种 " 直接迁移 " 的壁垒,主张在预训练和下游任务之间,引入一个 " 适配阶段 "。

在这个阶段中,研究者使用了一个具有语义配对的人机数据集,这个数据集中每一个人类动作视频,都有一个对应的机器人操作视频。这种人 - 机器人视频对提供了一个天然的 " 语义桥梁 "。

2. 引入对比学习机制,实现语义对齐

HR-Align 适配的关键是人 - 机器人对比对齐损失。在适配过程中,对于已有的人类视频预训练视觉编码器,HR-Align 分别从人类视频和机器人视频中提取冻结的语义特征。同时,使用另一分支在编码器中引入轻量级 Adapter 模块在机器人视频上微调,从而提取机器人视频的适配特征。模型适配的核心约束是,相比机器人视频的冻结特征,机器人视频的适配特征与匹配的人类视频特征应当具有更加相似的语义;

3. 轻量高效,适配通用

与其他需要大规模重新训练、或者为每种机器人环境单独调整模型的方案不同,HR-Align 具备如下优势:

参数高效:仅适配小模块,主模型无需大规模更新;

通用性强:同一个适配模型可泛化至多个任务和环境,无需逐一定制;

数据易得:越来越多的平台提供人 - 机器人视频对,为方法的可落地提供保障。

实验结果

在 RLBench 的 18 个仿真任务下,通过 HR-Align 方法适配的 D4R-Align 模型相比原来的 D4R 预训练模型,平均成功率提升了 4.6%;而通过 HR-Align 方法适配的 R3M-Align 模型相比未调整的 R3M 模型,平均成功率提升了 8.9%;

在五个真实场景的机器人任务上,D4R-Align 和 R3M-Align 模型相比未适配的预训练模型,平均成功率分别提升 13% 和 11%;

这些显著的提升不仅验证了方法的有效性,也表明该适配策略具有极高的实际应用价值。

核心贡献总结

提出新问题:从大规模人类视频预训练中学习可泛化机器人操作,人体 - 机器人数据的網域差异问题不可忽视。

提出新范式:通过匹配的人 - 机器人动作视频,实现人类动作与机器人操作的语义对齐,不再盲目依赖预训练模型的泛化能力。

高效适配方法:引入轻量级 Adapter 模块,仅需极少参数微调,即可将模型适配到机器人任务中。

充分实验验证:在 20 个仿真任务与 5 个真实机器人任务中均取得超过 7% 平均成功率提升,适配模型显著优于未适配版本。

论文链接:  https://arxiv.org/pdf/2406.14235

项目主页:  https://jiaming-zhou.github.io/projects/HumanRobotAlign/

开源仓库:  https://github.com/jiaming-zhou/HumanRobotAlign

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

—  完  —

学术投稿请于工作日发邮件到:

[email protected]

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容‍

附上论文 / 项目主页链接,以及联系方式哦

我们会(尽量)及时回复你

点亮星标

科技前沿进展每日见

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們