大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

讓機器人更像人類有了新方法!港科大新算法對齊人機動作形态,無需重復訓練,輕量模塊通用且适配

2025-04-12 简体 HK SG TW

今天小編分享的科學經驗:讓機器人更像人類有了新方法!港科大新算法對齊人機動作形态,無需重復訓練,輕量模塊通用且适配,歡迎閱讀。

" 讓機器人看懂世界、聽懂指令、動手幹活 " 正從科幻走向現實。

基于大規模人類視頻數據進行視覺預訓練,是開發真實場景可泛化機器人操作算法的有效途徑。

核心在于人類操作與機器人動作序列高度相似,因此從人類視頻習得的動态表征可遷移至機器人任務;然而 " 從人到機器人 " 的遷移面臨關鍵阻礙,即人 - 機器人數據網域間差異(Human-Robot Domain Discrepancy)。盡管二者執行任務時動作看似相似,但其形态存在根本差異。

這種差異導致了一個重要問題:即便在海量人類數據上預訓練了模型,這些模型一旦直接用于機器人任務時,其表現卻往往大打折扣,甚至失敗。

來自香港科技大學(廣州)的團隊提出了一個核心問題:

如何減少人 - 機器人之間的數據網域差異影響,使得從人類預訓練中獲得的視覺模型,能夠更有效地幫助機器人完成實際任務?

在這一問題之下,他們提出人類視頻預訓練遷移新範式,利用匹配的人類 - 機器人操作視頻,設計語義對齊方法彌合了這種跨網域鴻溝。

其中第一作者周佳明,香港科技大學廣州二年級博士生,研究方向為人類視頻動作模仿以及可泛化的機器人操作;通訊作者是梁俊衛,是香港科技大學廣州助理教授。

傳統做法(如圖左)直接用在 Ego4D 等人類數據集上訓練的模型去處理機器人任務,這種直接遷移的方法自然會受到人類 - 機器人數據網域差異的幹擾。

本研究提出的新範式(如圖右)通過利用語義對齊的人類 - 機器人視頻對,在現有的人類視頻預訓練模型中插入 Adapter 微調模塊,通過對比損失将機器人數據上調整的模型的語義和預訓練模型中良好建模的人類動态語義進行對齊,從而減少網域差異的幹擾。

HR-Align 跨越人機語義鴻溝的橋梁

根據提出的預訓練适配新範式,該工作設計了 HR-Align(Human-Robot Semantic Alignment)方法。其核心思想非常簡潔:

如果能夠獲取 " 同一個任務 " 的人類操作視頻和機器人操作視頻,并用它們之間的對應關系來引導模型微調,那就有可能建立起一個人 - 機器人之間的語義對齊機制。

1. 從 " 獨立預訓練 " 到 " 配對視頻語義對齊 "

傳統的視覺預訓練方法是在純人類視頻上進行訓練,然後将模型 " 凍結 ",直接應用于機器人任務。這種方式忽略了人和機器人領網域間的差異。HR-Align 打破了這種 " 直接遷移 " 的壁壘,主張在預訓練和下遊任務之間,引入一個 " 适配階段 "。

在這個階段中,研究者使用了一個具有語義配對的人機數據集,這個數據集中每一個人類動作視頻,都有一個對應的機器人操作視頻。這種人 - 機器人視頻對提供了一個天然的 " 語義橋梁 "。

2. 引入對比學習機制,實現語義對齊

HR-Align 适配的關鍵是人 - 機器人對比對齊損失。在适配過程中,對于已有的人類視頻預訓練視覺編碼器,HR-Align 分别從人類視頻和機器人視頻中提取凍結的語義特征。同時,使用另一分支在編碼器中引入輕量級 Adapter 模塊在機器人視頻上微調,從而提取機器人視頻的适配特征。模型适配的核心約束是,相比機器人視頻的凍結特征,機器人視頻的适配特征與匹配的人類視頻特征應當具有更加相似的語義;

3. 輕量高效,适配通用

與其他需要大規模重新訓練、或者為每種機器人環境單獨調整模型的方案不同,HR-Align 具備如下優勢:

參數高效:僅适配小模塊,主模型無需大規模更新;

通用性強:同一個适配模型可泛化至多個任務和環境,無需逐一定制;

數據易得:越來越多的平台提供人 - 機器人視頻對,為方法的可落地提供保障。

實驗結果

在 RLBench 的 18 個仿真任務下,通過 HR-Align 方法适配的 D4R-Align 模型相比原來的 D4R 預訓練模型,平均成功率提升了 4.6%;而通過 HR-Align 方法适配的 R3M-Align 模型相比未調整的 R3M 模型,平均成功率提升了 8.9%;

在五個真實場景的機器人任務上,D4R-Align 和 R3M-Align 模型相比未适配的預訓練模型,平均成功率分别提升 13% 和 11%;

這些顯著的提升不僅驗證了方法的有效性,也表明該适配策略具有極高的實際應用價值。

核心貢獻總結

提出新問題:從大規模人類視頻預訓練中學習可泛化機器人操作,人體 - 機器人數據的網域差異問題不可忽視。

提出新範式:通過匹配的人 - 機器人動作視頻,實現人類動作與機器人操作的語義對齊,不再盲目依賴預訓練模型的泛化能力。

高效适配方法:引入輕量級 Adapter 模塊,僅需極少參數微調,即可将模型适配到機器人任務中。

充分實驗驗證:在 20 個仿真任務與 5 個真實機器人任務中均取得超過 7% 平均成功率提升,适配模型顯著優于未适配版本。

論文鏈接:  https://arxiv.org/pdf/2406.14235

項目主頁:  https://jiaming-zhou.github.io/projects/HumanRobotAlign/

開源倉庫:  https://github.com/jiaming-zhou/HumanRobotAlign

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法!

—  完  —

學術投稿請于工作日發郵件到:

[email protected]

标題注明【投稿】,告訴我們:

你是誰,從哪來,投稿内容‍

附上論文 / 項目主頁鏈接,以及聯系方式哦

我們會(盡量)及時回復你

點亮星标

科技前沿進展每日見

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們