今天小編分享的互聯網經驗:成本3萬美金的機器人能自己炒菜做家務了!斯坦福華人團隊項目引全網熱議,歡迎閱讀。
機器管家通常我們只能在遊戲和電影中見到,但來自斯坦福大學的一支團隊向我們介紹了 Mobile ALOHA 系統,這讓機器人管家和我們平常百姓的距離越來越近。
Mobile ALOHA 并不是一個機器人,而是一個作業系統。借助這個系統,機器人可以輕松完成各種驚喜工作,比如煎蘑菇:
不僅僅是簡單的 " 白人飯 ",即使是復雜的 " 幹貝燒雞 "" 蚝油生菜 " 這樣復雜的中餐,機器人也可以輕松地自己完成。比如打雞蛋 ;
蝦仁焯水:
炒菜:
甚至它還可以完成更多高難度的菜式,大家可以通過視頻一探究竟。
在 Mobile ALOHA 的加持下,機器人還可以完成各種復雜的工作,比如洗碗:
把椅子歸位:
擦桌子:
把鍋放進儲物櫃:
坐電梯:
還能和人擊掌:
此外,人們還可以利用 Mobile ALOHA 遙控機器人完成擦玻璃,掃廁所等精細的家務。
從各種視頻中不難看出,在 Mobile ALOHA 系統的加持下,機器人可以非常順滑地完成各種家務和復雜的任務。
那麼,這個 Mobile ALOHA 究竟是什麼呢?
按照斯坦福大學研究團隊的說法,Mobile ALOHA 是一個低成本的移動操作平台,它結合了 ALOHA 系統的雙手操縱能力與移動底座的移動性。這個系統的設計目标是使機器人能夠執行復雜的移動操作任務,同時保持低成本和易于操作的特點。
使用 Mobile ALOHA 收集的數據,研究人員進行了監督行為克隆,并發現與現有的靜态 ALOHA 數據集共同訓練可以顯著提高移動操作任務的性能。即使只有 50 個任務演示,共同訓練可以将成功率提高多達 90%,使 Mobile ALOHA 能夠自主完成復雜的移動操作任務,如炒蝦、打開雙門櫥櫃存放重鍋、呼叫電梯以及使用廚房水龍頭輕輕衝洗用過的平底鍋。
Mobile ALOHA 基于 ALOHA 系統實現,這是低成本的雙手操縱裝置,Mobile ALOHA 則在此基礎上增加了遠程控制系統。為了實現遠程操控這個功能,研究者将其安裝在一個輪式底座上,給了機器人接近人類的移動速度。系統還包括了兩個手腕攝像頭和一個頂部攝像頭,用于捕捉操作過程中的視覺信息。此外,系統還具備了機載電源和計算能力,使得它能夠在沒有外部電源的情況下連續工作多小時。
除了這些基礎硬體之外,研究團隊還設計了一個将操作者的身體與機器人底座相連的系統。操作者通過背帶與底座相連,并通過拉動底座來控制機器人的移動。這種設計允許操作者在控制機器人的移動的同時,用雙手操縱 ALOHA 的雙臂。
通過這些接口,研究團隊收集了大量的操作數據。這些數據包括機器人底座的線性和角速度,以及機器人雙臂的關節位置。這些數據被用來訓練模仿學習算法,以學習如何執行復雜的移動操作任務。之後,研究者使用了監督行為克隆(Supervised Behavior Cloning)的方法來訓練機器人。他們首先将機器人的關節位置和底座的速度作為動作向量,然後将這些動作向量與機器人的觀察(包括攝像頭影像和關節位置)結合起來,形成一個 16 維的動作向量。這種方法使得 Mobile ALOHA 能夠直接從之前的深度模仿學習算法中受益,幾乎不需要改變實現。
為了提高模仿學習的性能,研究者采用了共同訓練的方法。他們将 Mobile ALOHA 收集的數據與現有的靜态 ALOHA 數據集結合起來進行訓練。這種共同訓練的方法在幾乎所有的移動操作任務中都顯示出了正向轉移,即使在任務和形态上有所不同的情況下,也能實現等效或更好的性能和數據效率。
通過這些實現原理,Mobile ALOHA 系統能夠在有限的演示數據下,通過模仿學習掌握復雜的移動操作任務。這種低成本的解決方案為研究者提供了一個實用的平台,用于研究和開發能夠在家庭環境中執行實用任務的機器人。
值得一提的是,該團隊還公布了 Mobile ALOHA 系統的成本。整套系統的總價只要不到 32000 美元,包括機器人硬體、記載電源和計算設備、攝像頭、傳感器、組裝和維護費用以及開源的軟體部分。
Mobile ALOHA 為機器人學習和移動操作研究提供了一個經濟高效的解決方案,使得更多的研究者和開發者能夠參與到這一領網域中來。
盡管 Mobile ALOHA 在硬體和軟體方面都取得了顯著進展,但該團隊也表示,Mobile ALOHA 仍存在一些限制,例如系統占用面積較大,固定高度的雙臂難以觸及較低的櫥櫃、烤箱和洗碗機等。未來工作将致力于解決這些硬體限制,并探索如何從高度次優的、異構的數據集中進行模仿學習。
Mobile ALOHA 項目目前已經在 Github 上開源,團隊也放出了相應的論文和介紹。不過研究團隊也表示,這項技術還不夠成熟,将會在不久之後在 Arxiv 平台發布更詳細的論文,GenAI 也将會繼續關注技術細節,有新消息會第一時間解讀。
論文地址:https://mobile-aloha.github.io/resources/mobile-aloha.pdf
Github 頁面:https://mobile-aloha.github.io/