今天小編分享的互聯網經驗:懶人狂喜,會洗衣做飯的家務機器人來了,歡迎閱讀。
随着科技的發展,許多家庭電器和工具的出現,使家務變得更加便利和高效。例如,洗碗機、掃地機器人、洗衣機等電器可以幫助人們完成繁重的家務,減輕人們的負擔。但是,現代社會的生活節奏加快,許多人都在忙碌的工作和社交生活中奔波,因此有些人還是對瑣碎、繁重且需要耗費時間的家務 " 深惡痛絕 "。
為了讓做家務變得更加輕松有趣,斯坦福大學打造了 Mobile ALOHA,這是一個創新的家務機器人,專為雙手動遠程操作而設計,旨在提高烹饪和清潔能力。
跟人搶工作不如幫人做家務
模仿學習在機器人學中顯示出巨大的潛力,特别是在桌面操作方面。來自斯坦福大學和谷歌 DeepMind 的研究人員團隊通過創建 Mobile ALOHA(一個低成本開源硬體系統,以下簡稱 "ALOHA")人形系統,在這一領網域取得了進展。
這個機器人可以由用戶遠程操作執行多種活動,并通過模仿學習自主執行。人類操作員通過遠程操作控制操作機器人手臂來演示任務。該系統捕獲演示數據,并通過端到端的模仿學習來訓練控制系統。演示顯示,訓練有素的機器人烹饪三道菜,并完成精細的任務,如打雞蛋、切碎大蒜、倒液體、打開蔬菜包裝和在煎鍋中翻轉雞肉。
ALOHA 還可以完成各種家務任務,包括給植物澆水、使用真空吸塵器、裝卸洗碗機、從冰箱裡取飲料、開門和操作洗衣機。雖然這些是機器人列出的一些家務,但該開源發明能夠完成許多其他尚未宣布的任務,如煮蝦或在家裡整理東西。
為培訓機器人系統提供具有成本效益的解決方案,ALOHA 通過将其安裝在輪式底座上來擴展系統。整個設定包括網絡攝像頭和帶有消費級 GPU 的電腦,價格約為 32,000 美元,比現成的雙手動機器人便宜得多,後者價格高達 20 萬美元。
ALOHA 集成了移動基地和全面的遠程操作界面,以實現全身控制。該系統旨在模拟復雜的移動操作任務,這些任務以前使用專注于桌面場景的傳統模仿學習技術。ALOHA 的關鍵特征之一是它能夠與已建立的靜态 ALOHA 數據集同時訓練,這使其與常規機器人系統不同。該系統結合監督行為復刻和每項任務的 50 次演示,實現了令人印象深刻的成功率。
如何拓展家務機器人的智能
最初的 ALOHA 系統使用一種名為 Action Chunking with Transformers(ACT)的架構,該架構從多個視角和聯合位置獲取影像作為輸入,并預測一系列動作。ALOHA 通過輸入向量添加運動信号來擴展該系統。
這些操作允許 ALOHA 以最小的更改重用以前的深度模仿學習算法。研究人員寫道:" 我們觀察到,簡單地連接基礎和手臂動作,然後通過直接模仿學習進行訓練,可以產生強勁的表現……具體來說,我們将 ALOHA 的 14-DoF 聯合位置與移動基地的線性和角速度連接起來,形成一個 16 維動作矢量。"
這項工作還受益于最近方法的成功,這些方法在其他項目的各種機器人數據集上預訓練模型。特别值得注意的是 RT-X,這是 DeepMind 和 33 個研究機構的一個項目,它結合了幾個機器人數據集,創建了可以超越其訓練數據和機器人形态的通用控制系統。
研究人員寫道:" 盡管在任務和形态上存在差異,但我們觀察到幾乎所有移動操作任務的正轉移,與僅使用 ALOHA 數據訓練的策略相比,實現了同等或更好的性能和數據效率……通過協同訓練,我們能夠在這些任務上取得超過 80% 的成功,每項任務只需 50 次人類演示,與沒有協同訓練相比,平均絕對改善 34%。"
另外,ALOHA 一個關鍵創新是谷歌在機器人導航和地圖方面的進步。ALOHA 能夠使用攝像頭和傳感器識别家具、物體和牆壁,從而構建室内空間的動态地圖。它能夠在地圖中定位自己,并規劃最優路徑進行導航。機器學習使得機器人能夠随着時間的推移,在收集更多感知數據後,改進其地圖和導航能力。
總結
基于 ALOHA 引發的轟動,Mobile ALOHA 項目聯合負責人 Tony Z. Zhao 親自在 X(原推特)上放出 ALOHA 執行任務失敗的視頻,并稱 " 機器人還沒有準備好接管世界!" 雖然機器人廚師的能力确實給人留下了深刻的印象,但仍不完美,它也會把事情弄糟,而且其笨重外形不适合嚴密的環境。再者,其學習新知識仍然需要人類操作員在環境中進行全面演示。
即便如此,這依舊是機器人系統的重大發展。未來,研究人員計劃通過增加更多自由度和減少機器人體積來改進系統,并探索人工智能模型的變化,這将使機器人能夠自我改進并獲得新知。