今天小編分享的互聯網經驗:給機器人配AI大腦!谷歌發布視覺語言行動模型,訓練機器人扔垃圾,歡迎閱讀。
谷歌正在把先進的人工智能(AI)模型植入機器人,給機器人配一個 AI 大腦。
美東時間 7 月 28 日周五,谷歌公司宣布推出應用于機器人領網域的新產品——名為 Robotics Transformer 2(RT-2)的 AI 模型。它是一種全新的 " 視覺 - 語言 - 行動 "(VLA)模型,可以幫助訓練機器人理解扔垃圾等任務。
谷歌介紹,RT-2 基于 Transformer 模型,根據互聯網上的文本和影像進行訓練,直接指示機器人執行動作。就像用語言模型通過網絡文本訓練 AI 學習人類社會的思想和概念一樣,RT-2 也可以通過網絡數據,将相關知識告知機器人,指導機器人的行為。
谷歌舉例稱,如果我們要讓以前的機器人系統做出扔垃圾的動作,就必須明确訓練機器人懂得區分何為垃圾,以及撿起垃圾、扔掉它這些動作。而 RT-2 能将網上的相關知識傳給機器人,讓機器人無需明确的訓練,就懂得垃圾是什麼,甚至即便從未受過如何扔垃圾的訓練,也知道怎麼扔垃圾。
谷歌表示,RT-2 具有将信息轉化動作的能力,借助它,機器人有望更快适應全新的情形和環境。
因為在 6000 多次測試 RT-2 模型的機器人試驗後,谷歌的團隊發現,面對訓練數據中已有的任務、或者說 " 見過 " 的任務,RT-2 和它的前代 RT-1 一樣發揮功能,沒有差别。而在新穎的、之前從未見過的任務情形中,RT-2 的性能幾乎提高一倍,成功率達到 62%,遠超 RT-1 的 32%。
換句話說,通過 RT-2,機器人能像人類一樣學習更多内容,将學到的概念應用于全新的情境中。
谷歌稱,RT-2 顯示出超越其所接觸機器人數據的推廣應用能力和語義、視覺理解能力,包括解釋新的命令,并通過基本的推理響應用戶的指令,比如關于物體的類别和高層次描述的推理。
谷歌的研究還表明,通過結合思維鏈的推理,RT-2 能執行多階段的語義推理,比如判斷哪種物體可以臨時用作錘子,哪一類飲料最适合疲勞的人。
有媒體周五稱,谷歌目前沒有立即計劃大規模發布或者出售應用 RT-2 的機器人,但最終,這些機器人可能用在倉庫或者用作家庭助理。