今天小編分享的科技經驗:通用機器人裏程碑?谷歌展示全球首個多任務AI智能體 已學會套圈、搭積木、抓水果……,歡迎閲讀。
《科創板日報》6 月 22 日訊(編輯 宋子喬) 人工智能和機器人,總是不可避免地產生交集:前有人形機器人 Optimus 在特斯拉 AI 日橫空出世,後有 OpenAI 投資挪威人形機器人公司 1X。如今,谷歌旗下的 AI 團隊 DeepMind 也放出大招,當地時間 6 月 20 日,DeepMind 展示了用于機器人的 AI 智能體 "RoboCat"。
RoboCat 可操控機械臂完成各種各樣的任務
谷歌稱之為機器人智能體(robotic agent),本質上是由 AI 賦能的軟體程式,相當于機器人的 " 大腦 ",由其加持的機器人與傳統機器人不同之處在于,RoboCat 機器人更具 " 通用性 ",并可實現自我改進、自我提升。
DeepMind 稱,RoboCat 是全球第一個可以解決和适應多種任務的機器人 AI 智能體,并且它可以在各類真實的機器人產品上完成這些任務,"RoboCat 的快速學習能力減少了對人類監督訓練的需求,是朝着創建通用機器人邁出的重要一步。"
▌兩大硬核科技支撐通用機器人研發
(1)自生成訓練數據
據 DeepMind 的介紹,只需要通過 100 次左右的演示,RoboCat 就可以學會操控機械臂來完成各式各樣的任務,然後通過自生成的數據來進行迭代改進。要知道,構建通用機器人的進展速度較慢,部分原因是收集真實世界的訓練數據需要時間。
在 DeepMind 演示視頻中,RoboCat 可已經以通過自主學習操控機械臂,完成 " 套圈 "" 搭積木 "" 抓水果 " 等任務。這些任務看似簡單,但考驗了機械臂操作的精準度、理解力以及對于形狀匹配難題的解決能力。目前 RoboCat 完成一項新任務的成功率已經從初期的 36% 提升至 74%。
值得注意的是,不論是它操控的機械臂還是它要完成的任務,RoboCat 之前從來沒見過。
這種 " 通用性學習能力 " 對于加快機器人領網域的研究有重要意義。DeepMind 認為,RoboCat 獨立學習技能、快速自我提升的能力,以及對于不同硬體設備的快速适應能力,将對新一代通用機器人 AI 智能體的發展起到重要推動作用。
(2)基于多模态模型
RoboCat 用到的關鍵技術之一,是一種多模态模型 Gato,而 Gato 在西班牙語裏意為 " 貓 "(cat),這也是 "RoboCat" 這一命名的由來之一。
Gato 模型可以在模拟環境和物理環境中處理語言、影像和動作,研究人員将 Gato 的架構與一個大型訓練數據集進行了結合,這個數據集包含 100-1000 個各種機械臂完成任務的演示。
基于原始數據集和新訓練產生的數據,RoboCat 的數據集将包含數百萬次的訓練軌迹數據。它學習的新任務越多,它就能更好地學習和解決額外的新任務。
RoboCat 的訓練過程圖解
模拟演示 RoboCat 的訓練過程
依托于多模态模型,RoboCat 完成現實世界訓練任務的成功率要遠高于傳統基于視覺的模型方案。
▌科技巨頭同台比拼 中國產業鏈凸顯性價比優勢
其實,在生成式 AI 風靡全球之前,特斯拉、亞馬遜、英偉達、騰訊等眾多科技巨頭已經劃撥了專門團隊進行機器人研發。該階段,機器人智能化水平不足,難以商業化。
如今,AI 加持的機器人化身具身智能,再次煥發生機。一方面,AI 大模型的出現以及多模态技術的迭代,使得機器人具備自然語言互動與自動化決策能力,大大提升其智能化水平、增強用户體驗感;另一方面,工程師也可以通過 AI 對其進行肢體的模拟訓練,大大降低了其開發成本。
谷歌 RoboCat 只是 AI 賦能機器人的優秀案例之一。僅将視線聚焦在今年:2023 年年初,谷歌推出視覺語言模型 PaLM-E,并運用到工業機器人上;4 月份阿裏巴巴将千問大模型接入工業機器人;5 月,特斯拉人形機器人 Optimus 展示了精準的控制、感知能力,同月英偉達發布全新自主移動機器人平台。
再結合 OpenAI 投資挪威人形機器人公司 1X,以及三花智控與綠的諧波在墨西哥合資設立諧波減速器公司,近期多家機構認為 AI+ 機器人已經到達產業爆發前夜。
招商證券分析師胡小禹預計 Optimus 在未來 2-3 年内會進入量產階段。如果以 100 億台空間以及 2 萬美元單機售價測算,市場空間 200 萬億美元。另據高盛的研究報告,人形機器人市場規模有望在 2035 年超過 1500 億美元。
中銀證券分析師陶波稱,國產機器人產業鏈有望在自動化、智能化的浪潮中,憑借產品性價比優勢獲得廣闊的發展空間。
▌發展初期硬體先行 運動模塊價值量最高
中信證券分析師袁健聰表示,OpenAI、騰訊、小米、谷歌、英偉達等科技企業持續加注機器人領網域,推動機器人技術創新與降本量產進程加快,機器人目前處發展初期,存在 " 硬體先行 " 規律。
機器人硬體主要包括控制、感知、運動、動力、散熱和總裝五大模塊,運動模塊價值量最高。根據 Ofweek 機器人網,工業機器人運動模塊約占整體成本的 47%。
以人形機器人為代表的 AI 機器人相較工業機器人結構更為復雜,運動模塊的成本相應更高。以特斯拉的人形機器人 Optimus 為例,其運動模塊和部分感知模塊被整合為一體化關節,這部抽成本占比高達整機的 50%。基于此,廣發證券分析師代川及華泰證券分析師倪正洋均看好一體化關節投資價值。
圖源:廣發證券
據不完全梳理,一體化關節方面的具體 A 股公司包括:
減速器:諧波減速器(綠的諧波、豐立智能、漢宇集團、雙環傳動、國茂股份、昊志機電)、RV 減速器(中大力德、雙環傳動、秦川機床、巨輪智能、上海機電)。綠的諧波為國内諧波減速器龍頭,市占率達 40%,中大力德、國茂股份等企業在各自減速機細分領網域也較為領先;
電機:無框力矩電機(步科股份、昊志機電)、空心杯電機(鳴志電器、鼎智科技、江蘇雷利、偉創電氣)。匯川技術和禾川科技為國内伺服產品主要供應商,也有直驅電機相關產品及布局;
絲杠:鼎智科技、秦川機床、恒立液壓。該領網域海外高度壟斷,國内處于起步階段,以中國船舶 704 所、博特精工、思科瑞傳動、仲孚機械等為代表的非上市公司率先嶄露頭角;上市公司中鼎智科技微型行星滾柱絲杆的研發與生產上已有裏程碑式達成;
傳感器:漢威科技、柯力傳感、保隆科技。傳感器下遊細分領網域多,全球競争集中,以基恩士為代表的龍頭企業才易具有規模效應。本土企業逐漸在汽車、儀器儀表、工業互聯網等領網域打開工業領網域國產化的大門。