今天小編分享的互聯網經驗:能折紙,還會灌籃!谷歌發布機器人基座大模型,大幅強化機器人通用性,歡迎閱讀。
通用型機器人發展史上的又一個 " 裡程碑 " 來了。
3 月 12 日,谷歌旗下的 DeepMind 公司發布了全新的 AI 模型,名為 Gemini Robotics 和 Gemini Robotics-ER。 這套模型号稱能讓機器人更好地适應復雜環境,完成各種高難度任務。
截至昨日,谷歌母公司 Alphabet Class C 股價收盤小幅上漲 1.82%,收于 169.00 美元。
機器人也能折紙、整理桌面、灌籃? 谷歌 DeepMind 展示不俗實力!
DeepMind 這次發布的 AI 模型進一步更新,經過新模型訓練的機器人,不僅能流暢地折疊紙狐狸。
還能按照語音指令整理桌面。
甚至還能熟練地拉開拉鏈。
最後還能來個迷你籃球灌籃!
DeepMind 還和初創公司 Apptronik 合作,計劃用這項技術打造人形機器人。
X 網友表示未來機器人管家真的不是夢了,想喝咖啡讓機器人幫忙做一杯。
以往,機器人的動作都需要科學家手動編程,費時費力。現在,得益于新的 AI 技術,機器人能更好地适應環境,學習新技能的速度也大大加快。Google DeepMind 的首席軟體工程師 Kanishka Rao 表示 :
Gemini Robotics 的通用性是之前最好模型的兩倍,真正實現了向通用型機器人的重大飛躍。
Gemini Robotics:讓機器人更聰明、更靈活
據悉,Google 利用其 Gemini 2.0 語言模型,專門訓練了用于控制機器人的模型。這使得機器人擁有了三大 " 超能力 ":
環境适應能力: 能快速适應各種新情況。
指令理解能力: 能迅速響應口頭指令或環境變化。
操作靈活性: 擁有足夠的手部靈巧性來操作物體。
這種能力對于機器人技術的發展至關重要,因為機器人之前在實驗室表現出色,但在非受控環境下往往 " 水土不服 "。
X 網友評論 Gemini 讓機器人變得更酷更有趣了。
加州大學伯克利分校的機器人學教授 Ken Goldberg 表示:
這項技術無疑是機器人領網域令人興奮的進展,似乎建立在谷歌在大規模數據和計算方面的優勢之上。
他還提到,這些新機器人模型最獨特的地方在于它們可以在雲端流暢運行,這大概是因為它們能夠利用谷歌對需要大量計算能力的超大型語言模型的訪問。麻省理工學院教授,同時也是豐田研究院機器人研究副總裁的 Russ Tedrake 認為:
Gemini 是重要的一步。
但他也表示:
通用型機器人要做好投入使用,還有很多工作要做。
科技巨頭争相布局,萬億市場蓄勢待發
這次 DeepMind 的動作,也預示着一場機器人領網域的 " 軍備競賽 " 正在加速。
美銀分析師 Ming Hsun Lee 團隊大膽預測,人形機器人即将告别概念驗證階段,在十年内迎來多行業應用爆發期。預計到 2030 年,全球人形機器人年銷量将達到 100 萬台,到 2060 年,人形機器人總保有量将達到 30 億台,相當于屆時人均擁有 0.3 台機器人。
包括特斯拉、OpenAI 在内的科技巨頭,以及眾多初創公司,都在争先恐後地研發 AI" 大腦 ",希望賦予機器人自主操作的能力。
英偉達的 CEO 黃老板更是直言,這項技術将帶來一個價值數萬億美元的巨大市場,甚至可能 " 開創有史以來最大的科技產業 "。