今天小編分享的互聯網經驗:未來将至,人形機器人產業乘大模型東風進入發展“快車道”,歡迎閲讀。
圖片來源 @視覺中國
文 | 元宇宙新聲,作者 | 賈桂鵬
曾經我們在電影中看到的機器人,現在正乘着大模型的東風,離我們越來越近。
特斯拉日前展示了最新版本的擎天柱機器人 Optimus 二代。在一段新發布的視頻中,第二代人形機器人看起來比上一代具有更大的靈活性,包括更優雅的行走姿勢以及自由度更大的雙手,甚至可以用它來完成煮雞蛋等精細活,從 Optimus 二代的表現來看,特斯拉對于人行機器人的發展又起到了推動作用。
除了特斯拉外,不少科技廠商嘗試将影像語言大模型的能力和知識遷移到機器人領網域,比如包括微軟的 ChatGPT for Robotics,谷歌的 PaLm-E、RT-1、RT-2,還有 VoxPoser、BoboCat 等。
那麼,這是不是意味着人形機器人真的要走進我們的生活呢?
人形機器人很美,但離商業化還有些遠
在發布機器人 Optimus 二代後,特斯拉表示,第二代擎天柱機器人在保留原有功能的情況下,重量減輕了 10 公斤,而且機器人的平衡性更好,例如可以自如地下蹲和起立,并且在行走時的速度提高了 30%。
擎天柱的最大更新是雙手,擁有 11 個自由度,能更巧妙地移動物體,如視頻展示,機器人可以撿起雞蛋并輕輕放下,這得益于傳感技術的提升。全新的擎天柱發布标志着特斯拉距離創造一種 " 通用、雙足、自主人形機器人 " 更近了一步。特斯拉的目标是,能夠讓人形機器人執行危險、重復煩瑣的任務。
馬斯克早在 2021 年表示," 未來每個人都會擁有一個人形機器人,這個市場将會是百億美元級别的。"
但實現這一目标可能還需要很多年時間。特斯拉預計 Optimus 機器人的商業版本有望在未來三到五年才能上市,但早期版本也只可能會率先在汽車生產線上進行測試。
我們需要了解的是,人形機器人軟硬體結構復雜,是智能機器人領網域中技術難度極高的一個分支。其中,軟硬體系統的結合與通訊的實時可靠是确保人形機器人實現穩健運動的基礎。此外,動态穩定運動控制也是人形機器人的一大挑戰。
除技術難點外,成本也一直是人形機器人難以商業化的重要原因之一。以波土頓動力的 Atlas 機器人為例,盡管其已經能自主規劃路徑,可實現後空翻、跑酷等高難度動作,但代價是需配置大量功率很大的液壓驅動器,因此制造成本居高不下,預估達到 200 萬美元。
不過,雖然會面臨巨大的挑戰,但我們還是樂于看到機器人產業的發展,而随着 ChatGPT 的爆發,促使科技巨頭們不斷強化自身生成式 AI 產品,這也許會讓機器人產業來到一個新的高度。
被大模型帶火的具身智能
長久以來,人類對人工智能技術和應用的探索從未停歇,今年以 ChatGPT 為代表的生成式 AI 走紅全球,深刻影響着内容創作行業,将帶來效率的極大提升。
但人工智能的應用還遠不止于此,雖然生成式 AI 使得類人大腦變得越來越聰明,但始終是抽象的,如果将其具象化,比如加上一個機器人身體,是不是就能成為具身智能機器人。
具身智能(Embodied AI),又被視作人工智能的終極形态。他們用物理身體進行感知,通過智能體與環境的互動獲取信息、理解問題、作出決策并實現行動。通俗來講,既可以理解成是 AI 大模型披上機器人的殼,機器人長出 AI 大模型的腦。
圖靈獎得主、上海期智研究院院長姚期智認為,人工智能領網域下一個挑戰将是實現 " 具身通用人工智能 ",即如何構建能夠通過自我學習掌握各種技能并執行現實生活中的種種通用任務的高端機器人。清華大學計算機系教授張钹院士,也在某產業智能論壇上提出,随着基礎模型的突破,通用智能機器人是未來的發展方向。
英偉達創始人黃仁勳在 ITF World 2023 半導體大會上表示,具身智能是能理解、推理、并與物理世界互動的智能系統,是人工智能的下一個浪潮。
在微軟研究院發布 "ChatGPT for Robotics" 文章中,研究者使用 ChatGPT 大型語言模型 ( LLM ) 将人的語言快速轉換為機器人的高層控制代碼,從而控制機械臂、無人機等機器人,ChatGPT 帶來了一種新的機器人應用範例。
目前,已經能夠通過給 ChatGPT 的對話框輸入指令,讓其控制機器人在房間中找到 " 健康飲料 "、" 有糖和紅色标志的東西 ",以及一面供無人機自拍的鏡子。
而谷歌則與德國柏林工業大學的一組人工智能研究人員公布了視覺語言模型 PaLM-E,集成了 5400 億參數量的 PaLM 模型和 220 億參數量的視覺 ViT 模型,總參數量達到 5620 億,是目前已知的最大的視覺 - 語言模型。
該模型在多任務中表現了強大的感知能力,機器人可以在要求下從抽屜裏拿東西,然後走過去遞給人,研究員要求機器人将 " 綠色色塊推到烏龜旁邊 " 的指令,即便機器人之前沒有見過這只烏龜擺件,也能完成任務。
對于國内外科技公司不斷布局機器人產業,但更多的是行業内的巨頭,對于這樣的表現一位分析師朋友告訴元宇宙新聲:" 科技巨頭有資金、實力和技術,細分供應鏈市場雖不一定由巨頭占主導,但整體而言,人形機器人整機市場可能成為科技巨頭的遊戲。"
雖然,巨頭們已經開始布局具身智能,但元宇宙新聲認為,LLM 方興未艾,距離通用智能只是理論可行,究竟如何實現,還有很長的路要探索。從這個角度來看,被大模型帶火的具身智能,目前也還停留在語言、視覺這兩個經典的 AI 任務階段,未來還有很大的擴展空間。
政策推動國内機器人產業發展
一直以來,機器人都被譽為 " 制造業皇冠頂端的明珠 ",是衡量一個國家科技創新和高端制造業水平的重要标志,随着人工智能領網域的發展,我國也在政策、市場等方向推動機器人產業更新。
11 月初,工業和信息化部印發《人形機器人創新發展指導意見》提出,到 2025 年,人形機器人創新體系初步建立," 大腦、小腦、肢體 " 等一批關鍵技術取得突破,确保核心部組件安全有效供給。整機產品達到國際先進水平,并實現批量生產,在特種、制造、民生服務等場景得到示範應用。
從地方政府層面來看,北京已着手設立產業集群。11 月 2 日,北京率先成立國内首家省級人形機器人創新中心。該中心由機器人整機、核心零部件、大模型等企業共同組建,開展通用人形機器人本體原型、人形機器人通用大模型、運控系統、工具鏈、開源 OS 及開發者社區等 5 項重點任務突破瓶頸。
除北京以外,上海、深圳等地也發布了類似的行動方案,都包括發展人形機器人的内容。比如,深圳提出将開展通用型具身智能機器人的研發和應用,加快組建人形機器人制造業創新中心;上海提出将建設國際算法創新基地,加快人形機器人創新發展。
在政策的推動下,國内各大廠商們也在不斷發力產品和技術的創新。早在 2022 年 8 月,小米甚至領先于特斯拉,推出旗下首款全尺寸人形仿生機器人 CyberOne(鐵大)。目前,CyberOne 除了現身科技主題展會,還在電影拍攝、特效制作、場景還原等方面發揮重要作用。據了解,小米集團已經與《流浪地球 3》達成戰略合作,也許 CyberOne 将在這部電影中出鏡。
科大訊飛是繼小米後又一家自研人形機器人的廠商,在 10 月 24 日的科大訊飛開發者節上,該公司董事長劉慶峰正式向大眾推出旗下的人形機器人產品。據介紹,這款機器人和宇樹科技合作研發,科大訊飛将以人形機器人為牽引,推進 " 視覺 - 語言 - 動作 " 多模态具身智能大模型。
與科大訊飛同一天完成人形機器人產品首秀的,還有造車新勢力小鵬汽車。何小鵬在 "1024 科技日 " 上介紹,過去五年小鵬主要探索四足 " 機器馬 ",這次僅花了 5 個月完成雙足人形機器人 PX5 穩定行走。PX5 目前只有 1.5 米高,小鵬希望以後做更高一點的機器人,而且将 XNGP、XEEA 電子電氣架構,XGPT 靈犀大模型、XNet2.0 智能駕駛系統等與智能汽車同源的技術,快速植入機器人體系。
對我國而言,機器人產業作為蓬勃發展的新興生產力,核心技術不斷創新,人工智能、高端制造等加速發展,也促使 " 機器人 +" 的場景不斷深化,面向未來,機器人產業的創新發展,将為加快建設制造強國、數字中國,推進中國式現代化提供更加有力的支撐。
寫在最後
我們看到,2023 年适逢全球第一台人形機器人誕生 50 周年,期間在該行業内不斷上演着探路先鋒們失敗或艱難摸索的案例。元宇宙新聲認為,今年湧現出的新一輪人形機器人研發熱潮,有望在政策加持以及市場推動下實現技術突破和規模效應,為此後人形機器人的商業化打下基礎。
可以想象,人與機器人的融合将是一個具有歷史意義的過程,并對整個社會產生深遠的影響。在這個過程中,我們不僅要考量技術的發展,還要對機器人和人之間的倫理和道德問題進行深入研究,在兩者之間找到一個平衡點,以保證機器人融入人的過程滿足社會發展的需求,營造一個更和諧、更穩定、更美好的未來。