今天小編分享的互聯網經驗:對話戴盟機器人首席科學家王煜教授:“靈巧手”才是人形機器人的核心價值,歡迎閲讀。
文 | 昆仲資本
1950 年,圖靈首次提出 " 具身智能 ",但之後的研究卻猶如暗夜行舟。
如今,得益于 AI 技術、執行器方案、傳感器方案等科技的進步,長出 " 大腦 " 和 " 四肢 " 的人形機器人正走出實驗室,走向市場。
然而,人形機器人想真正要實現商業化落地,就要擁有類人的能力,尤其是高精度、高復雜度的手部操作,直接決定了人形機器人的實用價值。
在此背景下,戴盟 Sparky 1" 心靈手巧 " 型人形機器人脱穎而出。
戴盟 Sparky 1 的技能包括但不限于焊接電路板、滴試劑、熨衣服、倒酒、整理書架……讓我們看到了人形機器人在工業、研發、家庭、商業等多個場景的出色替代性。
正因如此,屬于 " 具身智能 " 機器人的 " 開燈時刻 " 終于到來。
近日,昆仲資本創始合夥人姚海波與戴盟機器人董事長、首席科學家王煜教授進行了一次深入交流,精彩講解了機器人技術的變革與發展,以及人形機器人的未來。以下為對話内容:
具身智能機器人到了 " 開燈時刻 "
姚海波:有人説具身智能機器人到了 " 開燈時刻 ",您怎麼看?
王煜教授:這是一個令人興奮的話題。80 年代初,我在美國讀研時進入機器人行業,作為機器人領網域最早的一批研究生,我經歷了整個人形機器人的發展歷程,也參與了很多研究工作,現階段人形機器人的發展狀況确實是令人興奮的,也是震撼人心的。
此前的 30 多年裏,機器人取得的進展主要集中在工業領網域,尤其是汽車行業和有自動化需求的各類工業場景中。發展至今,工業機器人已經非常成熟了,中國的表現更是可圈可點,目前,國產工業機器人市場份額已突破 50%。對我們這些第一代機器人研究者來説,這樣的成績十分喜人。
但機器人領網域真正的突破和未來長遠的發展前途,實際上是現在的人形機器人。過去 30 年,機器人的研究問題主要包括移動、操作、影像理解三個方面。人形機器人這幾年的發展,主要就是把這三方面最終落實到一個擁有自主執行的智能機器人上面。
最近十幾年,機器人在硬體、影像處理上取得了長足的進步。在美國波士頓動力的帶領下,機器人本體的控制、動力學控制等都有不錯的進展。最近三四年,人形機器人迎來了一個新的巨大的突破,就是具身智能。至此,機器人可以通過大數據、深度學習、大語言模型等方法,實現和外界互動,并且能夠理解指令的真實含義,分析自身所處場景,最終完成一系列任務操作。換言之,機器人可以同時執行下肢移動和上肢操作,而且能夠通過自主學習實現這些操作。
國内外多家人形機器人科創公司,包括特斯拉和戴盟機器人等,都在沿着這個方向向前邁進,這個方向不僅有非常好的可行性,而且也有相當可觀的市場。從這方面來講,我覺得現在正是所有機器人研究者真正所盼望的時刻,我們有機會把人形機器人做成做好。
姚海波:大語言模型給人形機器人帶來了什麼,是一場應用革命嗎?
王煜教授:1956 年,麥肯錫、明斯基等 4 位圖靈獎得主與多名學者共同确立了 " 人工智能 " 的概念,就是希望機器能夠像人類一樣認知、思考和學習。此後,湧現出一些智能產品。1990 年左右,由于應用領網域狹窄、收益不樂觀等原因,人工智能進入 " 冬天 "。直到深度神經網絡技術的出現,人工智能才進一步走向實用化。
與預編程技術不同,在深度神經網絡技術下,機器人能夠根據先前的學習和經驗預測解決方案,這使得通用大模型的建立成為可能,我們熟知的 ChatGPT 大語言模型就是在此基礎上實現的。
大語言模型能夠幫助機器人更好地識别場景、理解指令的含義。比如,機器人要完成 " 把這本書放在書架上第三本書的後面 " 這一指令,它不僅要理解指令的意思,還要把一連串的 sequences(序列運動)做出來。
在人工智能發展歷史中,大語言模型等工具還是新事物,目前尚處于科研階段,業界對這些工具的理解還未達成共識,因此,我們會看到不同的技術路線和方法。但不可否認的是,這些工具有很好的應用價值,當下這個好時機不容錯過。
" 手 " 比 " 足 " 難,但卻更有價值
姚海波:無論是波士頓動力還是特斯拉,過去幾年,大家看到的更多是 " 足 " 在快速迭代與躍遷,而 " 手 " 卻沒有想象中發展快,原因是什麼?
王煜教授:這是一個很有趣的問題。前面提到,80 年代初機器人研究要解決的三個方向是移動、操作、視覺影像處理。其中移動和視覺影像處理發展相對較快。移動的發展是和硬體、運動控制、動力學控制等的發展是同時并進的。波士頓動力創始人馬克 · 雷伯特(Marc Raibert),他在 CMU(美國卡内基梅隆大學)創立了 CMU leg 實驗室,那時候就把足的能力做得非常好了。
在過去的 20 年裏,尤其是在波士頓動力的帶領下,人形機器人行業已經基本解決了動力學的問題,這些使得 " 足 " 的能力達到了我們現在所看到的樣子——非常穩定而且驚人,機器人可以在復雜的、不可預估的地面上行走,比如冰、雪路面,樓梯等。而且擁有不錯的整體控制能力,特别是 MPC 控制方法(模型預測控制)的應用,給現在的人形機器人奠定了良好的基礎。
靈巧手的發展經過了一段緩慢的時間。我在 CMU 讀博時,跟随導師和團隊開始研究靈巧手操作,當時我們是較早開始做靈巧手操作的研究機構之一。
大約十年前,伴随電動系統的應用,五指靈巧手硬體已不再是難題,但擁有硬體層面的靈巧手不等于實現了靈巧操作。
和移動不一樣的是,靈巧操作任務復雜度太高了。過去,我們通過編程來實現移動和操作,但這并不适用于靈巧操作,因為我們無法把所有的事情都變成程式,更重要的是,靈巧手接觸到物體時的反饋是非常重要的,可以説,沒有主動的反饋就沒有靈巧操作,靈巧手的發展就卡在這裏。
現在,我們終于有了一套新的思路和解決方法,這套方法已經在近期發布的 Sparky 1 上應用,即通過基于光學觸覺傳感器的五指靈巧手獲得類人的操作能力和觸覺反饋,以及集成最新的 AGI 技術和 LLM 大語言模型,使機器人具備強大的自主學習能力和問題解決技巧,能夠廣泛應用于不同場景和任務,從而展現出前所未有的 " 心靈手巧 ",這是能夠讓我們超越友商的一套 " 獨家秘笈 "。
在操作模型訓練方面,我們也總結出一套經驗,那就是,既要關注數據集的大小,更要關注如何收集高質量的數據,尤其是觸覺感知,因為觸覺感知對于機器人使用手完成靈巧操作任務至關重要。
姚海波:靈巧手領網域 PK 的到底是什麼,有人説是抓握、負載等各種能力,您的答案是什麼?
王煜教授:靈巧手的能力不是單一的、線性的,而是基于不同環境下的不同能力,這和跑、跳機器人有所不同。當跑、跳機器人的足和地面接觸時,機器人的首要任務是在完成動作時保持平衡,避免跌倒。
而機器手的任務則更為復雜——通過手指和物體的互動,使得物體產生一定的運動和軌迹,并能夠在一定的環境下達到一定的位置,比如説擰螺絲,既要擰得上去,又要把它擰緊。這不僅要控制手的穩定,還要通過手施加的力使得物體之間 interaction(相互作用),所以 " 手 " 和 " 足 " 的任務需求完全不同,技術要求也就不同," 手 " 的操作會更難。
姚海波:可以樸素地理解為 " 手 " 比 " 足 " 更難嗎?
王煜教授:從操作復雜性的角度來看,現在公認的觀點是 " 手 " 比 " 足 " 更難。
很多年前,預編程控制的夾爪或機械手就已廣泛應用于工業自動化領網域,這種 " 基礎版 " 的手難度相對不大。我們希望人形機器人有一雙感知反饋的靈巧手,替代人類完成那些對精确度要求高且通用性較強的任務,這種 " 高級版 " 的手做起來要更難。
目前,當我們在説手更難時,實際上是指 " 高級版 " 的手比足更難。而通過一雙 " 高級版 " 的手,提高生產效率、保障作業安全、擴展可完成任務的能力邊界并達到或超越人類的操作技能,這是人形機器人的核心價值。
中國具身智能人形機器人加速 " 領跑 "
姚海波:在發展具身智能人形機器人上,中美兩國都投入了巨大資源,并作了長期規劃。您認為未來中美人形機器人行業各自的發展前景如何?
王煜教授:最近兩三年,在高科技公司牽頭下,美國新老研究者們凝聚在一起,共同推動具身智能的發展。另外,強大的多模态大模型能力和芯片產業,也是美國具身智能發展的重要優勢。可以説,美國拿着一手好牌。但有趣的一點是,美國主要的幾個學術派科研團隊中,都有來自中國的學生,中國學生聰明、敏捷,且往往能夠精準地判斷出最有前景的研究方向。
中國手裏的牌也不錯。
在政策端,中國對人形機器人的支持力度相當大,北京、上海、深圳、杭州等地積極布局人形機器人產業,甚至一些中小型城市也極為重視人形機器人的發展;在產業端,我國具有市場規模、應用場景、數據資源、人力資源等多方面綜合優勢,尤其應用場景優勢對整個行業的發展至關重要。與此同時,我國有很好的供應鏈和制造業基礎,電力系統、電池、電機等呈現良好的增長态勢,因此,在人形機器人領網域,我們完全有可能和美國同行并進,甚至在規模上壓倒對方。
姚海波:科學家和創業者這兩種身份有什麼不同?
王煜教授:科研教授一般緊盯前沿、尖鋭、具體的問題,并從中找到自己擅長、喜歡的方向。我最近幾年做的視觸覺傳感器研究,就是盯住了靈巧手手指所需要的敏捷且全面的感知系統這一問題。
但作為創業者,我的工作則更加復雜多元,主要體現在三點:一是以更加系統性的眼光看待技術和產品,關注從產品的整體設計到最終交付的每一個細節;二是搭建一個優秀團隊。
2015 年,我在香港科技大學創建了機器人研究院,段江譁博士等一批來自該研究院和國内外知名高校、科研院所的優秀人才加入戴盟,我們一起把科研技術轉化為產品;三是要獲得資本的認可。在昆仲資本的加持下,戴盟機器人快速發展,在市場、研發等多個方面,尤其在靈巧操作方面 " 遙遙領先 "。總之,創業要融合方方面面,這是天時地利人和的事。
人物介紹
王煜,戴盟機器人董事長、首席科學家,大灣區大學(籌)講席教授,先進工程學院院長,香港科技大學機器人研究院創始院長。先後就職于美國馬裏蘭大學、香港中文大學、新加坡國立大學、香港科技大學講席教授。
美國卡内基梅隆大學博士,973 首席科學家,國家傑青,長江學者特聘教授,國家海外領軍人才計劃入選者,國家科技進步二等獎,IEEE 機器人與自動化學會制造自動化技術委員會前主席,IEEE Transactions on Automation Science and Engineering 前主編(Editor-in-Chief),IEEE Transaction on Robotics 副主編, IEEE Robotics and Automation Society 管理委員會委員。