今天小編分享的科技經驗:對話智元首席科學家羅劍岚:中國的具身智能圈比美國更加“務實”,歡迎閲讀。
出品|虎嗅科技組
作者|宋思杭
回國兩個月後,羅劍岚加入智元。這是他探索國内具身智能的一個起點。
從機器人不再稱之為 " 機器人 ",而是被叫做 " 具身智能 " 開始,這個賽道也逐漸年輕化。王興興、彭志輝、王鶴、楊豐瑜,如今國内的具身智能圈已經是 90 後、甚至 00 後的主場。似乎更名換姓後,人也變年輕了。和上述創業者一樣,從伯克利回來的羅劍岚也是一位 90 後。但不同的是,他的野心不在于拿融資、創業、找錢。也許是性格使然,羅劍岚回國後依然堅持了他過往的科研路線。
2015 年,是羅劍岚在機器人領網域研究更早的起點。在後續的十年時間裏,他有 8 年都在做學術研究,先後就讀于伯克利的博士和博士後學位。而在重返伯克利就讀博士後之前,他還有兩年的時間是在谷歌度過,分别擔任 Google X 和 Google DeepMind 研究科學家。在此期間,他還領導開發了全球首個超人類的機器人真機強化學習系統。
盡管在具身智能領網域,對于走 IL(模仿學習)路線還是 RL(強化學習)路線,分歧始終存在,但羅劍岚卻是一名堅定的 RL 擁護者。他的主張是,除非模仿學習準确率能達到 100%,否則在現實世界的不确定性是極大的。而實際情況是準确率達到 99.9% 都是幾乎不可能的。
回到國内,羅劍岚在做科研與回歸產業界之間,選擇了一條折中的路線。他決定加入智元擔任首席科學家,并牽頭組建了 " 智元具身研究中心 ",還做了稚輝君的同事。
與羅劍岚回國的初衷相吻合,這個 " 智元具身研究中心 " 并非傳統意義上的研究機構,而是一個連接基礎研究和產業落地之間的橋梁。在羅劍岚的口中," 它并不是為了發 paper 而存在的,這個事情不需要我在智元做,具身研究中心存在的意義是用問題推動科研,它的導向是去解決實際問題,最重要的是,在這個研究中心裏,基礎研究和產業落地沒有嚴格的界限 "。
而羅劍岚口中的界限也正是中美在具身智能領網域最大的區别所在。同時,它也是朱嘯虎口中具身智能存在泡沫的根源。
我們不能總是在一個個榜單和視頻的 demo 裏看到具身智能的進步,具身智能只有應用到具體的產業中,轉為實際生產力,才能讓人感受到它的進步。沉浸在學術界多年的羅劍岚,也并不排斥朱嘯虎的觀念。從某種程度上,朱嘯虎代表着現實主義,但這種現實主義也恰是籠罩在具身智能這種基礎研究與產業落地脱節的現實之下。
在與羅劍岚對話的過程中,他流露出了一種非常 open 的态度。他説," 完全可以理解朱嘯虎作為投資人的立場 ",但同時這并不代表應該放棄基礎研究。當下,大眾對朱嘯虎的觀點存在一種誤讀,甚至解讀成對具身智能的唱衰。實際上恰恰相反,他反而在提醒企業,具身智能領網域真正需要解決的是基礎研究與產業落地之間的 gap 問題。
但這種 gap 在美國的具身智能圈要更加嚴重。" 和國内不同,美國的氛圍太過于偏重基礎研究,可能他們不卷吧 ",羅劍岚對虎嗅説道。但這同時也是國内具身智能的魅力所在," 國内有很多做硬體的公司,而且商業化也會更快一步,這很有利于填補基礎研究與產業落地之間的 gap。" 羅劍岚告訴虎嗅。
實際上,國内的具身智能圈,一直都萦繞着兩種氛圍,一種是聚集了 UC 伯克利和斯坦福等人才的學術派,一種是聚集了華為、小米等人才的大廠派。但在羅劍岚身上,卻既看得到屬于學術派的浪漫主義風格,也有來自大廠派的務實風格。這次回國,羅劍岚更多是帶着問題回來的。
在具身智能領網域,目前最大的難題還是在 manipulation(操控)身上,通俗來講就是準确應對外部世界的無限性、不确定性。這也是目前各界都在攻克的重點。
而在智元,羅劍岚想用一種 " 以問題驅動科研 " 的方式繼續完成他的科研工作,同時這裏也是他從科研回歸到產業界的開始。
以下為虎嗅與智元首席科學家羅劍岚對話實錄,有删改:
虎嗅:你在伯克利期間,對國内具身智能公司有過接觸嗎?當時你怎麼看國内這些公司的?
羅劍岚 : 2016、17 年的時候,那時產業化處于比較早期階段,更多是硬體導向或者是偏服務類的機器人,真正關注具身智能和通用機器人的還并不多。當時還沒有這個概念,普遍都叫機器人。
國外也只是有幾家機構在做,包括 Google 在内。當時大家對于把 learning 移到機器人上這件事一直是持懷疑态度的。那個時候國内偏傳統一些,AI 做得少。但這一兩年,國内至少從聲勢上看比美國要大得多。
虎嗅:是因為商業化的原因嗎?
羅劍岚 : 國内可能會比較關注這個詞。相比之下,國内更易獲得場景和數據,使用效率也會相對較高。但美國會更堅持技術的長期探索。
虎嗅:回國之後,為什麼沒有選擇自己創業,而是加入到一家具身智能公司做首席科學家?
羅劍岚 : 在產業界做科研需要一套落地的系統,這涉及到跨學科跨層級的系統性協作。目前這個階段,我希望專注在我擅長的事情上,而不是一開始就陷入團隊建設、融資、工程化這些事情上。
虎嗅:你説跨學科協作。但國外跨學科會不會走得更往前一些?
羅劍岚 : 我倒覺得中國天生的土壤或基因會比較好一點,比如美國,第一他沒硬體,第二美國 AI 人才密度非常高,所以大家會更多基礎在 AI 研究上。但相比之下,在國内恰好相反,國内更容易找到機器人所需要硬體本體、算法等等。
虎嗅 : 那智元最吸引你的點在哪?
羅劍岚 : 它是全棧的公司,也就是説硬體、軟體、算法都是閉環的。這和我的理念非常相符。
虎嗅:你的理念是什麼?
羅劍岚 : 我覺得現在很多機器人的問題是,現在在硬體、軟體、算法上面工程和科研沒有一起迭代。你不能把它當做其他的 AI 方向,就是你有一個 benchmark,有一個 dataset,你在上面刷刷點,找一個場景。我比你好 10% 就好了。這樣沒有反映實際的進展,也不客觀公平。
虎嗅:你在智元牽頭組建的 " 智元具身研究中心 ",這個研究中心是怎樣的存在?比如它的組織架構和獨立性。
羅劍岚:目前還在持續招聘。它是一個連接基礎研究,到真正可以被部署到真實系統的中台。他不會只發論文,這可能只是目标之一;但更重要是推動具身系統能力的演進,以及部署到真實世界中。它是内嵌式的科研中台,具有相對的獨立性,可以探索新的科研範式,同時也會和我們產品工程這類部門是保持強聯動,避免脱節。
虎嗅:那在這個研究中心裏,它的基礎研究和落地方面會有一個比例嗎?
羅劍岚:這是個好問題。我覺得機器人領網域有一個挺大的問題,就是在别的領網域比説大語言模型,最新的研究成果是幾乎可以馬上轉化到商用上,大家可以看得見摸得着,可以用起來。但機器人研究卻很多停留在了紙上,拍個視頻發到網上説自己比别人好 10%,然後就沒有後續了,也沒有人負責落地。
所以你説的這個比例問題,在我們的研究中心裏我不會設一個就非常 boundary 的界限,我不會把基礎研究和落地分開來。我覺得機器人作為系統性的學科,它是可以被最後 push 到真正應用上的,而不是留在 demo 和論文,然後誰也不管的狀态,所以整體會是比較流動的狀态。
虎嗅:在國外的話,基礎研究和產業落地的這個界限會有多重?
羅劍岚:我覺在機器人領網域,國外比較尴尬的一點是,他們如果想落地比較難找場景。受制于一些客觀因素,他們的制造業和服務業相對較少。這并不是他們不想做。還有一點是美國環境會包容一點,整個機制會更鼓勵大家去做比較長期的探索,而且資本非常充裕,他們對失敗的容忍率也比較高,這也導致了在具身智能領網域很多問題沒有落地。
虎嗅 : 所以," 用問題驅動科研 " 這也是你回到國内要做的主要事情嗎?
羅劍岚 : 對,我覺得好的技術研究能轉化為生產力也是一件非常激動人心的事情。
虎嗅:DeepSeek 這波熱潮之後,國内外對 RL 接受度會更高嗎?
羅劍岚:對, DeepSeek 或 GPT-O1 會讓大家看到 RL 的潛力。之前 RL 火起來還是在 2016 年 AlphaGo 那波,但因為後來沒找到應用,又沉寂了一會。然後 2023 年大家看到大語言模型的時候又好了,再到現在大家仿佛又看到了 RL 的潛力。今年圖靈獎也頒給了 RL 領網域的兩位宗師。
我對 RL 的看法是這樣,它是一個歸納法和演繹法的區别。歸納法是你現在看到的現象,他現在是什麼,以後也就會是什麼。但演繹是,你根據它底層的邏輯去推理。因為如果只是 supervise learning (監督學習)的話,沒有辦法做優化,也沒有辦法做多步的推理。但 RL 在原則上是一個比 supervise learning 更合理的 framework(框架)。如果它出問題了,也不一定是它本身的問題,即使真有的話,我們應該讓它變得更好,而不是看到問題就認為它不行了。
虎嗅:現在在具身智能領網域,堅持 RL 的會很多嗎?
羅劍岚 : 我覺得現在做 locomotion,也就是做移動的肯定用的比較多了。但 manipulation (操控)的話,這個涉及到真實世界,大家還在探索階段吧,
虎嗅:為什麼會這麼説?這個 locomotion 和 manipulation 具體體現在什麼地方?
羅劍岚 : 因為 locomotion 更多關注的是你自己的行為。比如狗往前走,機器人 往前走,你只要控制好自己模型的準确性就可以了。但 manipulation 更多關于外部世界,除非你的仿真器能夠模仿整個世界,但這是個很難的事情。
在過去二三十年的機器學習的經驗和教訓中告訴我們,在一個 AI 系統裏,如果有一個部分不随着數據的 scale(增多)從而性能 scale(提升),那麼這部分最後就會變成這個系統的瓶頸。仿真器是我們用手設計的,不随着整個系統的提升而提升,最後我們學出來的策略就不會超過仿真器的本身。
虎嗅:所以在 manipulation 還存在很大問題的情況下,你覺得具身智能接下來的發展方向應該是什麼?
羅劍岚 : 我覺得接下來幾年,我們不要説做全能機器人,而是做有用的機器人,解決一個任務可能太 specialize (專用)了,但至少可以解決 4、5 個場景裏面的任務。我也不關注他到底是不是人形。
文章标題:對話智元首席科學家羅劍岚:中國的具身智能圈比美國更加 " 務實 "
文章鏈接:https://www.huxiu.com/article/4197063.html
閲讀原文:對話智元首席科學家羅劍岚:中國的具身智能圈比美國更加 " 務實 "_ 虎嗅網