稚晖君剛挖來的90後機器人大牛：逆襲履歷堪比爽文男主

今天小編分享的科學經驗：稚晖君剛挖來的90後機器人大牛：逆襲履歷堪比爽文男主，歡迎閱讀。

剛剛，稚晖君旗下創企智元機器人官宣了兩個新動向——

一則是關于人事變動。

具身智能領網域的國際領軍學者羅劍岚博士，已于近日加盟并出任首席科學家。

羅劍岚在該領網域已深耕 10 年，曾擔任 Google X、Google DeepMind 研究科學家，是 UC 伯克利 17 萬引大佬 Sergey Levine 團隊的核心成員。

他曾參與打造世界上首個超人類的機器人真機強化學習系統 SERL/HIL-SERL ——首次實現将任務成功率提升到 100%，在全球範圍内被廣泛應用。

接下來他将牽頭組建「智元具身智能研究中心」，主導前沿算法研發與工程化落地。

另一則是關于公司新合作。

國際頂尖具身智能公司 Physical Intelligence（Pi）正式和智元機器人達成合作夥伴關系，雙方将圍繞動态環境下的長周期復雜任務，在具身智能領網域展開深度技術合作。

以及實屬罕見的是，在競逐 AI、機器人以及軟硬體的最前沿陣地，中美兩家明星公司，竟然聯手了。

稚晖君挖來具身智能領網域大佬

羅劍岚，出生于 1993 年，本科畢業于武漢理工大學汽車學院。其後在 AI 和機器人重鎮 UC 伯克利，拿到了博士學位。

從 2015 年開始，也是在機器人學習領網域初步興起的階段，他就投身了機器人研究當中。

過程中，他逐漸将目光放在了将強化學習應用到真實機器人這一細分領網域。

在積攢了一波學術經驗後，2020 年他毅然選擇踏入工業界，進入谷歌多個機器人部門任職，包括 Google X、DeepMind 等。

在此期間，他與機器人學習領網域的泰鬥Stefan Schaal 教授進行了一系列合作，主要學習了更多從底層動力學到上層控制的機器人系統知識。

值得一提的是，Stefan Schaal 教授是 UC 伯克利機器人領網域的領軍專家，曾多次與李飛飛共同發表論文。

兩年時間，當他所參與的項目被孵化為工業機器人創企 Intrinsic 後，他重新回到了伯克利從事博士後研究，師從 Sergey Levine。

Sergey Levine 是 UC 伯克利電氣工程和計算機科學系的副教授，專注于能夠使 Autonomous Agents 通過學習獲得復雜行為的算法，特别是能夠使任何自主系統學習解決任何任務的通用方法。

Sergey Levine 因兩件事而聲名遠播。

一是他是領網域内的大神，不僅谷歌學術被引用量為超過 12.7 萬，還是不折不扣的頂會狂魔。

此前的不完全統計中，Sergey Levine 2018 年在 ML 和 NLP 頂會上共發表 22 篇論文；ICML 2019，他參與論文數量排名第三；NeurIPS 2019、NeurIPS 2020，他均有 12 篇論文被接收……

其二，他屬于 UC 伯克利的網紅教授，此前推出的深度學習課程 Deep Reinforcement Learning（課程代号 CS 285）非常受歡迎。

回到羅劍岚，正是在回歸學術界的這一時間，他參與產出了 " 強化學習 + 真機 " 這條路線上具有代表性的兩篇論文：SERL 和 HiI SERL。

SERL/HIL-SERL 作為世界上首個超人類的機器人真機強化學習系統，首次實現将任務成功率提升到 100%, 在全球範圍内被廣泛應用。

具體而言，在 SERL 這項研究中，機器人能用 20 分鍾學會裝配電路板，成功率達到了 100%。

這一結果真實驗證了強化學習的有效性，而在這之前，該方法一直受到行業诟病。

至于 HIL-SERL，則是基于 SERL 的更新版。不過與 SERL 僅依賴人類的示範不同，HIL-SERL 還結合了人類的糾正來訓練強化學習策略。

實驗結果顯示，使用強化學習框架 HIL-SERL，研究者可以直接在現實世界中訓練基于視覺的通用機器人操作策略。

其中，機器人經過 1~2.5 小時的訓練後，就能完成主機板、儀表盤以及正時皮帶組裝等操作任務。

更重要的是，成功率也是 100%。

手握上述重要機器人學習技術，羅劍岚博士這次又選擇加入智元投身工業落地。

中美明星具身智能公司，罕見聯手

與此同時，智元機器人這次也選擇了和一家國外同行開展合作。

Physical Intelligence，去年 3 月官宣亮相的美國明星創業公司，其團隊全是一群機器人和 AI 大佬，聯合創始人就有羅劍岚博士後研究期間的導師 Sergey Levine。

據了解，這家公司在去年 11 月完成了 4 億美元的 A 輪融資，融資後估值為 20 億美元，主要投資者包括亞馬遜創始人貝索斯、OpenAI、Thrive Capital 等知名公司或投資機構。

關于智元為什麼會選擇這家公司合作的原因，可能還要從 Physical Intelligence 所推出的產品或技術來追蹤。

就在今年 2 月底，這家公司推出了 " 分層互動式機器人 "（Hi Robot）系統，它能夠将視覺 - 語言 - 行動（VLA）模型，如 π 0 ，納入一個分層推理過程。

劃重點，分層推理。

面對 " 如何讓機器人能像人類一樣執行復雜任務 " 這個行業難題，Physical Intelligence 早已明确給出答案：

讓機器人學會以系統 2 思維進行思考

合理推測，未來兩家可能會在讓機器人學會推理方面展開深度合作。

另外，據智元介紹，雙方的合作已經初有成效，可以實現一個通用模型根據不同的指令輸入執行多個任務。

同時也可以适配多種末端執行器，包括靈巧手、平行夾爪和旋轉夾爪，并兼容魚眼和針孔相機等多種傳感器。

官方演示 demo 如下：

可以看到，視頻中的智元機器人能完成在鏡子前戴上圍巾、換垃圾袋，将物品從傳送帶移入物流箱等覆蓋家庭和工業場景的多元復雜任務。

整體而言，對行業來說，兩家明星具身智能公司的強強聯合，不僅蘊藏了大模型推理技術在機器人領網域的垂直應用趨勢，而且還将進一步加速機器人真實落地家用場景。

One More Thing

當然，對于智元今日的人才大新聞，背後還有一段傳奇佳話。

本科畢業于武漢理工的羅劍岚，實際也上演了一段 " 爽文男主 " 人生。

因為從中國一所 211 大學本科，能夠拿到 UC 伯克利競争激烈的王牌專業 offer，并且碩博連讀，每年 5 萬美元獎學金！羅劍岚的故事堪稱傳奇，甚至被專門報道過。

據《長江日報》2015 年報道稱，當年 UC 伯克利的機器人方向博士生競争非常激烈，收到了全球 1500 份申請，而招生名額僅有 30 個，最後羅劍岚成功脫穎而出，還打破了紀錄——成為唯一一位被機器人和智能機器實驗室錄取的中國人。

在采訪中，羅劍岚坦承自己因為在科研項目中關注到 UC 伯克利分校卡澤洛尼教授領銜的實驗，其後有緣又在天津舉辦的機器人研究國際會議上，獲得了直接向卡澤洛尼教授發問的機會，并進一步在會後遞上了自己的簡歷，向教授明确表達：" 我想讀您的研究生 !"

卡澤洛尼也被年輕大學生的履歷吸引。據介紹，羅劍岚從大二開始就跟着武漢理工大學的導師田哲文做項目，發表了 4 篇核心期刊論文，參加全國和省級重大科研項目有 5 個，還獲得了美國數學建模比賽一等獎。

卡澤洛尼教授給他的回答是：" 或許我能有機會讓你到伯克利來。"

也正是這句認可，點燃了羅劍岚心底的火苗。

回到武漢後，他又花了大半年時間，利用别人打遊戲的時間，啃下了卡澤洛尼教授實驗室發表的 100 多萬字的學術資料。

其後 2014 年 8 月，羅劍岚更是上演了一段 " 孤身飛赴韓國追教授 " 的瘋狂。

他查到卡澤洛尼教授将赴韓國參加一場有關機器人的國際會議，随即辦好籤證就追了過去。并在貴賓室外，等到了卡澤洛尼教授如廁的機會，再次表達了希望跟随讀研讀博的想法。

卡澤洛尼記得羅劍岚：哦，你住在首爾？

羅劍岚回答：不！我住在中國武漢，我來這裡見您，就是希望讀您的研究生！

而且也是在這次會議上，羅劍岚的半年苦功也換來了回報，他獲得提問機會，把幾個月來的思考化成幾個刁鑽的問題抛給了教授，卡澤洛尼會後再次找到他給出認可：" 小夥子，不出意外，我想，我要把你帶到伯克利。"

于是回國後，羅劍岚繼續與卡澤洛尼教授聯系，并附上自己的思考，通過電子郵件給對方發了過去。卡澤洛尼教授告訴他：你寫的每篇綜述我都看了七八遍，我不敢相信這是一位來自中國的大學生所寫。

而也是在卡澤洛尼教授力薦下，羅劍岚在 2015 年夏天收到了加州大學伯克利分校的 offer。

機器人和智能機器實驗室，每年 5 萬美元獎學金，從全球 1500 份簡歷中脫穎而出，成為了當年唯一一位被該頂級實驗室錄取的中國人。

參考鏈接：

[ 1 ] http://auto.whut.edu.cn/xyh/xywh/201912/t20191227_429864.shtml

[ 2 ] https://x.com/physical_int/status/1894829058883731962

[ 3 ] https://agibot-world.cn/collaboration

一鍵三連「點贊」「轉發」「小心心」

歡迎在評論區留下你的想法！

— 完 —

速搶席位！中國 AIGC 產業峰會觀眾報名通道已開啟 ‍♀️

首批嘉賓曝光啦百度、無問芯穹、數勢科技、生數科技、像素綻放等十數位 AI 領網域創變者将齊聚峰會，讓更多人用上 AI、用好 AI，與 AI 一同加速成長～

4 月 16 日，就在北京，一起來深度求索 AI 怎麼用

一鍵星标

科技前沿進展每日見