今天小編分享的科學經驗:稚晖君剛挖來的90後機器人大牛:逆襲履歷堪比爽文男主,歡迎閱讀。
剛剛,稚晖君旗下創企智元機器人官宣了兩個新動向——
一則是關于人事變動。
具身智能領網域的國際領軍學者羅劍岚博士,已于近日加盟并出任首席科學家。
羅劍岚在該領網域已深耕 10 年,曾擔任 Google X、Google DeepMind 研究科學家,是 UC 伯克利 17 萬引大佬 Sergey Levine 團隊的核心成員。
他曾參與打造世界上首個超人類的機器人真機強化學習系統 SERL/HIL-SERL ——首次實現将任務成功率提升到 100%,在全球範圍内被廣泛應用。
接下來他将牽頭組建「智元具身智能研究中心」,主導前沿算法研發與工程化落地。
另一則是關于公司新合作。
國際頂尖具身智能公司 Physical Intelligence(Pi)正式和智元機器人達成合作夥伴關系,雙方将圍繞動态環境下的長周期復雜任務,在具身智能領網域展開深度技術合作。
以及實屬罕見的是,在競逐 AI、機器人以及軟硬體的最前沿陣地,中美兩家明星公司,竟然聯手了。
稚晖君挖來具身智能領網域大佬
羅劍岚,出生于 1993 年,本科畢業于武漢理工大學汽車學院。其後在 AI 和機器人重鎮 UC 伯克利,拿到了博士學位。
從 2015 年開始,也是在機器人學習領網域初步興起的階段,他就投身了機器人研究當中。
過程中,他逐漸将目光放在了将強化學習應用到真實機器人這一細分領網域。
在積攢了一波學術經驗後,2020 年他毅然選擇踏入工業界,進入谷歌多個機器人部門任職,包括 Google X、DeepMind 等。
在此期間,他與機器人學習領網域的泰鬥Stefan Schaal 教授進行了一系列合作,主要學習了更多從底層動力學到上層控制的機器人系統知識。
值得一提的是,Stefan Schaal 教授是 UC 伯克利機器人領網域的領軍專家,曾多次與李飛飛共同發表論文。
兩年時間,當他所參與的項目被孵化為工業機器人創企 Intrinsic 後,他重新回到了伯克利從事博士後研究,師從 Sergey Levine。
Sergey Levine 是 UC 伯克利電氣工程和計算機科學系的副教授,專注于能夠使 Autonomous Agents 通過學習獲得復雜行為的算法,特别是能夠使任何自主系統學習解決任何任務的通用方法。
Sergey Levine 因兩件事而聲名遠播。
一是他是領網域内的大神,不僅谷歌學術被引用量為超過 12.7 萬,還是不折不扣的頂會狂魔。
此前的不完全統計中,Sergey Levine 2018 年在 ML 和 NLP 頂會上共發表 22 篇論文;ICML 2019,他參與論文數量排名第三;NeurIPS 2019、NeurIPS 2020,他均有 12 篇論文被接收……
其二,他屬于 UC 伯克利的網紅教授,此前推出的深度學習課程 Deep Reinforcement Learning(課程代号 CS 285)非常受歡迎。
回到羅劍岚,正是在回歸學術界的這一時間,他參與產出了 " 強化學習 + 真機 " 這條路線上具有代表性的兩篇論文:SERL 和 HiI SERL。
SERL/HIL-SERL 作為世界上首個超人類的機器人真機強化學習系統,首次實現将任務成功率提升到 100%, 在全球範圍内被廣泛應用。
具體而言,在 SERL 這項研究中,機器人能用 20 分鍾學會裝配電路板,成功率達到了 100%。
這一結果真實驗證了強化學習的有效性,而在這之前,該方法一直受到行業诟病。
至于 HIL-SERL,則是基于 SERL 的更新版。不過與 SERL 僅依賴人類的示範不同,HIL-SERL 還結合了人類的糾正來訓練強化學習策略。
實驗結果顯示,使用強化學習框架 HIL-SERL,研究者可以直接在現實世界中訓練基于視覺的通用機器人操作策略。
其中,機器人經過 1~2.5 小時的訓練後,就能完成主機板、儀表盤以及正時皮帶組裝等操作任務。
更重要的是,成功率也是 100%。
手握上述重要機器人學習技術,羅劍岚博士這次又選擇加入智元投身工業落地。
中美明星具身智能公司,罕見聯手
與此同時,智元機器人這次也選擇了和一家國外同行開展合作。
Physical Intelligence,去年 3 月官宣亮相的美國明星創業公司,其團隊全是一群機器人和 AI 大佬,聯合創始人就有羅劍岚博士後研究期間的導師 Sergey Levine。
據了解,這家公司在去年 11 月完成了 4 億美元的 A 輪融資,融資後估值為 20 億美元,主要投資者包括亞馬遜創始人貝索斯、OpenAI、Thrive Capital 等知名公司或投資機構。
關于智元為什麼會選擇這家公司合作的原因,可能還要從 Physical Intelligence 所推出的產品或技術來追蹤。
就在今年 2 月底,這家公司推出了 " 分層互動式機器人 "(Hi Robot)系統,它能夠将視覺 - 語言 - 行動(VLA)模型,如 π 0 ,納入一個分層推理過程。
劃重點,分層推理。
面對 " 如何讓機器人能像人類一樣執行復雜任務 " 這個行業難題,Physical Intelligence 早已明确給出答案:
讓機器人學會以系統 2 思維進行思考
合理推測,未來兩家可能會在讓機器人學會推理方面展開深度合作。
另外,據智元介紹,雙方的合作已經初有成效,可以實現一個通用模型根據不同的指令輸入執行多個任務。
同時也可以适配多種末端執行器,包括靈巧手、平行夾爪和旋轉夾爪,并兼容魚眼和針孔相機等多種傳感器。
官方演示 demo 如下:
可以看到,視頻中的智元機器人能完成在鏡子前戴上圍巾、換垃圾袋,将物品從傳送帶移入物流箱等覆蓋家庭和工業場景的多元復雜任務。
整體而言,對行業來說,兩家明星具身智能公司的強強聯合,不僅蘊藏了大模型推理技術在機器人領網域的垂直應用趨勢,而且還将進一步加速機器人真實落地家用場景。
One More Thing
當然,對于智元今日的人才大新聞,背後還有一段傳奇佳話。
本科畢業于武漢理工的羅劍岚,實際也上演了一段 " 爽文男主 " 人生。
因為從中國一所 211 大學本科,能夠拿到 UC 伯克利競争激烈的王牌專業 offer,并且碩博連讀,每年 5 萬美元獎學金!羅劍岚的故事堪稱傳奇,甚至被專門報道過。
據《長江日報》2015 年報道稱,當年 UC 伯克利的機器人方向博士生競争非常激烈,收到了全球 1500 份申請,而招生名額僅有 30 個,最後羅劍岚成功脫穎而出,還打破了紀錄——成為唯一一位被機器人和智能機器實驗室錄取的中國人。
在采訪中,羅劍岚坦承自己因為在科研項目中關注到 UC 伯克利分校卡澤洛尼教授領銜的實驗,其後有緣又在天津舉辦的機器人研究國際會議上,獲得了直接向卡澤洛尼教授發問的機會,并進一步在會後遞上了自己的簡歷,向教授明确表達:" 我想讀您的研究生 !"
卡澤洛尼也被年輕大學生的履歷吸引。據介紹,羅劍岚從大二開始就跟着武漢理工大學的導師田哲文做項目,發表了 4 篇核心期刊論文,參加全國和省級重大科研項目有 5 個,還獲得了美國數學建模比賽一等獎。
卡澤洛尼教授給他的回答是:" 或許我能有機會讓你到伯克利來。"
也正是這句認可,點燃了羅劍岚心底的火苗。
回到武漢後,他又花了大半年時間,利用别人打遊戲的時間,啃下了卡澤洛尼教授實驗室發表的 100 多萬字的學術資料。
其後 2014 年 8 月,羅劍岚更是上演了一段 " 孤身飛赴韓國追教授 " 的瘋狂。
他查到卡澤洛尼教授将赴韓國參加一場有關機器人的國際會議,随即辦好籤證就追了過去。并在貴賓室外,等到了卡澤洛尼教授如廁的機會,再次表達了希望跟随讀研讀博的想法。
卡澤洛尼記得羅劍岚:哦,你住在首爾?
羅劍岚回答:不!我住在中國武漢,我來這裡見您,就是希望讀您的研究生!
而且也是在這次會議上,羅劍岚的半年苦功也換來了回報,他獲得提問機會,把幾個月來的思考化成幾個刁鑽的問題抛給了教授,卡澤洛尼會後再次找到他給出認可:" 小夥子,不出意外,我想,我要把你帶到伯克利。"
于是回國後,羅劍岚繼續與卡澤洛尼教授聯系,并附上自己的思考,通過電子郵件給對方發了過去。卡澤洛尼教授告訴他:你寫的每篇綜述我都看了七八遍,我不敢相信這是一位來自中國的大學生所寫。
而也是在卡澤洛尼教授力薦下,羅劍岚在 2015 年夏天收到了加州大學伯克利分校的 offer。
機器人和智能機器實驗室,每年 5 萬美元獎學金,從全球 1500 份簡歷中脫穎而出,成為了當年唯一一位被該頂級實驗室錄取的中國人。
參考鏈接:
[ 1 ] http://auto.whut.edu.cn/xyh/xywh/201912/t20191227_429864.shtml
[ 2 ] https://x.com/physical_int/status/1894829058883731962
[ 3 ] https://agibot-world.cn/collaboration
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
速搶席位!中國 AIGC 產業峰會觀眾報名通道已開啟 ♀️
首批嘉賓曝光啦 百度、無問芯穹、數勢科技、生數科技、像素綻放等十數位 AI 領網域創變者将齊聚峰會,讓更多人用上 AI、用好 AI,與 AI 一同加速成長~
4 月 16 日,就在北京,一起來深度求索 AI 怎麼用
一鍵星标
科技前沿進展每日見