今天小編分享的科技經驗:這些大專生,教出人形機器人,歡迎閱讀。
中國人形機器人賽道最近 " 好消息 " 不斷。
前有深圳的眾擎機器人完成全球首例前空翻,後有杭州宇樹科技機器人實現 720 度回旋踢。3 月 11 日,前華為天才少年 " 智晖君 " 創立的智元機器人,發布了人形機器人靈犀 X2。在視頻裡,機器人不僅可以像人一樣走路、跑步,還能玩滑板車、騎自行車。
人們正通向 " 機器人養老 " 的美好願景,而現在,一個新工種随着具身機器人的火爆而出現。在 Boss 直聘、實習僧等求職 APP 上,一些公司正招聘學歷要求大專以上,名叫 " 機器人數據采集員 " 的崗位。
在 Boss 直聘等求職 APP 上,一些公司正招聘 " 機器人數據采集員 " 的崗位
這份工作的主要内容包括:負責機器人數據采集工作、控制機器人正确移動、保護機器人處于安全狀态,等等。
除此以外,很多崗位還列出了對人的外形的要求,有的是," 不戴眼鏡,沒有高度近視 ";有的要求 " 男生身高 170-175,體重 65 公斤以内;女生 160-168,體重 55 公斤内 ";還有的公司要求," 不能有小肚子,身體協調性較好,細心、靈活、有控制力 "。
這些崗位成功引起了眾人的注意。人們不禁好奇:機器人的數據采集員,會是一份什麼樣的工作?這個問題的答案,關系到了人形機器人的技術路徑和當下的阻礙。更本質的問題是,機器人實現智能的背後,會像 AI 倚賴數據标注一樣," 有多少人工就有多少智能 " 嗎?
重復性新工作
薪資 100 元~240 元 / 天,在社交媒體上,關于機器人數據采集員的兼職、全職工作正在火熱招聘中。
上海的 "90 後 " 張謙看到了這樣的趨勢,近半年來一直在給 " 數據采集崗 " 投遞簡歷。事實上,她在一家經濟貿易公司有全職工作,但在 AI 浪潮下,她愈發感到危機降臨,想轉行到一個代表未來的行業。
具身機器人賽道就是她瞄準的方向,而數據采集員就是其中最簡單的跳板。"門檻低,這是我投數據采集員最主要的原因。畢竟 AI 等未來產業,許多崗位都是招工程師,對代碼或硬體知識有一定要求。" 她對鹽财經說。
她同時感到這類工作是有趣的。" 有些數據采集工作會模拟真實作業環境。數據采集員穿動捕服,戴 VR 眼鏡第一視角模拟機器人完成任務。感覺很像遊戲。" 只是,投遞了多份簡歷後,她仍未收到一份有效回復,轉行之夢離她仍有些遙遠。
而正如張謙所感受的,機器人數據采集崗的工作内容,與遊戲 3D 動畫有相似之處。多位業内人士告訴鹽财經,訓練機器人時,他們都運用了與遊戲 3D 相似的動作捕捉技術。
所謂的動作捕捉,即通過人類穿戴各種設備,測量、跟蹤、記錄人的運動軌迹,再經過計算機處理,得到三維空間坐标的數據。當數據被計算機識别後,人體 3D 技術可以應用在動畫制作、步态分析,生物力學、人機工程等各個領網域。
事實上,業内人士都清楚,這波數據采集員的招聘熱,最早是由全球頂尖機器人公司帶動的。2024 年 8 月,特斯拉率先為旗下 Optimus 人形機器人招募數據采集操作員(Data Collection Operator)。據介紹,其工作内容為穿戴動作捕捉服和 VR 頭盔,每天沿着測試路線行走 7 小時以上,身上同時攜帶最多 30 磅(13.61 千克)的重物。
與此同時,該崗位還要求采集員身高在 170~180 厘米之間,因為該職位需要穿上特制動捕服,身材要與機器人相似。采集員需要穿戴設備,在工作過程中站立、坐下、行走、彎腰、伸展、蹲伏和扭轉身體。
特斯拉還給這群數據采集員提供了有競争力的薪酬:每小時 25~48 美元(約人民币 180~342 元),以及股權刺激。
相似的大型招聘同時在上海開啟。2024 年 6 月,智元機器人在上海建立了一座面積 3000 平方米的數采工廠。公開視頻顯示,在這個工廠裡,人需要通過在胸前佩戴 VR 設備等進行數據采集,比如,人佩戴設備教機器人疊衣服。
智元機器人具身產品線總裁姚卯青對媒體介紹,數采廠模拟了家庭、零售、服務業、餐飲、工廠的五個場景,未來将源源不斷為機器人學習提供數據養料。去年數采工廠僅投入使用兩個多月,就采集了超百萬量級真機數據集。
" 不久後我們将擁有超千萬條數據。" 姚卯青笑着對媒體介紹道。
從大廠的争相布局和落地來看,真實數據正成為機器人行業的一道門檻。唯一的問題是,機器人數據采集員門檻究竟高嗎?
鹽财經記者以求職者身份,試圖聯系多個招聘機器人數據采集員的科技公司。來自深圳某科技公司的招聘經理張女士表示,數據采集員多數是臨時性的崗位," 我們有較大數據需求才會招人 "。
" 我們一般招的是大專生,或者外包的臨時工,做的是短期一兩個月的工作。"
據她介紹,機器人數據采集工作技術難度不算高,每天,采集員需要穿上一套設備,重復性地做某類任務。比如,為了訓練機器人學習拿礦泉水,采集員需要在桌子前反復完成拿礦泉水的動作," 如果數據需求大的話,可能一個星期都要重復做這一個動作 "。
" 當然,這個工作崗位也是有一定門檻的。" 張女士說。
" 倒不是技術專業背景的門檻,我們想要比較聽話、(身體)靈活的人。"
人類老師的重要性
數據采集員的招聘一定程度上反映了機器人行業的變化。國内動作捕捉廠商、NOKOV 度量動捕負責人告訴鹽财經,近兩年,随着人形機器人為代表的具身智能在國内火熱,機器人產業對動作捕捉的設備需求也随之大增。
為什麼是近兩年的需求增長?該負責人介紹,這是因為人形機器人要求精度更高的人體運動數據。相比于電腦模拟的理想仿真環境而言,由人采集回來的真實數據,可以兼容更多的随機性和意外。
舉個例子,他說,機器人在遇見凹凸不平的地面時,因為機械機構的原因,很容易摔倒。但是,如果是人在面對一些崎岖地面或者突發狀況時,人體本身可以自适應,很快能自己調節過來。
機器人資深從業者、北京某高校學者孔博士也告訴鹽财經,機器人行業對真實數據的需求,是随着這兩年 AI 大模型技術的發展而興。一個典型标杆是特斯拉人型機器人的 Optimus,采用端到端的技術,試圖通過給機器人喂大量的數據,從而訓練出具有通用能力的機器人。
此外,Transformer 架構、VLA(Vision-Language-Action)的發展和應用,讓機器人行業對數據的要求又增加了,如今,業界亟需精度高、質量佳的數據。
當下,來自業界一個共識是," 人類老師 " 對機器人的能力增長必不可少。上海通用機器人公司傅利葉生态拓展負責人周斌告訴鹽财經,人類采集的數據可以反映真實世界的復雜性。比如在訓練機器人時,周斌說,他們會首先運用仿真數據進行預訓練和初調;接着,再使用人類采集的高質量數據,進行多次精調," 這樣可以确保部署到真實物理世界的性能和效果 "。
這一過程,智元具身研究中心常務主任廣輝也曾打過一個形象的比方。他以學習乒乓球為例,一般我們要通過圖文、看别人打球或看比賽等方式,先了解基礎或理論,再去訓練場通過發球機或者和别人打球簡單模拟。" 如果要有更高要求,還要找教練一對一手把手教學。"
總的來說,人類老師就是機器人的 " 一對一教練 "。一對一教學的最終目的,是為了讓機器人更像人類。
不可或缺的 " 上肢 " 力量
除了确保與真實世界相符,機器人的 " 一對一教練 " 還有一個更重要的功能。孔博告訴鹽财經,目前機器人行業一個最大的難點是上肢力量。
相比于人類教學,當前行業内還有一個更主流的方向,叫強化學習。這是一種在仿真環境下通過試錯(Trial and Error),讓機器人學習做出最優決策的方式。
他舉例:" 通俗的理解,強化學習就像喂一個小狗,這個小狗它做對了,我就獎勵它,他做錯了,我就懲罰他。強化學習本質就是一個獎勵函數。"
這一獎勵最佳路徑的方式,如今被發現能較好地訓練機器人走路、跑動等運動自平衡能力。孔博将其形容為機器人的 " 下肢力量 ",他稱,業内主流的宇樹科技等公司,都是運用強化學習訓練的。
" 但現在人形機器人最讓人期待的使用上肢,去幹具體的事," 孔博告訴鹽财經," 它不應僅僅是個玩具,它要成為一個生產力,去工廠幹活,去商店買東西,最終進入家庭,成為機器人保姆。這裡的關鍵是在上肢。"
不過,與公眾的期待仍有差距的是,孔博說,在實踐中,訓練機器人的上肢比下肢要難得多。而且,上肢訓練在仿真環境下,通過強化學習訓練得到的效果較差。
因此,多數機器人公司需要通過動作捕捉、遙操作等方式,讓機器人觀察人類演示後,遷移到自己本體上(尤其是上肢動作)去執行任務。這在機器人行業内,叫做模仿學習。
國内專注于機械臂和機器人本體的廣東某機器人技術總監告訴鹽财經,機器人獲取 " 上肢 " 力量之所以難,其實是難在機器人的 " 控制 " 端。
相比于移動、平衡小腦等類似于人類小腦的功能,機器人 " 大腦 " 控制端需要面對各類復雜的物理場景。這很難通過獎勵函數,在仿真環境中大規模訓練就可以得到好的效果。
他舉例,即使是簡單地使用機械臂,實施抓取動作,也面臨着復雜的狀況。" 理想的仿真環境都是存在系統誤差的。(例如)在真實世界裡,機械臂在運動過程中,會因為重力因素存在抖動狀況。這些誤差怎麼去模拟出來,這是一個難題。"
因此,在操作端,該技術總監表示,還是人類在真實場景下進行數據采集,手把手教學的效果最好。" 真實的數據是最直觀的,雖然在目前的成本是最高的,但是在訓練大模型時候,效果是最好的,也更容易進行參數調優。" 他說。
與此同時,他強調,人工采集數據,不僅是簡單的采集,還包括上遊的環境搭建、下遊對數據的清洗和審核,這些步驟都需要大量的人力。
從這個角度而言,機器人行業也屬于 " 有多少人工,就有多少智能 " 的勞動密集型工作。
數據争霸
從招聘 APP 的熱門崗位可以看出來,機器人行業正在經歷與 AI 一樣的數據 " 危機 " ——在 AI 行業裡,數據被稱為石油。OpenAI 公司聯合創始人兼前首席科學家伊利亞 · 蘇茨克維爾 2024 年曾公開警告,"AI 的訓練數據如同化石燃料一樣面臨着耗盡的危機 "。
傅利葉負責人周斌對鹽财經表示," 真實場景下的機器人動作數據在行業内一直是個瓶頸,因為它的采集成本非常高,很多數據的标注精度也不夠。高質量數據的缺失,是制約機器人發展的一個主要卡點。"
相較于自動駕駛而言,周斌介紹,機器人行業對數據的需求和要求也高得多。" 就像特斯拉的自動駕駛技術,需要有海量的數據才能訓練出來。但汽車需要控制的變量其實并不多,無非是加速、減速,轉向。"
相比之下,周斌說,人型機器人至少有三四十個自由度的數據輸出," 它背後的數據集的需求非常巨大 "。
與此同時,在 AI 大模型的浪潮下,如今機器人行業迎來了全新的目标——追求通用性。孔博告訴鹽财經,機器人行業一直以來很難突破的地方是,機器人只能完成特定場景下的特定任務。
" 過去的技術一直只适用于固定的結構化場景,它的位置姿态都是固定的。" 孔博介紹," 比如,一個立方體在桌子上,機器人可以去抓取。但是如果讓它去拿一個水果,或者擇菜,他就搞不了。"
大模型和具身智能火了後,上述多家機器人公司負責人都對鹽财經提到,他們追求的是讓機器人具有泛化性,意思就是,機器人可以同時完成多種任務,适用于多種場景。這就需要機器人擁有認知物理世界的 " 智慧 " 大腦。
而形成智能的關鍵,首先依賴大量高質量的數據,對機器人的 AI 算法進行訓練。
不過,多位業内人士也承認,目前在機器人的數據上,仍存在許多不确定的因素。比如,當前各家機器人公司的形态、技術路徑都不一樣,導致了采集的數據形态不一,很難實現通用。
此外,真實世界因為存在過多的變量,例如光照因素、物理因素等等影響,需要采集的數據量也變得無窮大。而對于采集大量數據後,機器人能否擁有預想中的泛化性和通用性,目前還是未知數。
" 目前來說大家都傾向于相信(具身智能)這個方向可以,但是究竟能不能行,目前還是有待觀察。" 孔博士總結。相比于 AI,多重學科交叉的機器人還處在產業爆發的初期,前方仍有很多不确定性。
而當下,處在爆發期的機器人行業,也逐漸形成共識:各企業共同打造開放共建的生态,推動機器人數據共享。3 月 12 日,智元機器人攜手上海人工智能實驗室、國家地方共建人形機器人創新中心等機構,發布全球百萬真機數據集開源項目 AgiBot World。3 月 17 日,傅裡葉也正式開源全尺寸人形機器人數據集 Fourier ActionNet。
" 如何解決數據(緊缺)的問題,我們認為首先需要一個更加開放共建行業的生态。" 周斌總結道," 這不是說是一家公司能夠實現的,應該由企業、研究機構共同努力,參與數據的貢獻與算法的優化。"
可以肯定的是,真實的人類動作數據正在被機器人企業所珍視,成為未來一大段時間的 " 石油 "。眾多機器人企業也将依靠着一名名 " 大專生 ",一遍遍完成最簡單的人類行為,等待機器人行業的 ChatGPT 時刻降臨。
(應受訪對象要求,文中張謙、孔博為化名)