今天小編分享的互聯網經驗:談談“機器人創業”圈子裏的鄙視鏈,歡迎閲讀。
作者丨邱曉芬
編輯丨蘇建勳
2024 年,雖然大模型掀起的 " 具身智能 " 創業潮還沒多久,但在「智能湧現」訪談過數十家機器人公司後,我們發現一條圈子裏的 " 鄙視鏈 "。
"搞軟體的,鄙視搞硬體的,搞大模型的,看不起強化學習的",多位行業人士給出了類似的觀察。
認知的不同,決定了機器人創業者的入局姿勢。
英諾天使基金合夥人王晟向智能湧現表示,國内湧現出的幾百家機器人創業公司中,大概有三類基因:
一是原來機器人出身的創始團隊,更關注機器人硬體能力,主要圍繞控制和電機。本體派的核心是機器人本體(人形 / 四足狗),其次是機器人的臂或關節。
二是軟體背景的團隊,更關注機器人的智能化和泛化能力,但 " 軟 " 還可以進一步細分:
一批是上一波 AI 熱潮中的創業者,轉型至機器人領網域,比如CV、強化學習;另一批則是真正大模型背景的玩家,這波人更少,處于鄙視鏈頂端。
"看不上國内那些搞硬體的公司。" 一家具身智能大腦公司創始人對智能湧現直言。在他看來,軟體才是機器人發展的卡點,但目前硬體公司在 AI 軟體上的預算太低," 只是簡單接接國外開源的大模型 "。
宇樹科技是典型的 " 硬體派 ",其創始人王興興曾在一次公開采訪中回應過這一點——他們對于 AI 的投入很克制,因為太燒錢了," 機器人才是我們的立身之本 ",他甚至直言," 歡迎客户用我們的硬體,哪怕把我們的軟體全删了 "。
一位機器人硬體公司人士無奈表示,目前機器人在 " 軟 " 的方面還沒收攏共識——行業存在太多的技術範式和路線,大腦和小腦的邊界是什麼?具身智能到底怎麼做?目前行業還很混亂,留有很多問号。
宇樹 Unitree G1
而 " 軟硬之争 " 的結果是,國内大部分硬體公司,還在用傳統的硬體思維來做機器人,對于 " 腦 " 的運用只是蜻蜓點水;而大部分做 " 腦 " 的公司,則選擇自己從頭開始做一個硬體。
各自為政,行業呈現出一種隐約的割裂狀态。
大模型,還沒辦法 " 賦能 " 機器人
"現在搞硬體的公司,就是視頻拍攝公司!" 多位投資人、行業人士向智能湧現表示。
今年以來,許多機器人廠商在 demo 裏展示的場景足夠酷炫:比如機器人可以在汽車工廠搬東西,幫忙分揀貨架商品,給人一種 AGI 時代機器人照進現實的感覺。
但實際情況卻并非如此。
一個完美 demo 的幕後往往是:若拍攝一個機器人從抽屜裏抓水杯的場景,比如訓練的時候是早晨,到拍攝的時候天黑了;或者訓練時抽屜裏多擺了兩個杯子、抽屜位置挪動了——這些細枝末節一改變,都可能導致機器人任務失敗。
" 有的 demo,甚至一萬次才成功一次,(視頻裏)不誠實的情況非常嚴重。" 一位行業人士表示。
但你可能會疑惑,大模型在手機、電腦各類終端上已經足夠智能,為何無法讓機器人大腦變得更聰明?以至于讓硬體公司們需要在 " 完美 "demo 上如此努力。
figure 02
據智能湧現了解,目前大部分硬體公司對大模型的理解和應用并不深入——基本只是簡單接入國内外通用語言大模型。但實際上,大模型與機器人真正需要的 " 空間智能 ",還有很遠的距離。
多位行業人士向智能湧現表示,語言大模型的數據量越大,反而更容易產生 " 幻覺 ",幹擾任務執行。" 語言大模型和機器人落地一點關系都沒有,區網域任務上的成功率,慘不忍睹!"
而前述具身智能大腦公司創始人表示,目前國内沒有一個團隊真正從機器人出發,去做适配具身智能的大模型。
此前,機器人行業的一項解決方法是,在多模态大模型和機器人身體之間,引入一個中間層 " 小腦 " ——它的作用是承上啓下,存放多項 " 子任務 "(比如把 " 讓機器人衝咖啡 " 任務拆成 " 拿杯子 - 磨豆子 - 衝水 " 等多項子任務),供大腦調配,也讓機器人身體能讀懂并且動起來。
但新的難點又出現了。一方面,小腦的引入,意味着機器人廠商們需要在其中預設無窮無盡的子任務,若遇上復雜的任務,各個子任務還需要再進一步拆分。
另一方面,數據匮乏則是更艱巨的難題。目前,政府和一些公司已經投入大量資源進行集中訓練,但多位行業人士表示,效果并不理想,因為大家既不清楚應該收集何種數據,也不知如何界定優質數據的标準。
以抓杯子的場景為例,理想狀态下的高質量數據應該是,拿一個機械臂控制它從頭到尾做一遍,告訴他——抓杯子要怎麼抓,當任一場景變化了,又要怎麼抓。但這也意味着,一個簡單抓取的動作,就需要幾千萬條、甚至幾億的數據。
當大家懷揣着 " 大模型改變一切 " 的心态闖進機器人領網域,才發現中間的 gap 遠比想象的更大。
一場集體糾偏
從行業的角度來看,割裂的狀态并不健康,而如今的投資人、產業玩家們,正在出現一場關于 " 糾偏 "。
2024 年下半年,機器人行業的投資風向隐秘出現變化。王晟告訴智能湧現,在 2024 年前,很多投資人粗淺認為,投機器人 = 投資人形機器人硬體。
在過去的一年半,人形機器人公司烈火烹油,估值飙升。據智能湧現了解,以宇樹科技、智元機器人為例,兩家炙手可熱的機器人硬體廠商,近兩年連續完成數輪融資後,估值雙雙邁過 10 億美金大關," 貴到大家投不起 "。
智元遠征 A2-max
而彼時,國内眾多專攻機器人小腦 / 大腦的公司,則面臨融資困境,有一些甚至需要重新思考如何向市場講故事。
" 今年下半年以前,我們和投資人講,做機器人統一大模型、講端到端,誰信呢?" 前述機器人大腦公司創始人告訴智能湧現—— " 但是今天你不講端到端,都不好意思出門了 "。
投資風向直至今年下半年,出現逆轉。
一家做人形機器人關節的公司創始人向智能湧現直言,今年以來,明顯感覺純做硬體的初創公司很難拿到大筆融資了,"市場有點冷"。
而從近期消息面上看——在海外,Skild AI、Physical Intelligence 成立短短時間内,估值飙升至百億;在國内,不久前機器人小腦公司「星海圖」拿到螞蟻投資,大腦公司「自變量」、「千訣科技」也先後拿到融資。
"現在投資人從投人形,改投具身智能了 ",王晟向智能湧現表示,因為大家現在意識到,具身智能才是更好機器人驅動完成泛化任務的關鍵。
反思不止是在投資層面,一波硬體廠商也開始集體復盤過去的模式——在以前,機器人廠商更多是在專用領網域裏收集數據,再去做專用的場景,大家信奉 " 通用,就是沒用 "。
如今,雖然大模型還沒辦法真正用起來,但它給這一派創業者的啓示是,或許要先學會忘記專項場景,先構建通用的基礎模型能力,再在上面長出專用的能力——這或許才是系統解決通用性的關鍵。
機器人領網域的軟硬之争,暴露的是,在 AI 的衝擊下,機器人行業目前還處于一種共識尚未彌合的混沌狀态。但不确定性中的确定是,機器人的終局是硬體與具身智能的結合,軟硬體缺一不可。
" 無論是從軟體出發還是從硬體出發,大家的終局是接近的,就看誰的商業效率更高 ",一位行業人士表示," 而 AGI 時代的機器人公司,本質上需要夠既懂 AI、又懂硬體的團隊。但更關鍵的是,大家還要相互認同 "。
(本文圖片都來自官方渠道)
end
>