今天小編分享的科技經驗:字節要造機器人,張一鳴鼓勵把目标定得大一點,“1000 台有點少”,歡迎閱讀。
字節管理層問:" 為什麼特斯拉要搞 100 億台,我們只搞 1000 台?"
文丨張家豪 程曼祺
編輯丨程曼祺
《晚點 LatePost》獨家獲悉,字節機器人團隊已有約 50 人,計劃年底擴充到上百人,并生產一些服務字節自己的電商履約需求,能在倉庫裡分揀、打包貨物的機器人。
字節機器人團隊目前隸屬于字節 AI Lab,其負責人是 AI Lab 總監李航。李航曾擔任華為諾亞方舟實驗室主任和首席科學家,2017 年加入字節,現在向字節副總裁、算法技術負責人楊震原匯報。
字節跳動的機器人探索始于 2020 年,當時字節跳動創始人張一鳴對機器人表現出興趣,此後會不定期參與機器人項目讨論。
約一個月前,張一鳴與字節跳動 CEO 梁汝波、算法技術負責人楊震原、字節跳動產品和戰略副總裁朱駿,和曾任字節戰投負責人,現任集團戰略負責人的趙鵬遠一同參與了和 AI Lab 機器人團隊的讨論。
與以往不同,這次會議的目的是探讨字節機器人的產業化落地方向與計劃。此前,字節對機器人的投入以技術嘗試為主。到 2021 年底,團隊只有十餘人,2022 年之後開始逐漸增加投入。
這次讨論中,張一鳴鼓勵團隊不妨把目标定得大一點。
會上有機器人團隊成員提出:機器人行業的商業化門檻是 1000 台,可以此為產業化目标的參考。張一鳴、朱駿等一些參會管理層的反饋是 "1000 台有點少 ":" 為什麼特斯拉要搞 100 億台,我們只搞 1000 台?"
楊震原在這次讨論中提到,做機器人無非三種可能性:一是追求在技術山頂上插杆旗,就像波士頓動力那樣做出一個技術領先的原型;二是用現有的相對成形的方案服務字節的内部需求;三則是用相對成熟的方案對外找客戶,把規模做大。
總結這一輪讨論中字節管理層的想法,他們認為現在字節做機器人,應該:
1 跟已有業務做結合,服務好場景和行業;
2 探索大模型與機器人的結合,追求技術領先性;
3 對人形機器人的商業價值要進一步觀察。像波士頓動力這種做了 30 年還不盈利的行為,可能不适合字節。
近期,字節機器人團隊再次讨論了業務方向,目标更明确了,分為兩大部分:
一是生產一些機器人,優先服務字節的電商履約需求;二是關注前沿技術,探索把 AI 大模型能力用到機器人上。
電商履約是指在電商交易完成後,平台把貨物送到消費者手中的過程,它涉及倉儲裡的分揀、組貨和打包,以及物流環節。
字節現在已建立了一些自營倉庫,主要服務字節電商中的抖音超市,抖音超市占字節電商業務的比例還很小。字節想用機器人代替人類完成揀貨、搬運和打包等過程。中國的人力成本現在不算昂貴,但使用機器人還有其它好處:它更能應對大促、爆品銷量大增帶來的短時間倉儲工作量的大增。
由此推測,字節要做的機器人,可能是具備移動能力的、能在電商倉裡送貨的分揀機器人,以及帶有視覺感知能力、能自己打包貨物的機械臂。行業裡,前者的對标產品有亞馬遜的 Kiva,國内公司有極智嘉、快倉等;後者的對标公司有 Mujin(日本)、梅卡曼德、XYZ 等。
它也有可能是一種新的產品和方案。據了解,字節目前還沒有框定機器人的具體形态,形态最終取決于字節電商履約的需求。
字節目前并未确定今年制造機器人的具體數量目标。
對機器人的重視和投入增加,可能來自張一鳴和字節對 AI 新發展的思考。
《晚點 LatePost》曾報道,張一鳴近期時常會和一些字節人士分享 AI 論文學習心得和對 ChatGPT 的思考。從大模型開始,字節加大了對人工智能的研發投入,今年新向英偉達訂購了超過 10 億美元 GPU。GPU 是 AI 訓練必不可少的算力基礎設施。
機器人現在也被認為是 AI 大模型的重要方向,二者相互促進:大模型能為機器人帶來 " 常識 ";與現實物理世界互動的機器人,則能為 AI 發展提供新類型的數據。
在這之前,字節對機器人的探索相對克制:2021 年開始,字節 AI Lab 旗下的機器人團隊就曾嘗試過做樓宇服務機器人,它可以在辦公樓内送餐、送快遞包裹;同時該團隊也在字節之外尋找一些可能服務字節電商自營倉儲物流的機器人,但大部分方案都不太成熟,"ROI 算不過來 "。
從字節機器人團隊的組織架構也可看到,它過去并不以業務為導向。2016 年成立的字節 AI Lab 目前分為兩個大組:NLP(自然語言處理)與 Research,前者更多為字節的業務提供技術支持,而機器人屬于的 Research 組,并不直接支持業務。
2019 年以來,字節也陸續投資了一些機器人公司。如掃地機器人公司雲鲸智能,前發那科副總經理沈崗創立的盈合機器人,服務倉儲物流的迦智科技、炬星科技和未來機器人等多家公司,涵蓋家庭清潔、配送、物流、工業等多個領網域。
從左至右分别為雲鲸智能、炬星科技和未來機器人的產品。
這些機器人公司大多成立于 2017 年前後,共性是研發針對特定場景、解決特定問題的機器人,它們的產品因而形态各異。這是因為在此前一段時間的技術限制下,機器人無法做到真正通用,比如同一個機器人既能在工廠搬零件,又能送外賣,甚至幫你洗水果、切菜。
特斯拉在 2021 年宣布 Optimus 擎天柱人形機器人計劃後,行業風向開始改變。
Optimus 的目标是讓人形機器人替代人類完成一些危險、重復和無聊的工作。在特斯拉的演示中,Optimus 已能澆花、收拾桌子和搬運物品。今年特斯拉的股東大會上,馬斯克說未來人形機器人的需求是百億台,可能還不止。
特斯拉 Optimus,與目前大部分采用輪式移動的機器人不同,Optimus 采用了雙足設計,看上去更像人。
在馬斯克的大膽計劃後,大模型技術進展又為行業添了一把火。一些人開始相信通用機器人可能比預期中更快到來。
今年 5 月的 ITF World 2023 半導體大會上,英偉達創始人、CEO 黃仁勳在演講中提到,人工智能的下一個浪潮将是具身智能(embodied AI),即能理解、推理、并與物理世界互動的智能系統。
海内外的科技公司也都在嘗試把參數規模更大的 AI 大模型與機器人結合,打造更通用的機器人。
OpenAI 在今年 3 月投資了一家挪威人形機器人公司 1X Technologies,這家公司正在研發人形機器人。
1X Technologies 已開發出了輪式雙臂機器人 EVE(左),它的手部使用了雙指夾具(中),它們正在研發雙足機器人 NEO(右),從概念圖看,手部會采用靈巧手。
今年 6 月,Google 旗下 DeepMind 發布了 RoboCat,把大模型的能力應用到了機器人上,DeepMind 科學家 Alex Lee 在接受 TechCrunch 采訪時說:" 我們證明了一個單一大模型可在多個機器人實體上解決多樣化任務,并且可以快速适應新任務和機器人實體。"
今年以來,騰訊 RoboticsX 機器人實驗室也把 AI 模型應用到了機器狗上;在阿裡巴巴的通義千問大模型的支持下,用戶可在釘釘對話框直接以自然語言輸入命令,遠程指揮機器人。4 月,小米成立北京小米機器人技術有限公司;6 月,華為成立 " 極目機器 ",布局機器人與智能制造。
新一輪熱潮中起步的機器人項目和公司能堅持多久,還有待驗證。建立一個機器人團隊并穩步推進研發工作,需要巨大的投入,更大挑戰是訓練機器人的數據比訓練一般軟體 AI 系統的數據要稀缺得多。
OpenAI 首席科學家伊利亞 · 蘇茨克維(Ilya Sutskever)今年 4 月接受采訪時,被問到 OpenAI 放棄機器人是正确的決定嗎?他說 " 是的,我們那時真沒辦法繼續研發機器人了 ",如果要搜集優化機器人所需的數據,需要有一個龐大團隊來制造并維護機器人:" 制造 100 台機器人已是巨大投入,但即使如此,你也不會獲得很多數據。"
一名機器人從業者告訴《晚點 LatePost》,機器人的數據采集和自動駕駛類似,最直接的方式是用真實的機器人做各種測試去搜集數據,成本很高;另一個重要補充是以仿真技術,建設模拟的環境和各種情景(corner case)以獲得數據。目前運動控制方面沒有太多可用的高質量公開數據。這背後都對應着技術與資金的資源。
字節過去在硬體上的嘗試,并不如它的互聯網應用那樣成功,大力台燈和 VR 頭顯 PICO 是先例。大力台燈已不再發布新品,一度 1000 人的團隊至少有一半離開;PICO 今年一季度也經歷裁員,并下調 2023 年銷量預期至 50 萬台,比 2022 年的實際銷量縮水 50%。Meta 的 Quest2 2022 年銷量則超過 700 萬台。
字節不缺資源,它過去擅長大力出奇迹:定下目标後,調動人力、資金等全部可用力量在短時間全力衝擊。但硬體行業和前沿科技有另外的邏輯,它考驗耐心、韌性與認知,需要更長期的等待與堅持。