今天小編分享的互聯網經驗:聯想創投合夥人王光熙:人形機器人的市場預期,短期過于樂觀而長期過于悲觀,歡迎閲讀。
當大模型成為移動互聯網之後的下一個產業周期後,人形機器人也開始成為承載這一技術的典型產品之一。
公開數據統計,2023 年國内人形機器人領網域共有 19 起融資,披露融資總額達 26.7 億元,同比增長 65.5%。2024 年上半年,國内的人形機器人投融資事件已達 13 起,融資總金額超 25 億元。在參與投資的機構,有經緯創投、峰瑞資本、紅杉中國等風險投資機構,也有聯想創投、上汽、小米這樣的產業資本,還有亦莊創投、浙商創投等政府資金入場。
可以説,與上一波的自動駕駛創業潮類似,同樣短期内還看不到商業化可能的人形機器人賽道上,為了搶到下一個時代的入場券,資本也開始了早期的密集押注。而不同是,相比自動駕駛而言,各地政府和國有資本進入人形機器人產業的程度更深、節奏也更快。
" 政府層面如此深度地參與這樣一個早期行業,确實是在十年前的自動駕駛創業潮中未曾出現過的現象。"
聯想集團副總裁、聯想創投合夥人王光熙對钛媒體 APP 表示,至于其中原因,一方面與整個資本市場的環境變化相關。近幾年,國有資本在新興產生產力相關的一些創新領網域,開始扮演越來越重要的角色。
另一方面,人形機器人是一個非常早期的行業,也是一個跨領網域的復雜系統工程——從 AI 軟體到硬體,再到應用場景,整個價值鏈的鏈條非常長。這就導致單一的機構,很難像政府部門那樣,湊齊那麼多的資源來支持產業的發展。
王光熙認為,在人形機器人這個非常早期的行業中,政府出來做一些事情還是非常有價值的。而作為本輪人形機器人的資本參與方,聯想創投也投資了諸如星動紀元、逐際動力等人形機器人領網域的熱門公司。
" 人形機器人領網域的早期投資,很關鍵的一點要看創始人是否具有極強的跨領網域研發能力。也就是 AI 時代原生的具身智能科學家,而不是原來做了多年的機器人控制或者視覺算法,現在大模型火了,出來學着做具身智能的人。"
王光熙稱,人形機器人領網域的創業團隊,需要有對前沿技術的理解和突破能力,然後将最前沿不同領網域的工具融會貫通,這樣才能做好整體的技術架構。
在王光熙看來,現在市場對于人形機器人的預期,短期過于樂觀而長期則過于悲觀。短期内,有些人期待着人形機器人很快就能下場幹活,進入產線甚至家庭生活。但目前這個行業的現狀是,至少需要兩到三年才能夠在部分技術領網域有一些長足的進步和突破。
而從長遠來看,有觀點則認為人形機器人泛化能力的突破看不到希望,從仿真訓練到實際場景的遷徙存在巨大鴻溝。但其實人形機器人從發展到成熟的過程中,存在着大量的中間狀态,在不同的可控環境和可控場景裏面,人形機器人可以幹各種各樣的事情。
以下是钛媒體 APP 與王光熙的獨家對話内容,略經編輯:
自動駕駛在發展早期時,政府的傾向可能是先讓企業在前面跑起來,然後在後續制定相關的政策。但人形機器人這波創業潮中,政府層面相對更靠前進入,包括引導基金參與投資或者各地成立創新中心。你是怎麼看待前後兩次創業潮中,政府相關部門的角色變化?
王光熙:你的觀察是對的。
自動駕駛本質上還是基于百年汽車工業,有一套已經非常成體系的產業生态,有成熟的規則,可以依托于成熟的產業去做增量試驗。因此,政府部門可能也沒有必要在產業發展特别早期的時候,就參與進來。
相對于自動駕駛而言,人形機器人是一個技術難度更高的行業,未來潛在的應用場景也非常廣泛,涉及到工業、物流、服務業,甚至是個人消費,牽涉社會的方方面面。而且,它還是一個跨領網域、復雜的系統工程。從 AI 軟體到硬體再到應用場景,整個價值鏈的鏈條非常長。
這就導致單一的機構,很難像政府部門那樣,湊齊那麼多的資源來支持產業的發展。這個時間點,政府出來做一些事情,還是比較合情合理的,也是非常有價值的。
此外,整個資本市場跟十年前相比也有了一些變化。國有資本在最近幾年,尤其是跟新興產力相關的創新領網域,開始扮演越來越重要的角色,引領作用會越來越強,這确實在十年前是沒有的。
在各地政府部門參與人形機器人發展的過程中,你認為那些城市會有比較大的優勢?
王光熙:根據我們有限的了解,各個地方的方式不太一樣,很難評價哪個方式更好。
以江浙滬地區為例,它本身的產業體系就很豐富,從 AI 到半導體算力再到規模化制造能力,都有比較全的供應鏈。同時,江浙滬地區的商業化比較發達,大家很會做生意。所以,他們做這件事是奔着能夠商業化的目标去的,主導權更多是在企業。
北京這邊可能不太一樣,整個制造業相對比較少,但是優勢也很明顯,就是 AI 人才密度很高,還有高校和互聯網大廠的資源。北京的政策是屬于提綱挈領型的,通過建立框架性政策指導,構建平台型的產業技術生态。
對于人形機器人這樣一個過于早期的行業,供應鏈的集聚效應,算不算是一個明顯優勢?
王光熙 : 當然是。
機器人目前很多的零部件都不是新的,對于汽車零部件的復用度非常高。新能源汽車在最近十幾年突飛猛進的發展,讓中國在電機、電控、電池的產業集中度非常高。同時,汽車行業的激烈競争,也讓零部小型化、安全性和能量密度快速提升,這些零部件很大比例可以在人形機器人本體上復用。
除了本體之外,現在主流觀點會把人形機器人其他技術抽成大腦、小腦兩個部分,這兩個領網域的技術發展又是怎樣的?
王光熙:我其實并不喜歡這種分類方法,比如小腦代表的是控制,大腦代表的是感知理解,這樣會把這個事情變得很割裂。從未來的終局來看,人形機器人可能會越來越像是一個高度融合的端到端模型,這種純模型驅動的方式成功概率比較大。
其實就跟人一樣,人的行為邏輯并不是先坐在那兒,然後想做一件事情,大腦先把它全計劃完,然後把這個計劃輸出給小腦,讓小腦接收到一堆指令,最後出現各種動作。人類行為的本質,是高度連通的神經網絡,條件反射型的自主動作,有些是直接通過小腦進行運動控制。
所以,在目前人形機器人的基本形态都還沒有完全确定的情況下,分别去研究大腦和小腦的技術,其實也不太現實。
這有點類似于特斯拉的 FSD。FSD 出現之前,大家會認為要實現自動駕駛需要安裝多少個雷達,多少個傳感器。但 FSD 出現之後,就把之前的感知、推理、決策邏輯,完全推翻了。通過基于神經網絡的端到端模型,FSD 能實現更好的強化學習效果。
但這裏面有一個問題,特斯拉 FSD 的成功,是基于長周期、大量的汽車訓練數據得來的。如果純靠模型驅動,人形機器人各種維度的數據應該怎麼獲得?相比于特斯拉 FSD 所需要的數據量,人形機器人大模型的數據量是不是更大,獲得難度也更大?
王光熙:不一定。
FSD 出來之前,雖然特斯拉有了十多年的數據,但這些數據的對于純模型驅動的 FSD 而言,價值沒有那麼高,此前投入大量精力做的數據标注工作可能都是白做的。你可以理解為,FSD 不是因為特斯拉有了此前十年的數據量才能做出來,而可能是因為基于神經網絡的端到端模型,基于近期更高質量的數據和現有的硬體框架,才有了 FSD。
對于人形機器人的數據,現在學術圈也在探索,怎麼用更高效的方式來獲取數據和融合多種類型的數據。這些數據中,有些可能是機器人在真實場景中的訓練數據,有些可能是從模仿學習得來的數據,有些可能是用高質量的仿真環境訓練出來的數據,不一而足。
但總的來説,想要實現人形機器人的通用化,這些數據的需求體量也沒有想象中的那麼巨大,因為機器人運動控制的精度和靈敏度也不需要那麼高。
和自動駕駛不一樣,一個成熟的自動駕駛產品需要做到人類司機差不多的事故率,甚至更低。但對于通用人形機器人而言,它不一樣要和人類同等水平或是超越人類水平,它可以有很多中間狀态,基于不同等級的通用水平,可以在不同的場景做更多的事情。
這是不是也意味着商業化可能也沒那麼難?
王光熙:我覺得對于商業化,短期内大家都過于樂觀,但是長期又都過于悲觀。短期内,大家恨不得他明天就啥都能幹。但長期來看,它能幹還能幹好,還便宜,這又很難且區别很大。比如,如果一個幹活能力很強的機器人售價 100 萬,你會買嗎?可能不會,因為如果多雇傭幾個人,算上增加的成本,可能還是人更便宜。
對于端到端的這種模式,還有一個問題是如果大家都往這個方向走,也都采用類似的傳感器、關節、電機電控,那麼最終決定產品差異的是什麼?
王光熙: 雖然大的框架都差不多,但對于框架的理解差别還是挺大的。比如同樣做強化學習、仿真訓練,做得好與不好,差十倍都有可能。再比如在傳感器方面,比如力控傳感器或者觸覺傳感器,過去的行業積累都很少。所以,從傳感器到底層算法再到多模态數據懸鏈,這個過程中產生的差異會非常大,這也會導致機器人的泛化能力和适用場景也會差異巨大。
所以,對于人形機器人公司的投資,您最看重的是什麼?
王光熙: 能否有極強的跨領網域研發能力,這點是非常重要的。人形機器人行業有着大量需要拓荒的地帶,這個時候創始團隊需要有對前沿技術的突破能力,以及能夠将最前沿不同領網域的技術融會貫通,這樣才能做好整體的技術架構。
同時,要看這個人是不是 AI 時代原生的具身智能科學家,而不是原來做了多年的機器人控制或者視覺算法,現在大模型火了,出來學着做具身智能的人。如果只是一個商業化的團隊,出來就跟你説我明年就能商業化閉環,就能賣多少機器人,那都是在吹牛。目前這個行業的現狀是,至少需要兩到三年才能夠在部分技術領網域有一些長足的進步和突破。(本文首發于钛媒體 APP,作者 | 饒翔宇 編輯 | 鍾毅)