今天小編分享的科學經驗:首份空間智能研究報告來了!一文全面獲得空間智能認知、要素、玩家圖譜,歡迎閱讀。
The following article is from 量子位智庫 Author 量子位智庫
AI 的未來,絕不僅限于聊天機器人和數字世界。
物理世界的 AI 推進,已經開始。而且定義正在被包括李飛飛在内的大牛明确——
空間智能。
空間智能是什麼?包含哪些應用領網域?如何系統性地看待空間智能?随着技術的不斷進步,虛實融合邊界持續消融,空間智能的階段性成果、當前的認知和格局,正在愈發清晰。
在大量桌面研究、調研訪問、數據分析之後,為了更好把握空間智能現狀和未來發展方向,量子位智庫在《空間智能研究報告》(以下簡稱《報告》)中回答如上問題,同時系統性梳理了各應用領網域重要玩家,并對產業迭代影響要素作出研判。
這也是國内首份明确以空間智能為對象,提供空間智能產業圖譜的報告。
首份空間智能研究報告和產業玩家圖譜
《報告》認為,空間智能是主要基于 3D 視覺信息進行理解、推理、生成、互動的 AI 系統。
以具體應用領網域劃分,按不同的成熟度,空間智能可分為以下三種應用領網域:
自動駕駛
3D 生成
具身智能
此外,擴展現實(XR,Xtended Reality)是空間智能的原生互動方式,而準确的世界模型是空間智能發展的終局狀态。
根據上面的應用領網域劃分,結合目前的格局、發展等多方要素,量子位智庫在《報告》中詳細梳理了當下全球空間智能玩家的首份圖譜:
重點關注數據體系的成熟度
針對空間智能的不同應用領網域,可以從數據成熟度、算法成熟度、算力支撐、普及便捷度、經濟性等維度進行觀察。
綜合不同維度來看,三個應用領網域中自動駕駛成熟度最高,3D 生成位居其次,最後是具身智能。
其中最值得重點關注的是「數據體系的成熟度」這一維度。
對比得出,相比語言、圖片和視頻等,空間智能現存的數據規模更少。這就可以解釋為什麼空間智能的成熟度更低——尤其具身智能,高質量的真機數據數量稀少。
文字、圖片及視頻等數據的成熟支撐了以大語言模型為核心的 AI 浪潮爆發,《報告》認為,未來待 3D、物理 AI 相關數據成熟後,空間智能也将迎來爆發時刻。
作為觀察空間智能進展最重要的維度,除上述數據積累規模外,數據體系成熟度具體還包括數據構成精簡度、數據分布多樣性以及數據閉環成熟度 4 個部分。
數據構成精簡度主要指該領網域數據模态、數據類型的復雜度,例如具身智能需要融合多種傳感器數據,成熟度更低、更復雜;數據分布多樣性主要指該領網域數據分布是否足夠豐富以支持模型的泛化;數據閉環成熟度主要指能否構建數據飛輪的正反饋加速模型迭代。
自動駕駛領網域已出現 Scaling Law
《報告》表示,自動駕駛是空間智能目前規模最大、最成熟的應用,已經接近人類水平。
其技術前沿開始從模仿學習轉向強化學習,以保持性能增長。
目前,自動駕駛領網域已經出現屬于空間智能的 Scaling Law:可接管裡程随底層算力擴展和強化學習新進展快速增加。
數據顯示,2026 年以後,當背後算力支持超過百萬卡集群時,預計自動駕駛水準将超過人類駕駛水準。
在空間智能的三大具體應用賽道,自動駕駛的數據體系目前最為成熟。
從數據積累規模來看,駕駛裡程積累在百億英裡級别;
從數據構成精簡度上來看,目前主要以視覺信息為核心,輔以激光雷達等少量信息;
從數據分布多樣性來看,可以覆蓋多樣的駕駛場景(受益于發達的道路交通系統);
從數據閉環來看,自動駕駛構建了規模最大、最成熟的空間智能數據閉環。
3D 生成已有千萬級别數據積累
3D 生成是數字世界的空間智能,由圖形學和 AI 共同驅動,處于技術快速進步階段。
當前,3D 生成的最大瓶頸是難以找到具有良好擴展性的 3D 數據表征。
從數據積累規模來看,3D 生成有千萬級别的數據積累,足以支撐可以商業化的產品;從數據構成上看,目前有多種數據表示形式,較復雜,技術方向尚未收斂;從數據分布多樣性來看,可以覆蓋 3D 資產生成的大部分應用場景;從數據閉環來看,尚未形成閉環模式。
具身智能整體成熟度尚且較低
《報告》認為,可以和物理世界深度互動的具身智能,是空間智能未來規模最大的應用。
但就目前而言,具身智能整體成熟度較低,不過頭部玩家即将開始生產環境實驗。
從數據積累規模來看,需要廠商從零做起采集真機數據,存量積累規模小;從數據構成精簡度來看,具身智能涉及多種數據模态的融合,十分復雜,且面臨跨本體的泛化性問題;從數據分布多樣性來看,目前真機數據的分布也較為單一,以常見的運動和抓取場景為主;從數據閉環成熟度來看,機器人落地應用較為早期,尚未構建有效的數據飛輪
XR 可實現 3D 類内容的原生消費
擴展現實(XR)的硬體基礎正在成熟,可實現 3D 類内容的原生消費,未來随着 3D 原生内容和相關應用生态的成熟,将打開更大的市場。
XR 是目前訓練具身智能的關鍵數據采集方式,可以加速真機數據增長推動空間智能發展。英偉達、特斯拉、Meta 等領先機構已有相關探索實踐。
精确完備的世界模型是空間智能發展的終局狀态
世界模型是從大量數據中構建理解世界運作方式的内部表征,可以推理行動後果預測未來,精确完備的世界模型是空間智能發展的終局狀态。
《報告》認為世界模型可以通過各種技術路徑逼近,但不同路徑的精度和效率各異。
其中,側重 3D 和物理 AI 的空間智能,可能是建模真實世界的最佳方式。
有關空間智能的更多詳細内容,可在完整報告中獲取。
https://jkhbjkhb.feishu.cn/wiki/W5D7wuDcbiPXDLkaRLQcAJpOn8f
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
點亮星标
科技前沿進展每日見