今天小編分享的汽車經驗:一張圖片生成3D世界,對于汽車意味着什麼?,歡迎閲讀。
撰文 / 閲 凡
設計 / 趙昊然
12 月 3 日,由人工智能科學家李飛飛創立的科技公司 World Labs 推出了第一個項目,僅通過一張圖片,就能将圖中的場景三維化,生成的場景符合基本空間原理和物理定律,用户可以在生成的空間内移動,轉換視角。
他們稱之為大世界模型(Large World Model,LWM)。
李飛飛表示,大型世界模型只是 Worlds Labs 公司的第一步,後面他們準備把場景設計融入 AR、機器人甚至自動駕駛。
2 天後,Google DeepMind 發布 Genie2,也展示了其可根據單圖生成無限 3D 世界,用于 AI 遊戲及智能體訓練,這就意味着它可以模拟虛拟世界,帶來了物體互動、復雜角色動畫、物理以及建模和預測其他智能體行為的潛力能力。
又 5 天後,在 OpenAI 發布會直播第 3 天,此前被稱為理解和模拟現實的基礎性 AI 技術,邁出開發能夠與物理世界互動模型重要一步的 Sora,推出了 Sora Turbo,在模拟運動中的物理世界時,進一步增強了它的可編輯能力。
2018 年,世界模型的概念開始被廣泛提及,科學家指出,人類使用有限的感官感知世界,并基于這些感知建立起一個内部的、簡化的世界模型,這個簡化的模型不僅幫助我們理解世界,更重要的,我們還會根據這個頭腦中的簡化世界決定預測未來走向。
而計算機領網域的世界模型不僅包括觀察、狀态估計、動作建議和潛在變量建議四大核心元素,也采用了類似的思維模式,即在有限的、有選擇性的信息基礎上進行有效的決策和預測。
世界模型将會如何改變這個世界,對于身處變革中的智能汽車又意味着什麼?
智能座艙:從被動到主動預測和推薦
随着越來越多產品更新為高通 8295 芯片,以及 AR-HUD 的普及,3D HMI 正在成為智能座艙發展的新趨勢之一。
從 3D 車模到 3D 的場景構建,到最終可能會演變的全 3D 架構,用户正在以 3D 的方式探索整個座艙的場景,實現多視角切換。一鏡到底的場景變化,這種更加直接并具有連貫性的體驗,正在颠覆整個座艙互動的方式和信息呈現的方式。
而汽車座艙的另一個變化,就是 AI 在智能座艙的快速應用和能力拓展,它正在重新構建視覺、聽覺、語義等多模态融合的全新體驗。
當前,雖然世界模型尚不成熟,但是它已經預示了很多的可能。
汽車商業評論了解到,今天 AI 在座艙的能力大多還是基于 AI 算法的拟合,也就是依賴于人提供大量的算法和數據進行訓練,AI 并沒有真正的理解座艙内這個小世界的物理規律,也就無法主動預測用户行為。
但如果世界模型能夠上車,打造成為座艙世界模型,就意味着車輛通過對外界環境的聲音、光線、温度、位置、人體眼神、動作等信息的感知,能夠知道外面是在刮風,還是在下雨,人什麼時候會熱,什麼時候會冷。
它從一定概率的拟合轉向成一種精确的計算,把人當做其中一個變量,在這個世界模型裏去運行,主動調整車内的温度和濕度,包括聲音、光線等,不僅讓人保持最舒适、最愉悦、最高效的狀态,也實現了在 3D 世界的沉浸。
它帶來的的最大的價值點就在于,座艙未來會從被動接受指令,到主動推薦和預測,并且會更加精準。同時,将人、車、外部環境的眾多感知信息相融合,真正将座艙拓展為千人千面。
智能駕駛:更快、更省、更安全
2024 年,自動駕駛端到端大模型成為了車企開始競逐的新焦點,它取代了此前用于感知、描述、預測以及規劃的多個模塊,讓自動駕駛以深度學習和人工智能為基礎,通過統一的神經網絡架構實現環境感知到車輛控制的全流程自動化,更接近人類的真實駕駛。
而端到端大模型的潛力和能力挖掘,以及未來競争的核心就在于誰的數據規模更大、誰的訓練能力更強,誰的跨網域融合應用能力更出眾。
蔚來汽車曾在它的蔚來世界模型 NWM 的描述中表示,它能夠在 0.1 秒内推演出 216 種車輛可能發生的軌迹,尋找最佳決策。然後在接下來的 0.1 秒内,根據外界的信息輸入,重復更新内在時空的模型,再去預測 216 種可能性。以此循環,跟随駕駛軌迹持續預測,得到駕駛的最優解。
因此,世界模型為自動駕駛訓練構建了更低成本、更快開發速度、以及復雜場景訓練的可能。
首先,傳統的自動駕駛訓練依賴大量的實際道路測試數據來構建場景,但世界模型能夠通過學習和生成,構建出更加豐富多樣的虛拟駕駛場景,包括一些罕見的、難以在實際中頻繁遇到的特殊場景和邊緣情況,如極端天氣條件下的駕駛場景、復雜交通流中的特殊事件等,為自動駕駛模型提供更全面的訓練數據,從而提升其在各種場景下的應對能力。
其次,世界模型增強态勢感知與決策能力。
世界模型可以模拟真實世界環境的動态變化,理解各元素之間的關聯和因果關系,提前預判整個場景的演變。
第三,世界模型可以提高訓練效率與降低成本。
基于世界模型的仿真平台相較于傳統的單一道路測試,能夠更加精準地滿足日益增長的模拟需求,大幅削減重復采集和分析工作,按照需求快速生成特定場景,有效提高算法的精準度和迭代效率,從而縮短自動駕駛技術的研發周期,降低研發成本,加速其商業化應用的進程。
雖然,當下的世界模型尚不成熟,但對于汽車真正成為人們的智能出行伴侶或者移動智能機器人的美好想象來説,越來越多科技公司的技術推動和演進,讓這個夢想又向前了一步。