今天小編分享的汽車經驗:2024年了,想進智駕第一梯隊,除了芯片算力還得卷什麼?,歡迎閱讀。
前段時間,我司主編老白去美國體驗了特斯拉 FSD,作為傳說中的終極智駕 BOSS,各位可以先看一下它的實力。
在我們體驗不久之後,特斯拉正式推送了他們的 V12 版本,在國外的測評視頻中,FSD 能在斑馬線前等待行人,也能絲滑完成無保護左轉,或者在被突然出現的車輛被迫刹停後,能快速跟進。
作為最早上車 OCC 功能的品牌,特斯拉這方面的技術可以說是當前一流。
OCC 并不是一個新鮮的詞匯,只是在極越提出來之前,很少有車企把它當做重點宣傳的對象。
極越花大力氣宣傳自家的純視覺 +OCC,除了本身品牌就是瞄準特斯拉來對标之外,還是在智駕内卷的時代,需要拿出點新東西,再卷一步。
OCC,恰好就成為了這個馬前卒。
行業新寵
OCC 的全名叫作 Occupancy 占用網絡,其風頭不亞于當年的激光雷達,幾乎做智能駕駛功能的主流車企都會用 " 已有成果 " 或 "OCC 上車預告 " 的形式提及這項技術,目前将這項技術上車的企業包括特斯拉、華為、極越、智己等等。
和作為硬體的激光雷達不同的是,這是一種軟體技術,它通過大量的算法訓練,擁有對傳感器抓取信息的處理能力,不僅可以構建出實時三維場景,還會與系統其他算法 " 對線 " 核實,并對數據進行标注。
可能這麼說會有點抽象,我們可以先看一段視頻:
這是極越展示 OCC 上車的效果,視頻中,車輛宛如行駛在樂高世界,移動的車輛本身、道路其他參與者以及靜止的路燈、綠化帶等物體都以各種顏色的方塊狀影像顯示出來。
有人可能覺得:這樣的建模很普通啊,也就仿真遊戲千分之一的水平吧。然而區别在于,遊戲裡的建模都是設定好的物體和場景,而該視頻則是随機的、即時的真實場景。
換一句話說,連我們本人在開車時,都無法做到在腦海裡呈現如此完整的場景,尤其是盲點裡的後方來車。
我們注意到的、注意不到的,這台車都能注意到,其中出力的 Occupancy 占用網絡技術,到底是怎麼做到的?
攤開來看,OCC 會将空間劃分為很多個立體小方格,每個小方格被稱為 " 體素 "。當攝像頭捕捉的影像連續不斷的輸入給 OCC,OCC 就會觀察影像對應的空間,每個體素的狀态是被占用還是自由。
(綠框标注處即為 " 自由 " 狀态)
來個類比,一張圍棋棋盤,被放了棋子的格子就是 " 占用 " 狀态,未放棋子的格子就是 " 自由 " 狀态。
再舉個模拟現實場景的例子,在一個巨大的廣場上,只有前方停着一台小轎車,那麼經過 OCC 的分析,當前的感知空間裡僅有前方轎車所在區網域顯示 " 占用 ",其他區網域都是 " 自由 " 狀态。
(黑白格為 " 自由 " 狀态)
看到這裡,OCC 為什麼叫 " 占用 " 網絡大家應該也很清楚了,去區分哪裡是需要避開的 " 被占用 " 空間,哪裡是可供我們使用的 " 自由 " 空間就是它的主要任務。
下一步就是生成 " 語義 " 标籤。
一方面輸給 OCC 的影像信息本身就帶有識别功能,另一方面新增的高度信息讓目标物呈現更全面,可以跟數據庫的物體對應上,标注對應的類别。
可能又有人要問了,那如果某個障礙物就是認不出來,沒辦法定義呢?
這就是 OCC 的高明之處。如果碰到未知目标物,語義标籤可以直接定義為 " 未知 ",但将其所在空間定義為 " 占用 " 狀态的流程不變,車輛自然就知道該區網域無法通行。
就像人類開車也會碰到一些不認識的障礙物,但沒認出來沒關系,咱們知道無法通行,直接做出避讓動作即可。
此前正是據此原理,華為做出 GOD 算法,實現了避障能力極強的 AEB 功能。
傳統的 AEB 是提前為車輛設定白名單,只有識别到白名單内的障礙物才會觸發刹停。而用 " 空間占據即不可通行 " 的思路去做避障,則不再受制于白名單的限制。
那麼 OCC 一旦上車,車就能和人一樣靈活懂變通了?
不是靈丹妙藥
只能說這項技術加持,智能駕駛會更靈活,但難點還有很多。
從 OCC 的技術落地方面來說,雖然原理上可以在任何地段使用,但最終效果如何,還得看研發體量的投入和工程師的水平。
比如在訓練算法時,樣本類别和測試場景的數量、訓練序列和驗證序列的 " 做題量 " 都影響着最終成果。
(英偉達赢得 2023 自動駕駛開發大賽 3D Occupancy 預測挑戰賽冠軍的方案)
包括在 OCC 的運行過程中,動态目标物和靜态目标物的分割同樣有難度。
比如建築物不會移動,汽車會移動,那麼就要分開處理,防止靜止物體出現運動狀态,不然出現 " 汽車上傳送帶 " 的狀态那可是鬧笑話。
而針對動态目标物的追蹤也同樣有難度,想象一下,如果視頻裡," 積木 " 般移動的大卡車在某幾幀突然散開再聚集成原樣,你還覺得靠譜嗎?
如果只去考慮單個體素而無法跟蹤并推理障礙物軌迹,那實際應用仍然困難。所以移動目标物的體素會被匯總,劃為一個整體。
或許你會問:如果感知能力夠強,OCC 也做的很成熟,智能車是不是就無敵了?
這個問題,其實從我們體驗的特斯拉 FSD 上或許能找到答案。
一路上特斯拉 FSD 表現都不錯,然而到了一個施工路段出現了問題。
當時原路線該右轉,然而樁桶擺出的新車道線只支持直行,系統很明顯識别出了障礙物,躊躇之下最終停車罷工。
我們推斷是由于路線規劃上需要右轉,OCC 識别只能直行,這是算法上對交通規則的邏輯和可行空間上產生了衝突。
在算法裡,車輛對樁桶具備規則認知,遇到用樁桶形成的車道線,是不是凌駕在普通車道線規則之上。
當原定路線被打亂,是宕機還是主動尋找 " 可行路線 " 目标?
簡單來說,碰到有問題的地方是 " 靜止 " 還是 " 移動 "?
這些都不是 OCC 能解決的問題。
寫在最後
其實聯系實際來說,當駕駛員會開車但是經驗不足,且沒有過多被輸入碰到特殊場景的交通規則凌駕法則,碰到原先路線被打亂且對周邊環境陌生的情況下,肯定也是無從下手的。
區别在于,人類有種 " 試試呗 走錯了 那我就轉幾圈看看呗 " 的情感思維,車輛則可能出現對行駛任務碰到故障就一團亂麻無法處理的狀态。
所以如果不能完全實現對特殊規則的變通,即使像 OCC 這種高水平模拟人類思維的技術上車,機駕也永遠無法代替人駕。
END
>