今天小編分享的汽車經驗:激光雷達是我們走的一段彎路嗎?,歡迎閲讀。
編者薦語:
激光雷達的新思考,非常值得一讀。
以下文章來源于自動駕駛下半場 ,作者厘米
LiDAR is a Crutch ( Sort of. )
激光雷達有點像根拐杖
我回想起 2020 年,何小鵬先生向大洋彼岸的馬斯克先生喊話:" 要做好被我們打得找不到東的準備。"
那時候的我天真地以為,我們有着最成熟的激光雷達(Lidar)產業鏈,能夠将激光雷達的成本降低到可以量產上車的水平,還能保證產出點雲的質量,所以國内廠商能夠有天然的硬體優勢,保證感知結果的精确。
我也以為,何小鵬先生的底氣來自于此。
到了 2023 年,小鵬 G6 靠着幾乎獨一份的智駕體驗和 800V 電池,收獲大量定單,隐隐有爆款态勢。
對面特斯拉 FSD 對于國内的客户依然是一個巨大的餅,一個連時間表都無法給出的餅。
從這個角度來看,何小鵬先生兑現了他的諾言。
但很遺憾的是,從最近小鵬智能駕駛的宣傳來看,這似乎與激光雷達(Lidar)關系不大。
無獨有偶,據稱蔚來子品牌阿爾卑斯的首款車将不再配備激光雷達。同時,理想汽車在不久前的家庭科技日上,大篇幅講了自研智能駕駛的進步,而對激光雷達幾乎只字未提。
所以,激光雷達是我們走的一段彎路嗎?
01
激光雷達并非城市 NOA 的必要條件
激光雷達點雲沒有進入 XNet 進行訓練
根據小鵬智能駕駛感知負責人 Patrick Liu 在 CVPR 發表的演講,為小鵬城市輔助駕駛打下強悍基礎的 XNet,幾乎沒有用到 Lidar 的信息。
Lidar 只是在 XNet 給出感知結果之後,進行識别距離的二次确認。
當 Patrick Liu 在 CVPR 的演講結束之後,有個觀眾問了一個問題:" 整體并沒有提到激光雷達,為什麼?"
Patrick Liu 的回答非常耐人尋味:
" 目前我們還是 Vision Centric System,Lidar 沒有進入前融合。實際上,激光雷達還是用于一些通用障礙物的識别(例如一些從沒有見過的物體,感知識别不到,但是可能空間中會有一部分點雲)。XNet 中并沒有使用 Lidar 點雲,實際上 Lidar 傳感器尚處在一個還在不斷變化的時候,并沒有穩定下來。"
也就是説,Lidar 目前對于整個感知系統處于一個不是很重要的狀态,并沒有進入 BEV 網絡進行訓練。
從這個角度來看,激光雷達在感知的權重幾乎降低到了自适應巡航毫米波雷達的程度。
而根據此前吳新宙的采訪," 我們用激光雷達一直非常收斂。" 這也證明了激光雷達在目前的技術棧中被依賴的程度并不高。
從這個角度看,實際上小鵬的路線與特斯拉是非常類似的,只是多了激光雷達的傳感器冗餘,加快了落地速度。
特斯拉從未在量產車上使用過激光雷達
特斯拉的量產車上從來沒有出現過激光雷達,但從來不妨礙業内從業者對特斯拉自動駕駛團隊的尊重。到目前為止,稱為 " 量產綜合最強 " 其實并不為過。
面對純視覺系統處理不好的大霧和暗光環境,許多工程師認為這是視覺天然缺陷,但是特斯拉認為這是數據不足。
只要對應數據足夠多,感知系統的潛力就能被挖掘出來。
一切能力不足,都可以歸因成數據不足。
純視覺高階輔助駕駛的核心能力,在于優秀的數據回環系統和自動标注系統。
邏輯其實非常清楚,既然純視覺如果可以完成 Lidar 的測距任務,那 Lidar 就沒有必要存在了。
用同樣的邏輯,特斯拉也将原有的毫米波雷達去除了。
當然,我承認在一些極其惡劣的條件下,純視覺的能力一定有着很大的限制,但是這絕對無法成為高成本激光雷達的上車必要條件。
距離确認的任務,不足以支撐如此高的成本
" 純視覺方案能做到 90 分,激光雷達方案只能做到 91 分,但是為此付出的成本卻非常大,這很明顯價值不高。" ——某頭部智能駕駛感知方案負責人如是説。
特斯拉可能會選擇将這一任務交給成本更低的 4D 毫米波雷達,這是後話。
目前生產的 HW4.0,Model Y,Model 3 并沒有毫米波雷達,而在 Model S/X 上配備了。從某種程度上可以認為,這只是安全冗餘或者是為目前的影子模式收集數據,但并非核心器件。
目前,量產智能駕駛的兩個頭部玩家都對激光雷達持相對否定的态度,為何?
02
BEV 算法和占用網格,讓激光雷達的作用降低
激光雷達最重要的兩個特質:測距精度和通用障礙物的識别,效用在不斷降低。
在早期 L2 級别的自動駕駛中,攝像頭給出識别結果,然後再根據毫米波雷達的距離結果,二者進行信息的互相補充,進而得出最後的感知結果,用于常規的自适應巡航(ACC)和緊急刹車系統(AEB)等。
但是實際上由于毫米波雷達的誤檢測比較多,地面也會被識别成前方物體。
因此,一些廠商會直接将靜态目标直接過濾掉,只使用動态目标的結果。
這就造成毫米波雷達實際效用大大被降低,在整個感知技術棧中變得可有可無,尤其是當純視覺感知到了足夠的精度時,毫米波雷達的結果會被毫不猶豫地被抛棄。
激光雷達,幾乎走在毫米波雷達的老路上。
" 目前頭部的純視覺 BEV 的檢測距離精度,大部分時候已經到了不需要激光雷達的程度。" ——某頭部智駕感知工程師表示。
按照目前視覺方案的精度,激光雷達精确測距的優點已經越來越雞肋。
另一個非常明顯的轉變是,特斯拉已經可以靠純視覺占用網格(後文有相關解釋)完成泊車測距顯示,也就是説,其靜态感知的測距精度已經到了厘米級别。
由于極高的成本,并且波段基本接近可見光。
極大部分内容攝像頭也可以看見,常見的視覺受限場景,雨天和霧天場景,雨水和霧氣產生的幹擾點讓激光雷達根本沒有優勢。
激光雷達的危險程度甚至更高。
03
如何去除激光雷達?
數據回環與标注系統
與 Tesla 2021 AIDday 非常類似,Patrick 在演講中大篇幅提到了小鵬的數據回環和标注系統。
一個離線的識别模型,少了車上算力的限制,可以将模型變得更大;同時多了多幀的信息,例如某一幀的自動标注可以使用前一幀和後一幀的信息來對齊,保證位置的準确性。
同時,有意思的是,自動标注系統中大部分都會使用點雲的信息,由于激光雷達點雲的精确性更好,可以用于更精确的标注。這樣出來的标注質量可能會比特斯拉的要好,也就更有機會訓練出更加優秀的感知系統。
而目前頭部車企的不斷回環的帶點雲的數據,是一座巨大的容易被标注的數據金庫。
實際上,對于回環系統,各家全棧自研車企都已建設完成或者在建設途中了。
這種背景,可能會讓去除激光雷達的路走得更快。
純視覺占用網格
深度學習來做自動駕駛感知,有一個天然的缺陷。幾乎所有能識别出來的物體都需要在訓練集中出現過,如果沒有的話,識别失敗是很容易預知到的結果。但是道路上的物體無窮無盡,根本無法窮舉。
同時,很多算法團隊也在試圖讓自家的算法擁有 Zero-Shot 的能力,即沒見過也可以識别,但是穩定性難以保障。
如果使用激光雷達,可以根據點雲給出通用障礙物。即不在乎是什麼了,只在乎是不是一個影響駕駛的物體。這是激光雷達最重要的優點。
沒有識别到的物體,如果有置信度足夠高的點雲集合,即使視覺系統沒有識别到,那麼實際上也可以将其直接作為障礙物給出識别結果。
當然,特斯拉也給了回答,視覺占用網絡。
沒有激光雷達,特斯拉純視覺算法将所有的物體分割成了占用空間,即不再關心非常具體的類别,只關心占用的 3D 空間和速度相關信息,這樣就規避了窮盡類别的問題。
當然,這也建立在視覺算法能夠完全恢復 3D 空間距離的基礎上。
Lidar 能夠提供足夠好的距離結果,為标注距離後訓練占用網絡提供了非常好的基礎,但是由于目前量產的激光雷達囿于成本,整體點雲的密度并不足以提供極為稠密的深度信息,也需要标注團隊的努力。
合成數據的精确标籤
合成數據:顧名思義,非真實數據,而是人工合成的數據,可以用于算法的訓練。
早在 2021 年,特斯拉就提出他們使用了合成數據進行算法的訓練,例如高速上奔跑的行人;2022 年提出構建自動化仿真環境,為算法提供訓練和測試。
這些都為特斯拉的算法提供了非真實的數據來源。
我相信在特斯拉進行占用網絡的開發過程中,也有非常多合成數據的參與。
在這裏,合成數據有着一個無法比拟的優勢:極其精确的 3D 真值。
相較于自動化标注給出的似是而非的真值,開發團隊為了降低成本,不得不忍受;合成數據由于其生產過程是高度人為可控的,數據的真值是非常精确的。
與此同時,某個占用空間的速度、加速度、類别也是高度已知的,即使是完全人類标注,所生產的标籤也無法比拟。
這種高度精确的數據為算法提供了非常廣闊的應用空間,也在一定程度上提高了算法的上限。
04
激光雷達的危機來源
在純視覺方案不夠精确時,智駕工程師們會用更多的數據和更精妙的算法來榨幹視覺方案的價值,來提高數據的利用率。
到了激光雷達這裏,似乎工程師們的态度發生了變化,為何?
激光雷達依然在不斷變化,除去老生常談的 905 和 1550 波長之争,安裝位置的區别;激光雷達點雲抗幹擾的能力依然是激光雷達廠商們不斷努力的方向,這些都是變數。
這些變數讓激光雷達的下遊,對未來產生懷疑。
尚未穩定的技術帶來的沉沒成本
攝像頭經過多年的發展,已經有了一套非常穩定的數據處理方案,一切都有律可循。
學術界、業界使用的傳感器都趨于一致,即使使用的感光元器件,影像信号處理模塊稍有區别,但是整體輸出的結果都有一個規則:趨近人類眼睛的感受。
而 BEV 的引入,也在一定程度上降低了對外參的依賴,因為 BEV 需要将影像全部轉換到俯視視角,這種相對解耦讓之後車型的适配也相對靈活。
所以攝像頭的變化會在一個相對合理并且可以被接受的區間内,即使是内外參有一些區别,并不會讓适配工作變得復雜。
而激光雷達,業界形成的共識大概只有,點雲需要更密,遠處的分辨率要足夠高。
更不要説,激光雷達目前的安裝位置也沒有形成共識,這種點雲一旦被強依賴開發,之後的車型勢必都需要按照相同的方案進行開發。
否則數據的復用會帶來極大的工作量。
所以,一些公司将激光雷達直接轉換成占用空間(Occupancy Grid),與特斯拉占用網絡的結果趨于一致。
但是,激光雷達點雲又不提供速度信息,占用網絡速度标注又是一個不容易被解決的問題,只有視覺能解決這個問題。
成本倒逼的兩套技術方案
對于輔助駕駛,目前大部分車企都有兩套技術方案:一套帶激光雷達,用于更加高階的技術方案;一套不帶激光雷達,用于更低成本車型,降低入門車型的價格。
這就帶來一個非常有趣的現象,純視覺方案做基礎,激光雷達方案做高階。
所以,在一些基礎必備的功能,例如 AEB,假設一個車企有兩套自研硬體方案,那麼這套方案一定是視覺為主,激光雷達後期作為 " 可有可無的補充 "。
否則,開發完全不一致的方案,會讓已經非常内卷的功能團隊再次精力被分散。
而高階輔助駕駛,在目前的降本需求下,也在被純視覺方案侵蝕空間。
大部分智能駕駛方案團隊,都使用純視覺方案做到了高速領航輔助駕駛,這也讓激光雷達方案的空間進一步被壓縮。
那麼,激光雷達剩下的空間就只有城市導航輔助駕駛了,而 Tesla 早已證明沒有激光雷達也可以完成。
而 4D 毫米波雷達的虎視眈眈,也在進一步侵蝕激光雷達的生存空間。
效用與價格的錯配,正在拷問所有的智駕團隊。
而現在激光雷達的上車價格,已經是廠商們用盡全力,完全不考慮利潤的結果了。
05
激光雷達的機會
如果激光雷達一直無法進入前融合,而成本倒逼也讓空間進一步被縮小,未來會在何方?
我們回想一下毫米波雷達的使用,事實上沒有廠商會直接使用毫米波雷達出來的點雲結果,而是大部分使用毫米波模組直接出來的物體探測結果。
例如,博世毫米波雷達模組能直接給出目标的感知結果,包括物體的距離,長寬高等,雖然這些結果的置信度不高,但是有着相對穩定的可用空間,整體集成難度也相對較小。
那麼,激光雷達是否也可以復制毫米波雷達的發展方向?
激光雷達模組輸出更加稠密的占用網格,而不是點雲原始結果,在某種程度上直接給出穩定的整體世界的描述;
AEB 等固定模塊的參考信号,例如,Mobileye 的模組可以直接給出非常穩定的 AEB 結果。理論上,點雲的距離質量會讓 AEB 信号的開發難度更低;
進一步降低成本,直到可以被接受。
馬斯克曾宣布過特斯拉使用的是攝像頭的原始數據進行後面的開發,也省去了影像信号處理模塊帶來的幹擾,而對于激光雷達廠商來説,更加熟悉底層,能夠獲取更加原始的數據,也能夠獲得更好的結果。
當然,這是我個人觀點,并不代表未來的發展方向。
寫在最後
這兩年激光雷達上車的火熱,到目前的冷卻,行業态勢瞬息萬變。
激光雷達最重要的兩個優點,距離精度和通用障礙物識别,被純視覺 BEV 算法和占據網格算法一步步侵蝕空間。
國内智能駕駛產業鏈強行将激光雷達催熟,現在某些車企還無法正确使用,大量點雲只用于 AEB 系統,但是 AEB 的表現卻很難與所有人都想颠覆的 Mobileye 抗衡。
幸運的是,我看到激光雷達對自動化标注帶來的捷徑,讓之後去除激光雷達過程變得更加容易。
激光雷達兩年前的激進上車,或許就是為了不久之後的下車。
也許某一天,證明擁有激光雷達的車在 AEB 的表現普遍更好,占用網格可以更精确,激光雷達退化成類似安全氣囊的高端配置以後,激光雷達的春天才真的會到來。
高階輔助駕駛的兩副拐杖,一副是高精地圖,許多團隊正在扔掉的路上;另一副是激光雷達,我相信離扔掉應該也不遠了。
但是有了這兩副拐杖,讓我們更快體驗到了高階輔助駕駛的魅力,也能更好迎接低成本方案的到來。
或許,很幸運,馬斯克是對的。
最後,重點推薦 Patrick Liu 的 Medium Blog:
https://link.medium.com/6OLZCRHdcCb
我是厘米
歡迎關注自動駕駛下半場