今天小編分享的互聯網經驗:車企新舊勢力搶着上,端到端真能颠覆自動駕駛?,歡迎閲讀。
圖片來源:AI 生成
今年 5 月,自動駕駛迎來了一筆 10 億美金的巨額融資。
聚焦研發端到端自動駕駛以及自動駕駛大模型的英國初創公司 Wayve.AI 官宣獲得了一輪 10.5 億美元的融資,投資方為軟銀、英偉達和現有投資人微軟。
即使在自動駕駛融資高漲的時候,獲得過 10 億美金級融資的公司也并不多,能夠挑出來的大概只有 Waymo、Argo、Cruise 等少數幾家。更何況自 2021 年上半年以來,全球自動駕駛投融資市場進入低迷期。在鮮有資本在自動駕駛領網域投入巨額資金的情況下,Wayve.AI 憑借 " 端到端自動駕駛 " 概念拿下了 10 億美元級别的融資,或許已經在指明潮水的方向。
端到端并不是一個新的概念,它的 " 翻紅 " 來自 2023 年 8 月特斯拉發布的 FSD V12 版本。此後,迅速成為自動駕駛領網域的 " 當紅炸子雞 "。今年 4 月,馬斯克旋風訪華,外界盛傳他為 FSD 進入中國而來,這讓人看到了使用端到端方案的 FSD 加速入華的可能性。
國内的頭部參與者們自然不甘示弱,小鵬、理想、蔚來、長城、華為、元戎啓行、毫末智行都不約而同地轉向端到端自動駕駛路線,希望其成為狙擊對手的 " 大殺器 "。
顯然,在賽道越來越卷,以及特斯拉 FSD 即将入華的挑戰和激勵下,一場新的行業變局正在醖釀。
端到端與大模型,并不必然相關
自動駕駛行業一向熱衷發明新詞,比如前年流行的是 "Transfomer+BEV",去年爆火的是 " 大模型 "、" 無圖 ",今年輪到了 " 端到端 "。那麼,究竟什麼是端到端?
所謂端到端(end-to-end)架構,其對應的是傳統自動駕駛采用的模塊化架構。傳統的自動駕駛架構更多衍生于機器人架構,通常包含感知、定位、規劃三大模塊,不同領網域的工程師負責不同的模塊。雖然這種方法在早期的自動駕駛技術發展中起到了積極作用,但也暴露出了一些明顯的弊端。
零一汽車智能駕駛合夥人、前圖森感知負責人王泮渠就指出,分模塊會導致架構復雜,通常有 3-40 個模塊,各個模塊上限不高,傳輸和優化難度高,并且局部與整體優化目标衝突。
除此之外,他還表示,開發、維護和人力成本會随着模塊增加而飙升。并且由于疊加規則應對交付壓力,導致維護性和可擴展性變差。
相比之下,端到端不需要人為将任務分解成多個中間步驟,以感知的傳感器數據(影像、點雲、雷達)作為輸入,直接輸出用于車輛的控制指令(油門、刹車),中間過程都靠神經網絡模型來完成。如果用日常的做菜過程來理解的話,端到端就有點類似在模型這邊輸入食材,另一邊一步到位輸出了做好的菜。
從模塊化架構到端到端架構,這樣的變化有什麼好處呢?蔚來智能駕駛研發副總裁任少卿對钛媒體 App 曾表達過," 真實世界是復雜的。越往後你會發現,你可以解決 99% 的問題,但就是這 1% 的問題解決不了。所以大家就希望説那我不定這個接口了,讓網絡自己學,讓機器自己去定,這個的核心就是端到端,就相當于把前面和後面連起來,把接口幹掉,能幹掉很多事。"
辰韬資本投資經理劉煜冬對钛媒體 App 也表示,對于自動駕駛很多的 " 只可意會,不可言傳 " 的長尾場景,像積水、汽油等不同的路況,端到端有很強的應對能力。并且,端到端可以讓駕駛風格更加拟人化,表現得更像人類司機,比如遇到堵車的情況提前處理,訓練模型會更像人類老司機。
圖片來源:辰韬資本《端到端自動駕駛行業研究報告》
值得注意的是,在談到端到端自動駕駛時,人們很容易将其與大模型的概念混淆在一起。劉煜冬坦言,實際上兩者并不必然相關。
之所以會這樣説,在于大模型更多關注模型的參數數量以及湧現能力,而端到端更多強調的是結構上的梯度可傳導以及全局優化。目前的大模型為端到端實現提供了很好的可選方案,但是端到端并非必然基于大模型實現。
對于自動駕駛及具身智能領網域的 " 大模型 ",往往不是傳統意義上的 " 大 " 模型。這類大模型由于更多考慮了車端算力以及實時性要求的性質,很難達到和 NLP ( Natural Language Processing ) 或者通用 AI 領網域同等的标準。如果不考慮英偉達規劃 2025-2026 年量產的 Thor,目前車端算力較大的也只有幾百 TOPS ( Tera Operations Per Second ) ,這種算力水平遠遠無法滿足動辄 10B 甚至上百 B 的大模型需求。
所以,自動駕駛領網域的大模型都是小于 1B 的模型,這裏所謂的 " 大 " 的定義更多的是相對于原來感知系統采用的幾百萬參數的小模型而言。
新舊勢力押注,2025 年量產
事實上,端到端并不是一個全新的概念。
2016 年,英偉達就提出采用單個神經網絡來實現端到端的自動駕駛。但由于結構設計過于簡單,模型的規模也過小,這種方案僅能支持高速或者簡單道路狀況下的自動駕駛,且僅僅完成了小規模的 demo 驗證。
直到 2023 年 8 月特斯拉公布 FSD V12 版本時提到引入了 " 端到端 " 技術,從此成為自動駕駛界最火熱的概念。
國内的小鵬汽車緊跟一步。1 月 30 日,何小鵬表示小鵬智駕未來将實現端到端模型全面上車。5 月 20 日,小鵬汽車在北京舉辦 "AI DAY",宣布即日起開始向用户推送基于端到端大模型的智能駕駛和智能座艙系統。
4 月 24 日,華為智能汽車解決方案發布會上,華為發布了以智能駕駛為核心的全新智能汽車解決方案品牌 —— 乾崑,并發布了采用端到端架構的 ADS 3.0。 據悉,在 6 月剛剛上市的享界 S9 已經首發搭載了 ADS 3.0 智駕系統。
蔚來則在 4 月公開了端雲算力規模,并透露端到端方案會在今年年内發布。最近還有報道稱,蔚來智駕研發部已經完成架構調整,要放棄業界沿用多年的 " 感知 - 決策 - 規控 " 的技術路線,這意味着蔚來将更明确地探索用端到端大模型實現高階智能駕駛。
理想汽車也不甘落後。在 2024 中國汽車重慶論壇上,理想汽車董事長兼 CEO 李想透露,将向測試用户推送基于 300 萬 clips 訓練出的端到端 +VLM 自動駕駛體系。預計最早在今年年底、最晚明年年初,理想汽車将推出通過超過 1000 萬 clips 訓練出的更完善的自動駕駛體系,為用户提供監督型 L3 級自動駕駛體驗。
新勢力不斷出牌,傳統車企也在奮進追趕。4 月 15 日,在長城汽車董事長魏建軍的直播首秀中,新款魏牌藍山車型搭載的端到端智駕方案就曾引發外界關注。
在這一塊發力的除了蔚小理、長城等眾多車企,還有小馬智行、英偉達、元戎啓行、商湯絕影等產業鏈企業。
去年,小馬智行将感知、預測、規控三大傳統模塊打通,統一成端到端自動駕 駛模型,目前已同步搭載到 L4 級自動駕駛出租車和 L2 級輔助駕駛乘用車。
2024 北京車展前夕,吳新宙展示了英偉達自動駕駛業務從 L2 到 L3 的發展規劃,其中提到規劃的第二步為 " 在 L2++ 系統上達成新突破,LLM ( Large Language Model,大語言模型 ) 和 VLM ( Visual Language Model,視覺語言模型 ) 大模型上車 。
元戎啓行、商湯絕影則是在北京車展上各自展示了端到端產品。前者展示的是即将量產的高階智駕平台 DeepRoute IO 以及基于 DeepRoute IO 的端到端解決方案,後者推出的則是面向量產的端到端自動駕駛解決方案 "UniAD"。
至于端到端架構何時上車,辰韬資本發布的《端到端自動駕駛行業研究報告》表示,這一技術演進的時間進度可以參考國内企業追趕特斯拉 BEV/Occupancy Network 的進度。特斯拉在 2021 和 2022 年年底的 AI Day 上分别公布了 BEV 和 Ocuupancy Network 的技術架構,而國内車企開始 OTA 基于 BEV/Occupancy Network 的功能普遍在 2023-2024 年,與特斯拉的研發進度差大概在 1.5~2 年。參考前述追趕進度, 國内自動駕駛公司的模塊化端到端方案上車量產時間可能會在 2025 年。
2023 年 9 月中信證券發布研報預測:2025 年起,端到端發展的提速将催化各級别自動駕駛功能滲透率大幅提升,我們據此更加樂觀地預測,高速 NOA 滲透率至 2026 年将超過 30%,城市 NOA 滲透率超過 10%。
數據、算力是入場券,也是挑戰賽
頭部車企、自動駕駛技術供應商都在跑步進場,但端到端的上車仍有極高難度。
首先,擺在國内廠商面前亟待解決的就是端到端訓練的數據難題。畢竟端到端方案中的一體化訓練需要通過足夠多的數據訓練,這樣才能湧現出一些驚人的能力。
馬斯克之前曾談到過數據對自動駕駛模型的重要性:訓練了 100 萬個視頻 Case,勉強夠用;200 萬個,稍好一些;300 萬個,就會感到 Wow;到 1000 萬個,就變得難以置信了。
除了數據量的差距,從這些難以計算的數據中,找出可以用于訓練的有效數據,是另一個重要的挑戰。
" 老的數據要求的場景比較單一,復雜度低。深度學習的路線要求的場景分布會大很多,數據集的多樣性要求更高。" 恺望數據解決方案總監黃玉慶表示。
在他看來,目前自動駕駛數據的采集處理面臨諸多挑戰。首先,車廠的采集方案都不太相同,标準不一樣。其次,路采的時候涉及到合規,如何脱敏并且上傳到雲端,需要合規的公司做支持,而提供這樣合規服務的公司并不是很多。再次,數據管理平台這部分國内并不完整,比如雲端做大批量訓練和計算時怎樣進行清洗、拆、剪輯、标注。
面對數據量、數據标注、數據質量和數據分布等多維度的挑戰,業内有一種説法是:建立數據共享平台 。
對此,極佳科技工程負責人毛繼明表示,數據共享的價值毋庸置疑,但要謹慎樂觀。" 數據共享背後是數據交易和數據價值的共識,買方和賣方很難達成共識。生成的好壞對于訓練效果的影響也會影響共識,需要政府推動。另外也可以出台國标或法律。"
輝羲智能市場副總裁劉奇也表示,眾多主機廠的痛點,不是每家主機廠都能投這麼多錢把數據采集起來。對于數據采集統一化有很高的要求,各家技術方案都不一樣。另外,商業上的收益會是影響閉環更大的因素。
即便解決了數據采集問題,這也只是第一步,算力也是很大的限制。
在 2024 Q1 财報電話會上,特斯拉表示,公司已經有 35000 張 H100GPU,并計劃在 2024 年内增加到 85000 張 H100 以上,達到和谷歌、亞馬遜同一梯隊。
在國内,大部分研發端到端自動駕駛的公司目前的訓練算力規模在千卡級别,随着端到端逐漸走向大模型,訓練算力将顯得捉襟見肘。
理想汽車總裁、總工程師馬東輝在理想汽車今年第一季度财報電話會上坦言,特斯拉 " 端到端大模型 " 需要大量的數據和訓練算力," 這不是所有車企都有能力和資源做到的 "。
餘承東也發表過類似看法,他曾自信地表示," 國外就是特斯拉,國内就是華為。" 他認為,在智駕上會強者越強,一步領先就步步領先。投入大,成本高,一般企業根本投入不起。
據悉,華為乾崑 ADS 3.0 在算力方面達到 3.5E FLOPS(注:FLOPS 指每秒執行的浮點運算次數,1E FLOPS 即 100 億億次),訓練數據量已達日行 3000 萬公裏。
小鵬汽車為此給出過明确的數字:2024 年将投入 35 億元用于智能研發,并新招募 4000 名專業人才,今後每年還将投入超過 7 億元用于算力訓練。
特斯拉則是計劃 2024 年底前對 DOJO 超算中心投資超過10 億美元,以提升總算力至 10 萬 PFLOPS。
顯然,要想把端到端做好并不容易,需要巨大的車隊、巨大的算力、非常長時間在安全領網域的浸潤。這場以 " 端到端 " 為中心的拼殺還在繼續,角力的烈度仍在加劇。接下來,我們更想觀察的是撥開營銷的迷霧,端到端的真相到底會是什麼。
(本文首發于钛媒體 App 作者|韓敬娴)