今天小編分享的汽車經驗:智能駕駛開「卷」端到端,誰能摘到皇冠上的明珠?,歡迎閲讀。
北京車展仍在繼續。
和 2023 年的上海、廣州車展一樣,智能駕駛依舊是這次車展繞不開的主題,但同時市場也在迅速變化,技術迭代的速度正超乎所有人的意料。
" 從去年的上海車展到今年的北京車展,智能駕駛的發展突飛猛進,連我自己都被驚訝到。"
理想汽車智能駕駛副總裁朗鹹朋博士在北京車展期間地平線的生态圓桌論壇上講道," 去年大家還在講高速 NOA、講 Transformer 和 BEV,今年行業卻已對城市 NOA 司空見慣,幾乎都在講無圖方案和端到端。"
一個更明顯的變化是,智能駕駛的核心正回歸至消費者本質——更好用、更拟人、更安全,為了提高 L2+ 級智能駕駛功能的市場滲透率,如今行業關于城區 NOA 的規模化較量,正從比拼開城速度轉向比拼日活。
而日活,将成為衡量城區 NOA 是否好用的關鍵指标,消費者對于智駕功能的實際體驗評價、喜好也正被各車企放至愈加重要的位置。
然而一個問題是,從實際體驗來看,城區 NOA 目前尚未達到用户眼中 " 可用 " 标準,距離 " 愛用 " 更是相距甚遠。
" 城區 NOA 真正做到讓消費者願意用是很難的。目前城區 NOA 的激活時間其實還是非常低的。" 元戎啓行 CEO 周光則如此表示," 就算是願意用了,但很多時候,這些功能給消費者帶來的是驚吓,而不是驚喜。可能一次(不順利的體驗)就會讓消費者戒掉。"
從 " 可用 " 到 " 好用 ",高階智駕的路還要走多久?如今眾多車企與 Tier1 們幾乎無人不談的端到端會是這個轉捩點的答案嗎?端到端量產落地的最佳解法又會是什麼?
高階智駕 " 開城大戰 " 内卷加速:用户體驗仍是 " 痛點 "
各家車企關于高階智駕 " 開城大戰 " 的火藥味一路蔓延到了北京車展中。
" 城市 NOA 在全國都能開我們肯定是第一,我們的目标是到今年年内,在國内大部分地區甚至小區内都可以開。" 小鵬汽車 CEO 何小鵬在北京車展接受新智駕等媒體采訪時如此表示。
小米汽車首次參展即虹吸巨大流量,雷軍在車展上自信喊話," 小米 SU7 的高速 NOA 絕對可以媲美華為、小鵬。" 同時雷軍還宣布,小米 SU7 的城市 NOA 将會在 5 月份開始推送。
與此同時,仰望汽車的仰望 U7 将在今年第三季度開通城市領航功能、魏牌的藍山智駕版将在 5 月進行大規模 NOA 試駕體驗、極越汽車計劃在今年實現城市 NOA 覆蓋全國 ......
從時間節點看,國内一眾新能源品牌正在進入高階智駕 " 全國都能開 "" 有路就能開 " 的規模化量產新階段。
然而實際上,這兩年車企在大規模落地高階智能駕駛方案時卻遇到了不小的挑戰。
在中高階智駕方案,由于技術的不成熟,本應給消費者帶來極致體驗的功能卻無法發揮出應有的效果,從而吸引消費者買單。
麥肯錫在《2024 麥肯錫中國汽車消費者洞察》報告中指出,消費者對各類自動駕駛功能的興趣正在提升,但願意為之額外付費的意願卻在下降;其中一線城市的付費意願下降尤為明顯。
事實上,雖然目前城區 NOA 功能上車已久,各家車企對城區 NOA 功能的落地和推廣也都相當看重,但從市場反饋的情況來看,大多數車企的城市 NOA 仍處于起步階段,尚且無法滿足用户的智駕需求,要麼适用場景有限,要麼駕駛體驗不佳,難以稱得上好用。
地平線就在這次的北京車展上指出,智駕系統将經歷從可用、好用到愛用的三個發展階段:
•可用:以滿足物理指标為目标,聚焦場景通過率、通勤效率等物理指标,但在體驗上要麼 " 慫 " 要麼 " 莽 ",只能達到 " 可用 " 的标準。
•好用:在物理指标基礎上,以達到拟人化體驗為目标,聚焦實現更優雅從容随時可激活的體驗,達到用户心中 " 好用 " 的标準,真正改變消費者的認知。
•愛用:以達到智駕平權為目标,聚焦通過極致的應用和量產效率,讓高階智駕體驗人人可及,真正讓每個消費者 " 愛用 "。
而當下量產的以城區 NOA 為代表的高階智駕系統尚未充分達到用户眼中的 " 可用 " 狀态,城市 NOA 目前的 " 慫 "" 莽 "" 急 "" 貴 " 四大問題成為阻礙消費者為之付費的關鍵因素:
1. 慫:擁堵更添堵,導致體驗接管;
2. 莽:搶行太莽撞,導致安全接管;
3. 急:為快速開城,系統可用性下降;
4. 貴:不利于功能普惠與大規模市場落地。
以 MPI 為例,目前用户在開啓城區 NOA 功能時,基本幾十公裏就得人工接管一次,離達到 " 輕松好用 " 相去甚遠,以路口轉彎這類典型高頻場景為例,目前用户在開啓城區 NOA 功能時,通常都會因為系統 fullstop 或軌迹生硬而選擇接管,離達到 " 輕松好用 " 相去甚遠。
用户體驗不佳,再加上成本過高、全場景 NOA 受高精地圖覆蓋限制,城區 NOA 功能僅能在有限的、少數高線城市開通,且過于激進的去高精地圖也一定程度帶來了系統性能下降,經常随機出現各種退功能問題,使得這些功能的實際用户使用頻率并不高,從而進一步造成功能迭代開發難度大、周期長的問題。
要想進一步提高智能駕駛的市場滲透率,2024 年,智駕功能的改善和迭代必須轉向實用與場景優化,以 " 用户粘性 " 作為自身核心競争點。
而在價格戰愈加白熱化的當下,如何在有限的成本下實現更好的功能體驗,又如何讓下一代高階智駕系統兼顧通行效率和拟人化體驗?
地平線認為,技術重構是實現全場景高階智能駕駛系統量產的唯一途徑。
2023 年特斯拉公布 FSD V12 版本,将城市街道駕駛堆棧更新為端到端神經網絡這一技術路線,由此一股名為 " 端到端 " 熱潮開始席卷國内智駕圈,在今年的北京車展上,更是逐漸升温,成為各車企和 Tier1 們口中放不下的關鍵字之一。
從 " 能用 " 到 " 好用 " 的跨越:端到端開啓下一個洗牌局
所謂端到端,指的是一種新型的 AI 模型,采用 BEV+Transformer 技術架構等方式來實現感知決策一體化,以達到輸入原始數據後便能輸出最終執行指令的效果。這項技術令該版本比以往減少了數十萬代碼,讓汽車在沒有數據連接的情況下仍可在不熟悉的路段地形上行駛。
一位算法方案開發工程師曾對新智駕指出,"将感知與決策融合到同一個模型中,使得端到端模型能有效避免聯級之間的誤差值,無需任何人工規則介入,更加接近人類駕駛行為的高階智駕。"
2023 年,特斯拉 FSD V12 展示了端到端模型上車的效果後,國内主流車企與 Tier1 意識到這是一個未來趨勢,開始快馬加鞭地追趕。
在過去,智能駕駛從業者大多将整個自動駕駛任務劃分為感知、預測、決策、控制等模塊,由于每個模塊的技術棧相差很大,且難度高,所以每個工程師都獨立負責其中一或兩個模塊。
因此目前已量產的智駕模型,也大多采用傳統模塊化的架構,即按照感知、預測等功能來劃抽成不同的多個小模型,每個模型都要單獨對其進行訓練和優化,且下遊規控環節仍以規則為主。
與傳統模塊化架構不同的是,端到端模型是由多個小模型(即神經網絡)級聯而成,并且只需通過訓練這一個大模型,就能達到優化和提升各個功能模塊的能力,從而減少傳統架構下對逐一模塊訓練所帶來的研發成本。
(新智駕整理制圖)
技術落地大戰爆發前夕,搶先一步的是學術預研。
學術界對端到端的研究始于 1988 年的 ALVINN,随後發展出端到端 CNN 原型系統。
地平線則早在 2016 年便率先提出了自動駕駛端到端的演進理念,并在 2017 年就開始采用訓練端到端系統,同時發布軟體框架 Hugo。
2022 年,地平線又提出行業領先的自動駕駛感知端到端算法 Sparse4D,2023 年,由地平線學者一作的業界首個公開發表的端到端自動駕駛大模型 UniAD,榮獲 CVPR 2023 最佳論文。
論文中, UniAD 框架被首次提出,成為業界首個感知決策一體化的自動駕駛通用模型。
基于此,研究人員将感知、預測和規劃等三大類主任務、六小類子任務(目标檢測、目标跟蹤、場景建圖、軌迹預測、栅格預測和路徑規劃)整合到統一的基于 Transformer 的端到端網絡框架下,實現全棧關鍵任務駕駛通用模型。
與此同時,地平線還積累了基于蒙特卡洛樹搜索的端到端深度學習算法,大幅提升了智駕系統在復雜交通環境中的感知和互動式博弈能力。
一業界高管向新智駕透露,"實力強的企業将有望在 1-2 年内推出端到端模型,慢慢地,供應商與常規企業也會跟進,這是一個可以确定的趨勢。"
比如在 2023 年 12 月,理想汽車完成了 OTA5.0 更新。從發布的 AD Max 3.0 來看,在端到端架構的支持下,理想汽車整合了 BEV 大模型、MPC 模型預測控制以及時空聯合規劃等能力,還新增了 Occupancy 占用網絡算法。同時,理想還利用自研的神經先驗網絡 NPN(NeuralPriorNet)為 BEV 打 " 補丁 "。
此外,為了處理復雜的交通紅綠燈信息,理想汽車曾表示,其采用信号燈通行意圖網絡 TIN(Traffic Intention Net)來解決,而 TIN 正是端到端模型。
何小鵬也在這次的北京車展上透露,小鵬汽車将在第二季度上車端到端大模型 AI 智駕,這一大模型的應用将過去基于圖片的算法框架,轉為視頻流。
在各家競相追逐端到端模型上車之際,業界被反復追問——端到端模型是否會成為高階智能駕駛的技術終局?
業内人士向新智駕表示,智能駕駛技術最終的發展方向應是更貼近人類開車的行為模式,至少與人類駕駛行為相似的模塊之間具有更強更緊密的關聯。
在他看來,高階智能駕駛最終的技術架構應是完全端到端的方案,以攝像頭、毫米波雷達、激光雷達等多傳感器、多模态的輸入,作為端到端的輸入端,車輛的控制命令成為輸出端,跳過了中間的定位、預測、規劃、決策等模塊,只有輸入和輸出這兩端,這是将來的技術框架。
綜合來看,端到端的路線意味着系統更大的部分是由數據驅動的模塊所構建,那麼就意味着由人所維護的模塊相應的比例會降低,那麼這樣的話,整個系統就更容易維護。
且端到端架構通過一個模型實現多種模型的功能,研發人員只需要針對這一個模型進行整體訓練、調整優化,即可實現性能上的提升,因此可以更好地集中資源,實現功能聚焦。
更關鍵的是,端到端模型方案的潛力在于擁有更高的性能上限。由于任務更少、避免了大量重復處理,端到端自動駕駛可以提高計算效率,并且可以通過不斷擴展數據來提升系統的能力上限。
功能聚焦、易維護、擁有更高性能上限、更接近人類駕駛行為 ......端到端系統無疑是驅動城區 NOA 邁向 " 好用、愛用 " 的最優實現路徑。
而随着端到端系統的加速落地,行業關于高階智能駕駛的比拼也将迎來新節點。
事實上,端到端自動駕駛技術目前存在的發展瓶頸仍然是傳統的三大問題——算法、算力和數據。
其中算力平台需要支持更大規模的端到端的自動駕駛系統裏面的網絡;數據層面需要有海量的、非常多樣性的,能夠覆蓋普通用户生活場景中絕大部分 case 的數據;而算法方面則需要探索可解釋、可幹預性強的端到端自動駕駛系統。
誰能率先打通這三大關卡,無疑誰就能在這場關于端到端的洗牌局中更擁有走到最後的底氣和決勝牌面。
端到端量產落地之路:軟硬協同是最佳解法
這意味着,各行業玩家們必須解決復雜嵌入式計算機系統技術和極致工程能力的雙重挑戰,做到軟硬體高效協同。
這一方面需要各企業不斷拓展 ODD,需要在盡可能大的地網域空間及各種天氣條件下實現盡可能高的產品性能。
另一方面還要提升功能的性能和體驗,實現 NCA、ICA+、ICA、VPA、APA 等工作模式并無縫切換,并且每個模式的系統性能都要打磨到最優以提升系統處理 hard case 的能力。
目前行業裏的玩家在落地高階智駕時通常有兩種類型的技術策略。
第一種是側重于功能體驗和性能的提升,但是 ODD 的拓展做得不夠,依然非常狹窄;第二種是側重于拓展更廣的 ODD,但是功能水平卻非常狹窄和有限。
要想二者兼顧,需要開發者同時具備很強的軟體與硬體能力,以及極致的工程能力,同時在兩個維度實現突破。
事實上,更高端的計算方案和傳感器等硬體配置,決定了性能的下限,更先進的軟體技術架構,則決定了性能的上限,軟硬協同無疑是當下實現端到端高效量產落地的最佳路徑之一。
而在地平線創始人餘凱看來,軟硬協同是地平線的獨特優勢,依托領先的前沿軟體算法研究,去設計最先進的硬體計算架構,然後支持最先進的算法,使芯片架構與應用軟體配合得嚴絲合縫,能使計算方案效率非常高。
而在這次的北京車展上,憑借前沿的端到端軟體算法技術,地平線發布結合端到端技術的量產級高階智能駕駛系統 SuperDrive,就試圖提供打造 " 好用 " 智駕方案的解法。
一方面,SuperDrive 通過三網合一的感知端到端架構,将智駕系統的遮擋準召率提升 70%,對當前行業感知架構時延高、規則多、負載重的問題進行了有效解決。
另一方面,SuperDrive 通過數據驅動的互動博弈大幅提升了智駕系統在復雜交通環境中的感知和互動式博弈能力,做到在擁堵場景下變道成功率提升 50%,路口通行效率提升 67%。
同時,SuperDrive 還具備無高精地圖的感知能力,能做到對高精地圖輕依賴,從而快速上線各城市 NOA 功能,做到高效拓城。
在計算方案層面,SuperDrive 則與征程 6 旗艦版協同,試圖打造出最佳的軟硬結合高階智駕系統,讓好用的城區 NOA 方案加速規模化量產落地,實現人人可及。
事實上,除了 SuperDrive 這套城市 NOA 方案,在北京車展上,地平線還發布了業内期待已久的征程 6 智能駕駛計算方案。
征程 6 系列共推出六個版本,包括征程 6B、征程 6L、征程 6E、征程 6M、征程 6H、征程 6P,其中征程 6 旗艦版——征程 6P,算力 560 TOPS,面向的就是高階智駕市場,其擁有高集成度、高算力、高效率、高處理能力、高接入能力以及高安全等六大產品特性。
根據介紹,單顆征程 6 旗艦即可支持感知、規劃決策、控制等全棧計算任務,支持全場景 NOA 功能。
與此同時,征程 6P 還在高性能的前提下做到了高性價比,基于征程 6P 的硬體系統成本可以做到 1 萬元以下。
另一方面,Transformer 也是實現端到端自動駕駛的重要技術。
如果把端到端比作高階智能駕駛要前往的終點,BEV+Transformer 更像是旅途中的一座橋梁,也可将其視為一種工具,而 Occupancy 占用網絡則是一種可疊加使用的輔助 " 武器 "。
而地平線無論在算法上還是計算方案上,都實現了對 Transformer 的最佳支持。
在算法層面,UniAD 是行業首個感知決策一體化端到端模型,在 nuScenes 所有任務上都達到了最佳性能。
地平線的純視覺自動駕駛算法 Sparse4D 則是其接棒 BEV+Transformer 的下一代架構。在今年 1 月份,地平線還将 Sparse4D 系列算法開源,以推動行業更多開發者共同參與到端到端自動駕駛、稀疏感知等前沿技術方向的探索中。
在硬體層面,地平線新一代 BPU 納什架構,原生支持大參數量 Transformer 模型,并提供業内同級最強的 Transformer 計算性能,為先進的端到端系統的部署提供有力支持。
而在相關技術棧方面,地平線搭建的促進軟體開發和定制的各種工具,諸如算法開發工具鏈天工開物、嵌入式中間件踏歌、軟體開發平台艾迪等等,也體現了其強大的軟硬體綜合能力。
更低成本、更高性能上限、更高效協同的全棧式軟硬體能力,讓高階智能駕駛系統 SuperDrive+ 征程 6 旗艦版的協同指向了一個終極方向——幫助產業玩家更高效地實現基于端到端模型的高階智駕大規模量產落地。
據地平線透露,在合作車企方面,地平線的 SuperDrive 方案已經與多家車企和頂級 Tier 1 達成合作,預計到今年第四季度将會有标準量產方案推出,而到明年第三季度,首款搭載 SuperDrive 方案的車型也将進入交付期。
從可用到好用,國内的汽車高階智能駕駛之路剛剛走向轉捩點,要想在關于端到端這場火熱的戰事中勝出,作為國内智能駕駛方案的頭部供應商,地平線的征程剛剛開始。
雷峰網 # 雷峰網 # 雷峰網