今天小編分享的汽車經驗:“端到端”不絕對=絕對不“端到端”?,歡迎閲讀。
這個夏天,温度着實有些高。而對于汽車行業來説,智駕的熱度也同樣居高不下。
短短一個月的時間,新勢力中的 " 御三家 ",理想、蔚來、小鵬像是約定好了一樣,先後舉辦智駕 Tech Day。
7 月 4 日,理想汽車舉辦了智能駕駛夏季發布會,宣布 " 端到端 + 視覺語言模型 " 的早鳥計劃正式啓動,24 年底或 25 年初進行實車推送。
7 月 27 日,在蔚來創新科技日上,他們正式發布了智能駕駛世界模型 NWM(NIO World Model),即全量理解信息、生成新的場景、預測未來可能發生的多元自回歸生成模型。
7 月 30 日,小鵬汽車在 AI 智駕技術發布會上宣布推送 XOS 5.2.0 版本,号稱 XNGP 從 " 全國都能開 " 更新為 " 全國都好用 ",實現 " 不限城市、不限路線、不限路況 " 的全國全量開放,且打通 ETC 收費站場景,預計 2024 年内實現真正的 " 門到門 "AI 智駕體驗。
真的,就仿佛約好了一般," 御三家 " 集中在 7 月開智駕 Party,而且,技術路線再度趨同。我們不禁要喊出那句話了," 或許,智能駕駛真的沒有代差 "。
而在這個浪濤滾滾的時代裏,大家都被推着向前走。技術高地固然要衝鋒,但滿眼浮躁的、蘿卜快了不洗泥的風氣,也從未消散,包括人員流動,以及路線搖擺。
事的背後一定是人,那我們就從 " 人 " 講起。
自去年 8 月,小鵬汽車智駕靈魂人物吳新宙離職之後,小鵬智駕的變動就沒有停止過,但基本也都停留在大佬級的 " 活水流動 "。
從最新消息可知,小鵬汽車又進行了一輪内部調整,而這次調整的重心是技術開發部。
在小鵬汽車的架構規劃裏,技術開發部是算法研發部門,具體涵蓋了感知、規劃、控制、定位的算法研發。經調整之後,原技術開發部被拆成了三個細分部門,分别是 AI 端到端、AI 應用、AI 能效。
從部門名字就可以推知,"AI 端到端部門 " 負責端到端模型的研發,"AI 應用部門 " 負責交付。也就是説,這次調整相當于将算法團隊分而治之,一部分去做模型,一部分去做交付。
很顯然,在端到端的巨大浪潮下,小鵬汽車的人力資源配置,正跟着端到端量產落地的計劃進行相應的調整。
無獨有偶,蔚來,理想也做出了類似的選擇。
近期,理想汽車成立了 " 端到端自動駕駛 " 的實體組織,整體 200 人出頭。而理想智能駕駛整個團隊主要分為算法研發、量產研發兩個大組,團隊約 800 人。
具體來説," 端到端 " 的研發主力就部署在算法研發組了。而説到算法研發的主要工作内容,包括了感知算法、行為智能、認知智能,相應的,量產研發則包括智能行車、智能泊車、智能安全等。
此前,蔚來也将感知和規控團隊合并為了大模型團隊。在業務調整後,蔚來智能駕駛研發副總裁任少卿明确表示,要放棄業界沿用多年的 " 感知 - 決策 - 規控 " 傳統範式做智能駕駛,未來将逐步轉向為端到端大模型範式,用深度神經網絡技術實現高階智駕。
從各家空前一致的選擇來看," 端到端 " 自動駕駛确已成為各大主機廠必争的技術高地。
人員調動,服從着技術路線的調整。悄然間,幾乎所有的籌碼都砸向了 " 端到端 ",可以説,諸君下足了血本。而未來幾年的技術目标,在其明晃晃的腦門上,也全部寫着 " 端到端 "。
那麼,我們不禁要刨根問底地尋找答案了,這引得無數車企 " 競折腰 " 的端到端究竟是什麼?
就像網絡上應接不暇的網絡熱梗,這幾年智駕圈的技術名詞也越來越多,諸如:BEV+Transformer、端到端、世界模型、多模态等等。
它們不像機械範疇的内容,就算你沒搞懂某個機械的内部構造,但多多少少能聯想到是汽車的哪一個部分,大概會起到什麼作用。但智駕的技術名詞幾乎是一種黑洞裏的虛無了,非專業深耕者,未必能窺探其奧秘。
所以,普羅大眾對這些名詞還非常陌生。問,就是端到端,聽上去很厲害。那麼,端到端是什麼?不清楚!
今天,我們再做一次淺淺的科普。
對于端到端來説,其早期核心定義是 " 從傳感器輸入到控制輸出的單一神經網絡模型 "。 近年來,端到端的含義有了更深層次的延展,可以視為感知信息無損傳遞,也可以實現自動駕駛系統的全局優化。
實際上,自動駕駛架構衍生于機器人架構,通常包括:感知(Perception)、決策(Decision-making)、控制 ( Control ) 三大模塊。
感知:自動駕駛的感知系統從多傳感器、如攝像頭、激光雷達、毫米波雷達等獲取信息,形成對周圍信息的理解。
決策:基于感知信息和預先設定的規則,形成車輛行動策略,将涉及路徑規劃、速度控制、車道保持、轉向等行為。
控制:負責實現決策中的行動,使車輛安全穩定地按照規劃的路徑和速度行駛。
前期,大家宣傳的端到端更多指的是 " 感知端到端 ",包括了 BEV+Transformer 的組合。
具體來説,Transformer 舍棄了傳統循環處理機制,引入 "Attention" 機制來處理序列數據,能夠理解復雜的數據關系。
随着技術發展,決策、規劃功能模塊也被集成到另一張神經網絡當中,形成感知輸出到軌迹輸出,兩者之間的通信接口是人為定義的感知類型,比如説兩輪車、紅綠燈、錐桶等,但整個架構還是由數據驅動,這就是目前很多廠家所采用的兩段式 " 端到端 "。
然而,只要是人為定義,還是會出現信息損失,所以説,未來的端到端發展追求 One Model,其性能上限也會更高。
從這一點看,當前大家宣傳的 " 端到端 ",并沒有達到 One Model 的程度,那麼,在體驗上,也要打一個問号的。
近日,同濟大學的朱西產教授就有過這麼一段發言:" 特斯拉的端到端、人工智能讓自動駕駛更加成為可能,端到端被特斯拉帶火了,國内的車企都在説端到端,但現在,誰宣布端到端(量產上車)了,他的這個車你就别買。"
這個判斷,聽上去有些絕對,但我們細究一下背後的邏輯,其實有很多啓發意義。
首先," 端到端 " 确實是特斯拉帶火的。在今年 3 月推出了 V12 版本的 FSD 後,特斯拉宣布他們已經删除了幾十萬行的人工規則代碼,實現了預想中的 " 端到端 "。
據了解,特斯拉的端到端,已經做到了 One Model,消除了感知和定位、決策和規劃、控制和執行之間的斷面,将三大模塊組合在一起,形成了一個龐大的神經網絡。
特斯拉的核心優勢,并非算法本身,而是數據和算力。車賣得早,也賣得多,他們早在北美做到了數據閉環,那就可以用來訓練整個系統;同時,AI 訓練算力也有優勢,至少,它不會被無端制裁。
消除斷面,抛掉準則模型,形成 One Model,智駕系統的上限會很高,當然,下限也會 " 摸不準 ",因為對于一些特殊路況,已經無法判斷它有沒有學會了。
這種 " 盲盒感 ",讓端到端存在巨大的體驗落差。如果你的 " 端到端 " 沒做好,其實還沒有之前的規則算法體驗好。
而在優化的路徑上很難 " 抄近路 ",你就是需要大量數據、大量 AI 算力。那麼,該怎麼辦?長遠看,就是賣出更多的車,以及儲備更多的 AI 算力。
而當前能做的,其實是 " 不冒進 "。如果一步跨不到 One Model,那就保留必要的冗餘,比如融合激光雷達的感知,安全準則模型也不要輕易丢。
" 分段式 " 的端到端不丢臉,但體驗還是要細打磨的,不然,某個版本更新後比之前的差,才是真的把用户當小白鼠了。
如果説汽車的上半場是電動化,那麼,如今超過 50% 的新能源滲透率,已經完成了車市大洗牌。
而被譽為下半場的 " 智能化 ",則成為了所有品牌不願錯過的 " 黃金聖杯 "。智駕是天梯,更是尖峰,技術更迭、架構調整、搶奪人才,每一個現象都是當下的常态。終究,賽道上的人都在賭一個明天。