今天小編分享的互聯網經驗:大模型「上車」,車企打響「開城戰」,歡迎閲讀。
圖片來源 @視覺中國
文 | 硅基研究室,作者|白嘉嘉
「鲶魚」特斯拉遊向了自動駕駛領網域。
8 月 14 日,特斯拉中國在一項聲明中表示,特斯拉已經在中國建立了數據中心,所有在中國大陸市場銷售車輛所產生的數據,都會存儲在中國境内。
據 36 氪報道,特斯拉已經從總部派了工程師來華,計劃組建一個 20 人左右的本地運營團隊,以推動自動駕駛解決方案 FSD(Full Self-Drive)在中國市場落地。
此外,特斯拉還嘗試在中國成立一個數據标注團隊,規模約上百人,意圖同樣指向自動駕駛。
其實,早在特斯拉擺尾前,自動駕駛,尤其是 NOA(導航輔助駕駛技術,Navigate On Autopilo)領網域,資本市場早就從大模型的浪潮中覺察到了風向。
二級市場上,具備類似 NOA 等高速領航功能軟體開發能力的阿爾特(300825.SZ)自 4 月 25 日迄今股價累計最大漲幅達 80.45%。
拉長時間看,在城市 NOA 方面搭建面向自動駕駛全球數據的光庭信息(301221.SZ)年内股價累計最大漲幅達 114.29%。
《2022 年汽車行業報告:城市 NOA 重新定義智能汽車》指出,2023 年搭載 NOA 的汽車總量或将為 70 萬輛,2025 年可能将達到 348 萬輛。其中,支持城市 NOA 功能的車型占比将從 2023 年的 17%迅速上升到 70%。
那麼在大模型的熱度下,2023 年會是「城市 NOA 元年」嗎?
從重地圖到重感知,車企打響「開城戰」
嚴格來説,從始至終,NOA 不是一項全新的、颠覆性的技術,它只是集成了 ACC 自适應巡航、LKA 車道保持輔助、ALC 自動變道輔助和高精地圖定位四項功能。
過去,在 NOA 的前面往往還有個定語——「高速」,因為無論在裏程數,還是路況復雜程度,「高速」扮演的顯然是那個供新手練級的小 Boss 角色。
但城市,完全是另一個級别的對手。
小巷子裏突然竄出的電瓶車、模糊的車道線、翻修道路導致的路線變更、更狹窄的視野……以高精度地圖為基礎的 NOA 技術在城市裏處處碰壁。
城市的復雜直接反映在了車企的數據庫裏。
根據小鵬汽車的數據,其城市 NOA 的代碼量是高速的 6 倍,感知模型數量是高速的 4 倍,預測 / 規劃 / 控制相關代碼量是高速的 88 倍。
但今年,車企和大模型玩家仿佛一起喝了「壯膽酒」,齊刷刷地将挺進這片 NOA 的深水區。
公開信息顯示,小鵬汽車預計下半年将在數十個無圖城市釋放 XNGP;華為 ADS2.0 三季度将在 15 座城市實現無圖商用輔助駕駛,四季度将擴大至 45 座城市;理想汽車将于年底前完成 100 個城市的 NOA 推送;毫末智行計劃到 2024 年在 100 座城市落地無圖城市 NOH。
是誰給了它們勇氣?答案或許離不開算法與大模型。
首先,算法上的突破讓汽車對現實的感知更加立體,車企在「重地圖」之外有了「重感知」的新選擇。
由于城市路況的復雜多變,「不依賴高精度地圖」成為了車企将智能駕駛落地城市的方案。探索過程中,特斯拉的 BEV+Transformer 方案為行業「脱圖」提供了技術上的可行性。
簡單來説,這套方案是将傳統自動駕駛的 2D 影像視角(Image View)加測距的感知方式,轉換為了鳥瞰視角下的 3D 感知,優勢在于保證了信息的完整性,有效解決物體遮擋問題,并極大方便後續規劃和控制任務。
放在大模型的語境下,這意味着在 BEV 空間内,感知和預測都在同一個空間進行,可以通過神經網絡實現端到端優化,輸出并行結果,避免上下遊誤差的傳遞與放大,從而開啓了借由數據驅動實現快速迭代的可能。
2021 年特斯拉推出「BEV+Transformer」方案後,逐漸成為了行業的主流,蔚小理均跟進,其中,華為的 ADS2.0 采用 GOD(融合激光雷達的 Occupancy+Transformer)被光大證券認為,有可能已經領先特斯拉。
算法搭建起了閉環框架,剩下的工作就是往框架中填充數據,并讓飛輪轉動起來。狂飙的大模型,無疑是這套方案最強勁的引擎。
在雲端,大模型的大容量優勢,可以幫助車企完成絕大多數的數據标注和挖掘工作,降低數據标注成本。同時,生成式模型的「湧現能力」,構建出了更多的仿真場景。
在車端,經由将多個分管不同子任務的小模型合并為一個大模型後,可以大幅減少車端推理計算時間,為消費者關心的安全性問題上了一重保險。
更重要的是,從傳統的分模塊處理到端到端感知決策一體化,大模型的泛化能力被認為有希望突破自動駕駛系統必須事先學習相應的情況才能做出反應的限制,克服困擾行業的長尾難題。
算法和大模型兩團火照亮了自動駕駛的前路,也為車企勾畫出了一條可以落地的產品路徑。
跑道清晰後,關鍵性節點随之浮現。
如火如荼的城市 NOA「開城戰」,本質上是車企間的數據收集戰,誰能率先用數據投喂出具備落地能力的「車載大腦」,誰就有希望領先行業站上新的維度,在這個汽車幾乎要卷成家電城的年份打出最有競争力的王牌。
繞不過的 L3,責權歸屬成終極難題
今天車企們湧向城市 NOA 的景象,很容易讓人聯想到 2017 年的自動駕駛熱潮。
當年,奧迪發布了全球首款可以實現 L3 級别自動駕駛的新型轎車奧迪 A8,這款車型也被定義為首款專用 L3 級别自動駕駛而開發的量產車型。
随後,包括吉利、廣汽、長安在内的大量車企跟進,紛紛向外透露了 L3 自動駕駛量產車型的計劃。
直到特斯拉的一起事故将自動駕駛從技術層面拉到了倫理和法律層面。
2019 年 3 月,美國佛羅裏達州的一輛特斯拉 Model 3 由于沒能識别出前方的大貨車,沒有自動變道也沒有提示駕駛員,以每小時 110 公裏的速度從貨車底下鑽過,致駕駛員死亡。
雖然這起事故被美國國家運輸安全委員會(NTSB)認定為駕駛員過度依賴 L2 級自動駕駛系統,但事故背後的所折射出的法律真空和 L3、L2 之間的微妙差别,給所有的車企潑了一盆冷水。
L3 是自動駕駛中最難過的一道坎,被業内人士稱為「恐怖谷」。
國際标準中,自動駕駛被分為 L0 到 L5 六個級别。L0 到 L2 階段被稱為輔助駕駛,駕駛員把控方向盤,系統提供類似加減速、變換道的輔助。L3 到 L5 被稱為自動駕駛階段,由系統逐漸接管車輛控制,适用範圍不斷擴大,駕駛員參與程度依次降低。
其中,L3 級自動駕駛由系統和駕駛員「共享」方向盤,常規情況下由系統把控,特殊情況下需要司機接管。
據當時特斯拉所搭載 Eye Q3 芯片的制造商 Mobileye 所説,馬斯克曾當面向他保證,Autopilot 會引入某種機制,保證司機必須手扶方向盤。而特斯拉所打出的「自動駕駛」的噱頭,卻讓消費者產生了可以松開方向盤的印象。
責權歸屬的模糊使 L3 成為了一塊車企不敢輕易踏入的禁地,行業也因此產生了分歧,一部分玩家選擇跳過 L3,直接開發 L4 無人駕駛系統,而另一部分玩家則選擇停留在 L2 或 L2+,甚至是 L2++。
玩家的分歧造就了今天自動駕駛市場的多面向。
第一個面向是「無人車跑在伊甸園」。
以北京亦莊自動駕駛示範區為例。在建設早期,亦莊就把高精度的數據地圖列為了重點建設項目之一,而這也是後來無人駕駛研發商能夠上路的基礎。全國有類似基礎的地區甚至都找不出第二個。
而且,即便實現了車内無人,運營中心仍需配備後台工程師随時監控。來去之間成本并沒有降低多少。
類似的困境包圍着所有致力于 L4 級研發的車企,資本眼看落地無望,紛紛抽身離場。Waymo 估值從 1750 億美元下跌至 300 億美元,亞馬遜無人配送車 Scout 項目于 2022 年十月被關停,數據顯示,和巅峰期相比,自動駕駛相關企業市值整體縮水 80%。
第二個面向是「沿途下蛋」。
既然 L4 難落地,許多人萌生了技術賦能車企做輔助駕駛的想法,一能回籠資金,二能擴充數據量。
但這條路也沒那麼好走,與期待質變的 L4 領網域不同,身處 L2 的車企還需要考量成本、續航、設計等内容,輔助駕駛往往只是錦上添花,加上責權不清晰等因素的幹擾,無論是車企還是消費者,都不敢輕易地邁出那一步。
第三個面向則是「人員流動頻繁」。
據「硅基研究室」統計,2023 年至今,自動駕駛相關的高層人員離職事件就高達 22 起,其中不乏曾被資本捧在手心裏的企業。
有觀點認為,人員流動頻繁可以促進企業間的技術交流,但觀察這些人員的流向,整體呈現出向產業鏈上遊匯集的趨勢,也就是從車廠走向了大模型。
這條趨勢固然和眼下的大模型熱有關,究其根本,行業破局的關鍵仍要從大模型下手。
與車企紛紛下場開城結合,上述三個趨勢隐隐透露出一股決心,将事故率從 1% 降低到 0.001% 甚至更低并非毫無意義,過去被刻意回避的 L3 也已避無可避,剩下唯一需要考慮的問題是,如何用大模型撬開它。
同時,困擾行業已久的責權模糊問題,正在被提上日程。
在 6 月下旬,工信部副部長辛國斌表示:" 将支持有條件的自動駕駛(L3 級自動駕駛),及更高級别自動駕駛功能的商業化應用,并将發布新版智能網聯汽車标準體系指南。我們已經啓動了這項工作,地方也在積極響應 "。
大模型「上車」,戰場在雲端
今年 8 月 2 日,馬斯克在「X」平台上發布帖文,其中提到了特斯拉正在開發 " 車輛控制是特斯拉 FSD 人工智能的最後一塊拼圖,目前正在接受訓練 ",并透露 AI 将使原始 FSD 中的三十萬行 C++ 控制代碼減少約兩個數量級。
與 7 月 20 日他在第二季度财報電話會議上透露出的," 明年底之前,我們将花費遠遠超過 10 億美元在 Dojo 智算中心項目上,我們有數量驚人的視頻數據要進行訓練 " 相結合,不難看出 FSD 快速成長的背後,智算中心所起到的關鍵作用。
而這也透露出,未來車企間的戰場,其實在雲端。
之所以特斯拉選擇投入大量資金自建智算中心,效率和成本是兩個關鍵詞。
自動駕駛任務訓練的特點是檔案多而雜,且多為視頻、影像數據,因此這類模型的訓練和測試,靠的并不是 CPU,而是以 AI 加速器為主的浮點計算能力,智算中心的特征就是以大規模 GPU 算力作為 AI 模型迭代的基礎。
雲計算的本質是租賃計算設備,雲服務商的設備都是統一采購,為了獲得更多客户,這些設備都具備很大的通用性,設備内部使用的 CPU、GPU/AI 加速器、内存的型号與規格都相對固定,很難與車企和自動駕駛公司的算法形成最佳匹配。
并且,雲服務廠商對自動駕駛算法的了解程度不高,不可避免的會在調度算力時出現損耗和效率不高的問題。
而自建算力中心可針對自動駕駛應用特征布置更專業的算力集群、性能加速工具和 AI 大數據平台,使得模型訓練性能、GPU 資源利用率和算法研發效能都大大提升。
小鵬汽車董事長何小鵬曾表态:" 如果現在不以這樣的方式(智算中心)提前儲備算力,那麼今後 5 年内,企業算力成本會從億級,加到數十億級。"
目前,國内已經有多家車企與雲廠商合作建立專用的智算中心。
比如,小鵬汽車與阿裏雲合建了智算中心「扶搖」,專門用于自動駕駛模型訓練,算力可達到 600PFLOPS;毫末智行與火山引擎聯合打造了國内自動駕駛行業最大的智算中心「雪湖 . 綠洲」,每秒浮點運算可達到 67 億億次;吉利也與阿裏雲合建了星睿智算中心,計算能力達到了 81 億億次 / 秒,結合領先的算力調度管理算法和研發體系,吉利的整體研發效能取得 20% 的提升。
從這個角度來看,強調「不造車」的華為,将成為特斯拉最有力的競争對手。
近日,華為智能汽車解決方案 BU CEO 餘承東在微博上曝光首款搭載鴻蒙 4 的車型——華為和奇瑞合作的首款純電轎跑車「Luxeed」。
這意味着,奇瑞将極有可能成為繼賽力斯後,第二家與華為合作發布華為智選車產品的合作車企,而華為一直期望打造的智選車生态品牌聯盟,也有望加速取得實質性進展。
關于智選車業務,市場「憂喜」參半。
「憂」在于,智選車的潛力肉眼可見的狹窄。歐美日企業無法選擇它,國内新勢力有自己的追求;傳統的車企,如果怕失去「靈魂」也不會選它。
而華為在智選車業務上投入巨大,若沒有大量使用、大量銷售,就不能實現商業閉環。
「喜」則是因為,在華為智選車模式推出之前,業内并沒有一個既有智能化核心技術與解決方案,又有強大 to C 能力與營銷零售渠道的角色。
通過智選模式,華為将深度參與品牌打造、產品設計和定義、營銷服務,賦能中小車企。
同時,華為汽車雲所提供的數據生成、自動标注、模型訓練、雲端仿真、虛實結合仿真、數據閉環等一系列能力,也能幫助車企和商用車企業加速自動駕駛算法的開發驗證和優化迭代,降低成本和風險,提升效率和安全性。
大洋的彼岸,特斯拉也透露出公司正在讨論将其全自動駕駛(FSD)駕駛輔助技術授權給另一家主要汽車制造商,并表示,授權 FSD 技術一直是計劃的一部分。
值得一提的是,特斯拉在中國建立數據标注團隊和數據存儲中心,除了順應國家在信息安全方面的硬性要求外,也收獲了更豐富的工具包。
對轉型不暢或技術落後的部分造車新勢力來説,特斯拉 " 數據 + 算法 + 存儲 " 的一條龍服務,顯然吸引力不小。
從最初的分布式計算、單個子系統擁有自己的 ECU,到網域控制器邏輯、以功能劃分集成化控制運算,再到最終實現整車運算能力的高速集中、智能化分配算力,汽車從工業品向電子消費品、智能終端逐步演化。
高通公司首席商務官吉姆 · 凱西的比喻或許最為貼切:" 汽車正在成為‘車輪上的聯網計算機’ "。
在這一過程中,固然還有軟硬體成本過高、法律法規不完善、消費者認同度較低等問題,但好在新的賽段已經到來,也終歸是「車到山前必有路」。