今天小編分享的汽車經驗:2024年汽車智能化關鍵詞:AI大模型、純視覺+端到端,歡迎閱讀。
經濟觀察網 周信 / 文 2024 年被廣泛認為是人工智能的元年,人工智能的研究與應用如雨後春筍般湧現。得益于此,2024 年汽車智能化飛速發展,不管是智能座艙還是智能駕駛,都有了質變性的提升。
AI 大模型的應用,促使汽車智能座艙的聽、說、人機互動、車手互聯、個性化體驗實現了全面更新,汽車座艙能夠更流暢、更智能地理解用戶,并提供定制化的服務和體驗。
而 " 端到端 " 技術的應用,則讓高等級智能輔助駕駛從高速 NOA 向城市 NOA 快速突進,此前眾多車企規劃的逐步 " 開城 " 計劃也迅速轉向 " 全國開城 ",城市 NOA 的技術的迭代速度越來越快,智駕技術也越來越像 " 老司機 "。
在 AI 加持下,新一輪智能化革命蓄勢待發。AI Agent 即将上車,最終将實現人 " 人 " 互動。在端到端技術尚未完全被消化之際,業内又掀起 " 一段式端到端 " 自動駕駛技術競賽,各家企業都希望在智駕技術方面實現跨越性的領先。
但與此同時,智能化的發展深度依賴數據、算法、算力。" 到了人工智能時代,汽車行業最缺的是智算的基礎設施,這也将會成為智能網聯汽車加速發展的主要矛盾。" 中國電動汽車百人會副理事長兼秘書長張永偉表示。
AI 大模型讓智能座艙更類人
随着智能化技術的日新月異,車企比拼智駕、智艙技術上車的節奏令人眼花缭亂,也讓很多人享受到了智能化進步帶來的更好體驗。
2019 至 2022 年,預訓練模型(Pre-trained Model)井噴式出現;2023 年,首個真正意義上的大語言模型(Large Language Model)ChatGPT 落地,谷歌、亞馬遜、百度、阿裡、騰訊等科技巨頭先後加入。
根據網信辦發布的數據統計,目前已有超過 283 個大模型通過備案。大模型與其他模型最大的區别在于 " 湧現 " 能力,有了類人的 " 思維方式 "。在預訓練階段,随着模型規模的擴大和參數量的提升,在超過某一阈值後,模型準确度就會大幅提升。
去年 12 月,理想汽車開始批量推送 OTA5.0,認知大模型 Mind GPT 首次上車,賦能理想汽車智能助手 " 理想同學 " 擁有類似于 ChatGPT、Midjourney 等生成式 AI 的能力,拉開了智能座艙的 AI 競争序幕。
在智能座艙領網域,現階段 AI 大模型主要應用于車載語音助手,通過深化語義理解和優化語料生成,AI 大模型能夠精準捕捉用戶的意圖與需求,提供自然、拟人、流暢且邏輯清晰的回答與建議。
今年 4 月,蔚來汽車自研的 AI 大模型 NOMI GPT 上線,實現了視覺(影像)、聽覺(聲音)、觸覺(車身傳感器信息)等維度的感知能力,具備包括語音、視覺和文本等多種形式的互動能力。
AI 大模型還具備強大的短期記憶及長期記憶,長期記憶存儲和回憶過去的數據和經驗,短期記憶幫助快速響應和即時處理信息。基于此,座艙能夠主動為用戶提供音樂、新聞、導航等信息,自動調整座椅位置、後視鏡角度、氛圍燈顏色、空調溫度等。
目前,AI 在智能座艙上的應用更多是通過語音識别、影像識别等提升感知模塊的準确度。而随着多模态及大模型技術的發展,基于語音、手勢控制和視覺多模态能夠讓智能座艙更加準确地識别用戶需求和意圖。
在 AI 智能體的作用下,智能座艙能提升復雜問題的快速拆解、推理、決策、并分發執行的技術能力,切實解決用戶困難,滿足或預測用戶需求,實現類人的執行能力,進行主動互動,提供個性化服務。
同時,智能座艙也将真正向改變場景體驗轉變,打破 " 車 "" 家 "" 手機 " 的功能和習慣壁壘,在高頻率使用能工上深挖功能與場景結合,在低頻使用的功能方面則進一步提升已用、實用性,讓汽車真正成為用戶第三智能空間。
" 端到端 " 助推高階智駕快速普及
除了智能座艙,智能駕駛輔助技術在今年也實現了革命性的進步。今年 3 月,特斯拉推出采用 " 端到端 " 自動駕駛解決方案的 V12 版本 FSD(全稱 Full-Self Driving,完全自動駕駛)能夠高度模拟人類駕駛行為,實現感知決策一體化,引起了全球汽車產業的震動。
所謂 " 端到端自動駕駛 ",一般指控制系統讀取原始傳感器的數據後,僅通過神經網絡直接計算出控制指令,其中不包含任何人為設計的規則模塊。
在特斯拉推出 " 端到端 " 後,國内的造車新勢力企業也開始上馬 " 端到端 " 智駕技術。小鵬汽車在 "520AI DAY" 發布會上宣布,小鵬國内首個 " 端到端 " 大模型量產上車。7 月,理想汽車發布了基于 " 端到端 " 模型、VLM 視覺語言模型和世界模型的全新自動駕駛技術架構。
在特斯拉布局 " 端到端 " 技術的時候,國内智駕公司如 Momenta、元戎啟行等也于 2023 年做出了相關布局。商湯絕影、百度 Apollo、輕舟智航等供應商,也公布了各自在 " 端到端 " 領網域的計劃和落地進展。
傳統自主車企依托智駕供應商的技術,也快速實現了 " 端到端 " 的上車。8 月,采用元戎啟行 " 端到端 " 智駕方案的魏牌全新藍山,成為中大型新能源 SUV 市場的爆款車型。采用 Momenta" 端到端 " 高階智駕方案的廣汽埃安第二代 AION V 霸王龍、埃安 RT 都取得了不錯的市場反響。
與 " 端到端 " 技術一起發展的還有去激光雷達的純視覺技術路線。小鵬汽車發布了 AI 鷹眼視覺方案,華為帶來了 ADS SE(乾崑智駕的基礎版)、卓馭(原大疆車載)帶來了成行平台。智駕供應商如鑑智機器人、商湯絕影、文遠知行等也都發布了純視覺智駕方案。
" 純視覺 + 端到端,讓高階智駕技術快速迭代、快速普及。地平線方面向經濟觀察網表示,截至 2024 年 10 月,中國自主品牌高階智駕滲透率達到了 11.7%,2024 年推出的 NEV 新車種,L2+ 及以上級别智能駕駛功能的搭載率超過 50%。
在 " 端到端 " 技術正火熱,眾多車企甚至還沒上馬端到端技術之際," 一段式端到端 " 又成為眾多自動駕駛公司和車企的布局重點。
相比 " 兩段式端到端 " 方案将信息經過感知模型過濾後再到規控模型的兩個信息處理環節," 一段式端到端 " 将智駕的感知、預測決策、規劃多個模塊合為一體,直接從傳感器輸入外部環境信息,并輸出車輛的行駛軌迹,只有一個信息處理環節。
今年 4 月的北京車展上,商湯絕影發布了其 " 一段式端到端 " 自動駕駛技術 DriveAGI;9 月底,Momenta 也發布了首個量產 " 一段式端到端 " 智駕大模型。小米、華為等眾多企業也開始布局 " 一段式端到端 "。
辰韬資本聯合多家部門在 8 月發布的 2024 年度《端到端自動駕駛行業研究報告》認為," 一段式端到端 " 系統中性預期落地時間會晚于模塊化端到端 1~2 年時間,從 2026 年至 2027 年開始上車量產。
在 AI 大模型推高智能座艙和智駕競争天花板的同時,AI 算力也在急劇消耗。人工智能三要素是數據、算法、算力,整個產業鏈是倒三角結構,越往算力方向發展,能提供高算力的廠家越少。
根據中國電動汽車百人會的數據," 端到端 " 智能駕駛領網域的起步算力為 1 EFLOPS,而座艙大模型的基礎模型算力需求大于 10EFLOPS,垂網域模型算力需求為數百到數千 PFLOPS 。
理想狀态下,一家車企在 " 端到端 " 大模型上消耗的算力就高達 100 EFLOPS。但數據顯示,國内車企現有的算力都在 10 EFLOPS 以下,中國移動、中國電信、中國聯通三大運營商的規劃算力合計才 53 EFLOPS。
如何追求端雲一體化,更好地執行更高的算力,降低主機廠單車成本,同時優化雲端算力成本,是當前行業面臨的主要挑戰。