今天小編分享的互聯網經驗:小鵬智駕李力耘:我們處于無人化前夜,智駕Scaling Law還有很大紅利,歡迎閱讀。
文丨李安琪
編輯丨李勤
從美國試駕完特斯拉 FSD 回來,小鵬智能駕駛負責人李力耘有兩大感受。其一是,特斯拉 FSD 在北美地區的确是獨一檔,但他也意識到,需要對特斯拉祛魅。
" 中美路況非常不一樣,我們更懂中國路況,更懂國人的駕駛習慣,特斯拉可能更懂美國人的駕駛習慣,很難說誰更強。" 李力耘說。
角逐和較量在智駕圈裡已經不新鮮。過去一年裡,小鵬等車企迅速卷入了 " 全國都能開 "" 端到端 " 的智能駕駛競争。
在今年 12 月末,小鵬還計劃交付 " 車位到車位 " 智駕駕駛功能,技術模型也更新為 " 一段式端到端 ",可實現全場景覆蓋,包括園區低速行駛,未來會覆蓋泊車、高速場景,甚至海外智駕。
" 車位到車位 " 是當下車企智能駕駛競争的技術高地。如字面含義,車企希望用戶在車位就能啟動智駕,車輛低速巡航、自主過閘機、上高速,在城市道路通行,最後泊入目的車位。
12 月初,特斯拉向部分測試用戶推送的特斯拉 FSD v13.2 更新版本,就包含了從停車狀态啟動的 FSD,也就是 " 車位到車位 " 功能。前不久理想汽車也宣布突出該功能,華為和小米汽車的類似功能,同樣即将推出。
智能駕駛走向自動駕駛的過程不是一蹴而就,而是車企們通過技術攻堅,不斷完成高速、城區、泊車、園區等場景拼圖。如今,這一步即将完成。
李力耘也表示,現在小鵬處于 " 無人化(駕駛)前夜 ",明年在能力上會有更大突破," 可能先在 Max 車型上,小鵬智駕逐步提供類似無人駕駛的能力。"
這幾乎是最早給出無人駕駛節點的國内車企。
小鵬的确是國内最早貼上 " 智駕 " 标籤的車企之一。2019 年,小鵬就在轎跑車型 P7 上開發了高速 NGP 功能,對标特斯拉 NOA。
但因為起步早,小鵬幾乎走過所有技術路線,從依賴高精地圖,轉向無圖方案,随後進化到端到端。2023 年 8 月,小鵬智駕還經歷了靈魂人物吳新宙離職、團隊動蕩等。小鵬智駕由此進入守城階段。
同一時期,行業有玩家迅速進入了高階智駕量產狀态。比如壓強式投入的華為,率先推出了 " 全國都能開 " 智駕功能;理想汽車則由于輕包袱,果斷切入 " 端到端 " 技術,甚至直接更換到激進的 " 一段式端到端 " 方案。
從今年中以來,小鵬智駕試圖回歸與反擊。
近日,小鵬智駕負責人李力耘接受了 36 氪的采訪,他分享了小鵬如何将 AI 融入智駕,以及标配純視覺智駕後,如何實現科技平權與商業閉環。
李力耘告訴 36 氪,小鵬對于端到端的研發始于 2023 年 4 月,當時主要是想用 AI 的認路能力,擺脫對高精地圖的依賴。
結果小鵬發現," 一段式端到端 " 大模型上線之後,原來需要花很長時間打磨的場景,如特殊分流、右轉或掉頭等問題,很快就被解決了。
今年 5 月,小鵬正式推出 " 端到端 " 智駕大模型,包含神經網絡 XNet、規控大模型 XPlanner、大語言模型 XBrain 三大部分。
端到端智駕依賴的核心資源之一就是數據,小鵬宣稱,其端到端大模型訓練數據量已經達到 2000 萬 clips。理想汽車也公開過其端到端的訓練數據,目前大約在 800 萬 clips。
對于 2000 萬 clips 的數據起點,李力耘告訴 36 氪,這得益于過去基于規則的智駕經驗積累,小鵬當前的數據采集和訓練效率很高,例如通過車端規則經驗實時标注,精準采集訓練所需片段,從而針對目标場景進行精準密集訓練。
他同時認為,在海量數據、不斷提升的雲端和車端算力下,自動駕駛的 Scaling Law 還有很大紅利。
Scaling Law 是大模型行業的一個定律,通常表示模型參數越大、數據集越大和計算資源增多,模型性能更好。
小鵬推出 " 端到端 " 大模型智駕方案的标志性成果,就是更果斷擺脫對激光雷達的依賴,将純視覺作為智駕技術路線。例如在新車 P7+ 上,小鵬就标配了純視覺智駕 AI 鷹眼方案。
但在行業中,未來數年的主流選擇還是以視覺 + 激光雷達作為主要傳感器。對此,李力耘向 36 氪汽車表示,走純視覺路線其實是出于第一性原理。
在他看來,人們生活的交通環境,包括路牌、路标、紅綠燈,整個道路甚至車的造型都是為人設計的," 人最重要的傳感器是眼睛,所以純視覺一定是最直接、最高效的解決方案。"
小鵬也宣稱,其基于 AI 鷹眼的純視覺方案,能做到比人眼視覺更好的效果,可以很好應對大光差、逆光場景。
在純視覺智駕之路上,小鵬汽車決定走到底,李力耘告訴 36 氪,從 P7+ 車型開始,不再有 Max 和 Pro 的版本區分,而是 " 全系标配 Max,也就是小鵬 AI 圖靈智駕(NGP),都會用純視覺方案。"
這背後蘊含着一套清晰的智駕商業化策略," 我們會用一段式端到端放大我們的車型優勢,不僅标配所有車型,更希望覆蓋所有功能,實現點到點,包括賦能海外的智駕。" 純視覺智駕方案,無疑在成本上擁有先天優勢。
實際上,憑借在同級車型中做出 " 智能差異化 " 的賽馬策略,小鵬已經在兩款新車 MONA M03 和 P7+ 上,嘗到了甜頭。
M03 自 9 月上市以來連續 3 個月銷量破萬,P7+ 上市 3 小時也獲得了超 3 萬大定。這兩款車的售價都在 20 萬元以下,這個價格帶是比亞迪等老牌車企的優勢領網域。
" 智駕是小鵬 P7+ 用戶購車的 top 理由。" 李力耘說,當下熱賣款 M03 的泊車體驗也與 Max 版智駕同級。
智能駕駛技術在車企的商業體系裡已經越嵌越深,同時,也在承接整個 AI 技術的發展紅利,快速迭代。這是資源和效率交織的產物。
李力耘說,如果把端到端的技術趨勢看作智能駕駛駕領網域的一場 " 工業革命 ",能真正實現轉型更新的企業其實是少數,大部分人還是會面臨更殘酷的競争。
因為,端到端不是讓事情變得更簡單,而是讓整個迭代鏈條變得更長,更加不可控,某種程度上需要投入更多的資源,包括更大算力,更加精英的 AI 研究人員。
" 我更願意相信是車企,而不是供應商,能夠率先從輔助駕駛突破到無人駕駛。"
以下是 36 氪汽車與小鵬智駕負責人李力耘的對話,内容略經編輯:
「談體驗:" 車位到車位 " 之争,用戶會為更好的體驗買單」
36 氪汽車:聽說你剛從美國回來,有體驗特斯拉的 FSD v13 嗎?
李力耘:但很遺憾,因為 v13 還沒有量產推給用戶,我沒機會試 FSD v13,但開了一個星期 v12.5。有兩點可以總結,第一是祛魅,第二特斯拉在北美是獨一檔的存在,很多值得學習的地方,包括停車場激活、開進停車場,這些是用戶非常喜歡的功能。
去魅的話,我覺得中美路況非常不一樣,無論是我們 XNGP 5.4.0 還是即将發布的 5.5.0 版本,智駕都和特斯拉不相伯仲。我們更懂中國路況,更懂國人的駕駛習慣,特斯拉可能更懂美國人的駕駛習慣,很難說誰更強,我非常期待 FSD 進入中國之後的表現。
36 氪汽車:行業會說特斯拉技術領先國内半年到一年,您覺得這種技術領先現在還有多少?
李力耘:從技術方法論上,小鵬和特斯拉、OpenAI 這樣的全球 AI 企業不謀而合,我們強調雲端大模型,參數量是車端 80 倍以上。我們雲端大模型的訓練數據量達到 2000 萬以上 clips。每個 clips 可以理解成大約一分鍾的小電影。每個模型都基于大量數據、在雲端訓練。我們有個說法叫 " 雲上一天,地上三五年 "。
我們希望把雲端能力通過蒸餾下放到不同芯片平台,甚至未來換芯片後也能把雲端模型下放。
36 氪汽車:您覺得特斯拉 FSD v13 上的 " 車位到車位 " 跟國内的 " 車位到車位 " 有區别嗎?
李力耘:我們即将推給用戶的 XOS 5.5.0 版本上,用 " 一段式端到端 " 給用戶提供了一個完整的 " 車位到車位 " 體驗。其實在停車場和地庫,2021 年我們就推出了 VPA(記憶泊車)功能,但用戶體驗并不好,用戶滲透率沒有城區智駕那麼高。
所以,我們用 " 一段式端到端 " 實現所有車型标配後,現在去實現全場景覆蓋,包括 " 車位到車位 " 低速行駛、園區行駛,未來還會覆蓋泊車、高速,甚至海外智駕。我們希望給用戶帶來更加連貫、絲滑的體驗,而不是有割裂感、類似于 VPA+NOA 的組合體驗。
36 氪汽車:用戶第一次開到新的地庫,需要先記憶一遍才能實現點到點嗎?
李力耘:第一次肯定沒有地圖,很難,如果有園區内導航指引會好一些。就像你第一次去一個地庫,也需要一些指引或者借助他人的記憶,我們可以做到無感學習和記憶。第二次去就可以有絲滑的 " 車位到車位 " 能力。
36 氪汽車:小鵬之前也有記憶行車,比如記憶 10 條路線,這跟 " 車位到車位 " 的本質區别是什麼?
李力耘:最大區别還是體驗層面。小鵬智駕在 2024 年最大的兩個變化,第一是 AI 化,面向 AI 進行組織變革,進行 AI 能力提升,另一個變化是,我們覺得用戶不會為更好的科技買單,但一定會為更好的體驗買單。
用端到端大模型賦能 " 車位到車位 " 後,用戶體驗會大大提升,雖然有時候可能需要學習、參考先驗信息,但學習感會很弱。
「談 AI:智駕 Scaling Law 還沒到盡頭」
36 氪汽車:今年智駕行業變化很大,年初卷 " 全國都能開 ",後來變成端到端,現在是 " 車位到車位 ",您怎麼看這種競争?明年的競争重點是什麼?
李力耘:原來小鵬智駕是孤勇者,現在是百舸争流,明年的競争一定會更加激烈和有趣。
今年從 " 全國能開 " 逐步走向端到端,比拼的是博弈能力、比拼拟人化。到 " 車位到車位 " 之後,我覺得我們處在 " 無人化的前夜 " 階段,小鵬智駕會笃定地走向無人駕駛。
我們希望,明年在能力上有所突破,可能先在 Max 車型上,小鵬智駕逐步提供類似無人駕駛的能力,接管次數無限降低。随着法規推進,或者新車型推出,我們一定會做出走向無人化的能力。小鵬的最終目标是解放駕駛員的雙手、解放精力。
36 氪汽車:怎麼做到?Scaling Law 在智駕領網域有效嗎?
李力耘:小鵬是 Scaling Law 的忠實信徒。雖然最近很多 AI 前沿工作說 Scaling Law、預訓練遇到了瓶頸。但從算力、數據量來看,我覺得自動駕駛的 Scaling Law 還有很大紅利。
數據方面,互聯網優質數據大概 600-700T 之後就會有瓶頸。但智駕大部分企業今年才逐步轉向端到端,自動駕駛大量優質駕駛數據積累還沒有到盡頭。
另外,無論車端還是雲端算力,都會有着更顯著的增長,模型參數也會進一步擴大。我覺得自動駕駛的 Scaling Law 還沒有到盡頭。
36 氪汽車:行業會有些做法,比如将端到端大模型跟視覺語言模型融合,您認同這種觀點嗎?
李力耘:我不反對。這些觀點在以不同的視角來描述端到端,在我看來可能殊途同歸。無論是視覺語言大模型,還是視覺動作大模型,本質是通過大量數據輸入,有一定推理能力,很好地實現類人駕駛的模型。
小鵬以視覺為主,我們實現了 " 光子進、控制出 "。當然,從多模态輸入角度來看,視覺只是一個傳感器,本身還有各種車道、GPS 或者是各種各樣多模态輸入。
網上的海量數據會讓模型有更強的認知能力,識字認路。但是我們認為,擁有高質量的、豐富駕駛數據可以更好解決車輛駕駛的小腦問題,這跟大模型不衝突。
很多駕駛是相對本能的動作,就像人類的小腦,當然也需要大腦的能力。所以在我們的一段式端到端大模型中,Xbrian 可以認路識字,做一些簡單推理,但更多時候還是對加減速控制、變道時機選擇,或者繞行處理,更偏本能的小腦行為。
我們是既希望有聰明的大腦,能夠推理思考,還是一個比較靈敏的、肌肉記憶很好的老司機。
36 氪汽車:小鵬是從什麼時候開始做端到端大模型?
李力耘:2023 年 4 月份,我們開始布局整個 " 端到端 " 技術棧。那時候我們希望用端到端來解決對高精地圖的依賴問題,做到全國都能開,所以當時智駕 AI 化,更注重識路、找路。2023 年底,我們意識到需要把端到端的能力進一步擴大,做成一段式端到端。
36 氪汽車:2023 年 4 月您和團隊當時是怎樣的狀态?
李力耘:當時主要在開城,狀态很難,因為把高精地圖的拐杖扔掉之後,嘗試用實時算法去認全國各種各樣的路況,并且讓車能夠配合好行駛,是非常困難的。唯一能夠徹底解決這件事就是靠 AI,用類人的方法把路認好、把路選好,讓車開好。
36 氪汽車:那時候就定下了整個端到端、AI 模型的框架嗎?
李力耘:方向是笃定的,但我覺得技術變化會非常快。今年以來,我們也看到了類似于 Sora、ChatGPT 非常強的 AI 能力湧現。我們也更新了 AI 的戰略,包括對雲端模型 Scaling Law 的認知,緊跟 AI 最前沿,然後應用在自動駕駛領網域。
36 氪汽車:小鵬智駕起步非常早,經歷了很多個版本,在端到端進化這條路上你們甩掉了哪些包袱?
李力耘:端到端模型的建立是個非常緩慢的過程。系統工作方式從原來多技術模塊變成 AI 中台。我們會着重建設數據采集能力、數據清洗,模型快速訓練、部署、調試,确保模型高效解決問題。
規則還是很重要的兜底能力,一方面是為安全兜底,第二,原來規則積累的工程基礎,可以讓我們把整個數據閉環、飛輪非常高效地建立起來。
36 氪汽車:從 2023 年到現在,如果要選取比較重大的轉捩點,您覺得會是什麼時刻?
李力耘:重大轉折是今年四五月,小鵬一段式端到端大模型上線之後,我們發現,原來需要花很長時間打磨的一些問題,比如花幾個月去打磨一些特殊的分流、右轉或者是掉頭等場景,解決得特别快,我們很驚訝。
原來的方案是小模塊 AI 驅動,然後做路徑規劃、速度規劃,整個鏈條非常長,遇到的問題很多。但我們用了 AI 能力後,環島掉頭、小路、很難的右轉場景都有很大的能力提升,效率比原來高很多。
36 氪汽車:華為沒有把純視覺當成主流方案,小鵬為什麼會這麼堅決地要做純視覺?
李力耘:其實就是第一性原理。我們生活的交通環境,包括路牌、路标、紅綠燈,整個道路甚至車的造型都是為人來設計的,人最重要的傳感器是眼睛,所以純視覺一定是最直接、最高效的解決方案。特斯拉也分享過觀點,認為激光雷達 + 純視覺 1+1 并不大于或等于 2,而是小于 2。
小鵬的 AI 鷹眼視覺做到了比人的視覺更好的效果。在很多大光差、逆光的情況下會比人眼有更好的識别效果,這也是我們 LOFIC 架構的特點。當然我們也沒有放棄主動的傳感器,也會通過多模态跟毫米波雷達,超聲波雷達去做融合。
36 氪汽車:在高速道路上或者一些特殊天氣,激光雷達還是有很好感知效果,小鵬純視覺有沒有解決這種特殊天氣場景下的方案?
李力耘:我恰恰覺得,這些情況下,第一性原理是更好的。再好的激光雷達在遠處的點雲也是比較稀疏的。激光雷達不是完美的,在一些雨水天氣情況下它也有問題。小鵬 AI 鷹眼視覺是通過更大算力,看得更清楚、更遠、反應更快,車輛反應速度提升了百分之四十幾,對場景做出很好的響應。
36 氪汽車:後續像在 X9 這些車型上,還是會保留激光雷達和純視覺兩種不同的方案嗎?
李力耘:我們會全系标配 Max,也就是小鵬 AI 圖靈智駕(NGP),都會用純視覺方案。
36 氪汽車:那方案配置方面,還會分 Max 、Pro 嗎?
李力耘 : 我們會标配 Max,從 P7+ 開始。
36 氪汽車:小鵬自研的智駕芯片,結合你們的軟體方案後,可以發揮出什麼樣的效果?
李力耘:小鵬自研芯片的初衷就是實現軟硬體一體,最大效能地發揮軟體的威力。但更重要的是在雲端模型的賦能下,我們會對芯片做針對性優化,給用戶提供最好的體驗。
36 氪汽車:小鵬智駕下一個轉捩點會是什麼時候?
李力耘:2025 年小鵬智駕轉捩點會在年中,智駕能力會有更大飛躍,可能會從一段式端到端,跨越到全新的 AI 迭代模式。
36 氪汽車:智駕行業密集迭代,公司創始人何小鵬怎麼保持對智駕前沿的認知?
李力耘:小鵬智駕真正的一号位和靈魂就是何小鵬。因為他笃定 AI,笃定智能駕駛到自動駕駛,才有小鵬智駕的自我變革。他非常從用戶視角來看智駕,會去開智駕的中間過程版本和量產版本,感受變化,反饋問題。
所以對行業态勢的感知一定是多模态的。現在我們特别注重用戶反饋的 NPS,智駕每個版本都會去做用戶調研。當然也會和頂尖 AI 企業保持緊密接觸,包括去美國開車、取經等,兼聽則明。
36 氪汽車:何小鵬上一次給你反饋智駕問題是什麼時候?
李力耘:不久前,我們把 XOS 5.5.0 過程版也推給了他,他覺得我們又解決了 30%-40% 的問題。
36 氪汽車:端到端方案依賴海量數據,小鵬達成了 2000 萬 clips 的訓練數據,在這方面小鵬有沒有什麼心得?
李力耘:得益于兩方面,一方面是 AI 智駕鐵軍,車端積累多年的規則和嚴謹算法,很多事情在車端做是事半功倍的。
另一方面,得益于小鵬 AI 的進展,我們需要大量、高效敏捷地去挖掘數據,訓練模型。所以我們既做車端模型、雲端模型,也做了非常好的 AI 工具來挖掘數據。
這背後是組織方式的改變,我們有個 AI 效能部門,今年年中面向 AI 成立的新部門,專門訓練各種各樣的 AI 提效工具,包括用 AI 寫代碼、檢查代碼、自動挖掘數據。
36 氪汽車:小鵬智駕 2000 萬 clips 的數據是如何達成的?
李力耘:我們大約在 2022 年底,就開始預研如何引入 AI 大模型,已經有了幾年的積累。而且我們地把規則時代積累的經驗移植到當前的數據采集和訓練裡,例如通過車端規則經驗實時标注,精準采集訓練所需片段,從而針對目标場景進行精準密集訓練,能夠大幅地提升采集和訓練效率。
「談競争:智駕工業革命,轉型成功的是少數」
36 氪汽車:友商通過端到端快速實現了高階智駕量產。端到端會是行業其他人彎道超車的方案嗎?
李力耘:如果把端到端技術趨勢看作智駕領網域的一場 " 工業革命 ",每一次工業革命中,真正實現轉型更新是少數,大部分人還是面臨更殘酷的競争。
端到端不是讓事情變得更簡單了,組織架構的确跟原來不一樣,原來每個技術模塊都要基于規則的工程師,比如定感知、定位、規劃、融合、地圖、控制,現在就變成了數據閉環的問題。
數據采集、模型訓練、模型部署,模型調試,它讓整個迭代鏈條變得更長,更加不可控,某種程度上需要投入更多的資源,包括更大算力,更加精英的 AI 的研究人員。
36 氪汽車:智駕供應商跟傳統車企如果保持比較深度的綁定,能繼續參與這場遊戲嗎?
李力耘:第一,智駕真正從輔助駕駛走到無人駕駛一定是滿足第一性原理的。我更願意相信是主機廠,而不是供應商,能夠率先從輔助駕駛突破到無人駕駛。
第二,主機廠在軟硬體方面的配合、數據和中後台的配合,可能是事半功倍;對非主機廠而言,可能更不容易,數據背後的閉環是更隐形的挑戰。
36 氪汽車:小鵬智駕成為标配,要從哪些角度去評估智駕技術的商業價值?會有指标嗎?
李力耘:現在智駕就像當年的手機行業,我們一定要把智駕價格打下來,未來的車型都會标配高階智駕。其實,智駕是小鵬 P7+ 用戶購車的 top 理由。我們不會用智駕能力再做二次收費。
在小鵬 X9 上,73% 的車主都選擇了 Max 車型。我們也會持續關注用戶對智駕的反饋,比如他們喜歡的一些亮點或者不喜歡的槽點;在标配智駕後,我們會看用戶的滲透率,比如在能開智駕的地方,用戶是不是都開。
36 氪汽車:市場上會有觀點說,小鵬現在車賣得好不是靠智駕,比如 MONA M03。您會反駁這種觀點嗎?
李力耘:在 MONA M03,智駕也起到了很重要的作用。同樣價位上,小鵬 MONA M03 的智駕仍然領先,比如 MONA M03 率先推出斷頭路泊車,體驗上和主銷車型 Max 版泊車能力一樣。春節之後,MONA M03 的 Max 版本也會上 AI 鷹眼視覺方案,實現高階智駕的普惠跟平權。
36 氪汽車:CEO 何小鵬對明年的智駕提出了哪些考核和要求?
李力耘:我們希望 2025 年,在拟人感、安全感、舒适和效率上,做到更不一樣的台階和層次,與行業明顯拉開代際差距。
更重要的是,我們會用一段式端到端放大我們的車型優勢,不僅标配所有車型,更希望覆蓋所有功能,實現點到點,包括賦能海外的智駕。
36 氪汽車:海外市場智駕會是你們明年發力的重點嗎?
李力耘:對,小鵬非常堅定國際化,未來 10 年海外銷量要占全部銷量一半。2024 年小鵬的出海非常不錯,但我覺得智駕還可以更好。明年,小鵬會根據海外當地的駕駛習慣和法規,把智駕體驗按照當地用戶喜歡的方向去做,提供給當地用戶。
36 氪汽車:除小鵬本身之外,智駕團隊還要支持别的項目嗎,比如參與大眾的項目?
李力耘:我們一直跟大眾配合很好,無論是在車型上,還是電子電氣架構上,或者智駕上,雙方都是緊密合作。智駕會有專門的虛拟團隊和項目組去跟進,和大眾合作的車型會很快和大家見面。
36 氪汽車:在大眾項目之後,小鵬的智駕還會有單獨商業化的可能嗎?
李力耘:小鵬是非常笃定地把輔助駕駛推向極致,走向無人駕駛的。在 AI 輔助駕駛的理念下,我們會更看重像 AI 鷹眼視覺帶來的智能駕駛體驗平權。至于真正的商業化,可以關注小鵬在 2026 年無人駕駛的進展。
36 氪汽車:你們會對 L3 有更多探索嗎?還是會直接進入到 L4? 哪個更快?
李力耘:我們一定會推進 L3 和 L4。哪個更快,這個取決于法規進展,我們一定緊跟着法規進展。在明年的 Q1、Q2 某個時候,随着我們體驗和能力更進一步的提升,大家會看到更多可能。