今天小編分享的汽車經驗:智己:智駕技術第一梯隊,國家隊也有責任,歡迎閲讀。
文|Karakush
如果你對智駕保持敏鋭跟蹤,會發現今年在華小理等 " 老頭部人 " 之外,智己也高頻出現在橫評第一梯隊之列。
智己智駕的含金量在飙升。
10 月 28 日,智己在 " 智駕技術日 " 正式推出基于 " 一段式端到端大模型 " 的 IM AD 3.0,這個最新版本具備生成 " 本能反應主導的直覺決策能力 "。
端到端大模型被認為是智駕賽道的新機會。尤其是在特斯拉推送 FSD V12 版本之後,國内很多車企都更加确信這條路線,組建相關團隊攻堅,各家都有趨同的大方向,也有各自不同的解釋方法和工程方法。
" 直覺 " 是智己定義的目标,第一次被引入智駕語言體系,區别之前 " 最像人 " 的理想狀态,智己把智駕天花板帶到 " 有直覺 " 的一代。從其中的技術底座,到規模量產進度,再到其中體現的系統性優勢來看,智己都已經來到技術爆發點。
區别其他頭部企業,智己有一些特殊性。作為上汽的高端品牌,他們是高階智駕技術隊伍中極其少見的國家隊,大部分玩家是新勢力,或者華為這樣的跨界巨頭,這些企業更能容忍和承受技術前沿摸索中注定伴随的創新風險,而相對風險厭惡的國家隊通常是在技術成熟之後下場。
同時,智己也不像其他公司那樣建立完全 in-house 的自研團隊,而是選擇與 Momenta 合作。供應商模式經常被吐槽協同和迭代效率問題,但是智己卻拿出驚人的速度,從 2021 年正式達成戰略合作,到 2023 年完成 " 兩段式端到端 " 的量產,只用兩年;到今年則是實現難度更大的一段式端到端。
我覺得智己非常精準地反映了近幾年智駕領網域的一個規律:在新的技術周期,我們不能以傳統的投入和地位看待優劣,誰都有颠覆與被颠覆的可能;當然,也不存在毫無來由的狂飙突進,一切爆發都是有備而發。
IM AD 的含金量:智駕進入直覺時代
目前業内第一梯隊都在緊跟 " 一段式端到端大模型 ",但是設計架構和體系能力各有不同,最終決定各家 " 端味 " 的差異。拿智己 IM AD 來講,技術很強,同時特别強調直覺的體驗和規模化的可行性。
首先,IM AD 是比較完整體的一段式,取消了分模塊的結構,用一個神經網絡處理來自各類傳感器的原始數據,直接生成路徑規劃。強調 " 一段式 ",是因為業界有些端到端是通過分段式,由幾個小模型通過一些規則耦合實現,其實差距很大。
端到端的最大優勢,是能解決長尾問題。我們拿水坑舉例,傳統規則方法需要人為定義 " 水坑 ",用大量數據訓練感知模型識别水坑,再訓練規劃模型繞開水坑;而端到端無需定義,直接學習規避水坑。所以面對未定義障礙物、隐藏的極端場景,端到端的适應能力和泛化能力更強,可以完成從不能開到能開的飛躍。
至于分段式,實際上沒有擺脱小模型之間人為定義算法規則,對于超綱場景還是不行或者需要堆人力寫補丁去解決問題。
IM AD 的一段式,完全打通感知和規控,可以做到無損傳遞,并且能從輸出的規劃端反向傳遞給神經網絡更新參數,獲得全局優化,在智能性、舒适性、安全性上都能達到了更高的天花板水平。
缺點就是研發難度大,包括怎麼 Debug、怎麼提升黑盒過程的可解釋性、怎麼高效迭代解決方法,需要很強的系統研發力量支撐。同行的進度就是最好的襯托,足以看出智己和 Momenta 的實力。
第二,IM AD 追求的 " 直覺 ",高度拟人。他們把直覺定義為 " 車随心動 ",人直覺怎麼開,車就是這麼開的——并且是好司機的直覺,IM AD 會從數據中篩選好的駕駛行為指标,比如橫向避讓多少、加速多少等參數,用好的行為數據指導智駕學習。
智己相信,智駕的終局一定是像人一樣開車。這也是他們堅定一段式端到端的原因,人開車的時候不會先認識這是什麼、再做規劃,而是基于經驗和習慣形成直覺式的反饋;在這個理念下,IM AD 把仿真人腦更進一步,做出 " 快系統 " 和 " 慢系統 " 的設計。
快系統負責直覺推理,處理簡單任務,應對 90% 的場景,類似人類基于經驗和習慣形成直覺行事;慢系統負責邏輯分析,是一個安全駕駛模型,應對剩下 10% 的場景,提供安全性更高的保護與應急策略。
快慢系統配合,可以确保大部分場景下的高效率和少數場景下的高上限,這是 IM AD 在端到端大趨勢之外的差異化設計,是智己對于智駕的理解。
第三,IM AD 不是炫技術的 trophy tech,而是十分講求可規模化的,其中的一項重要指标就是訓練成本。
如果細看結構,IM AD 的端到端存在兩個支線,也是模仿人腦設計的長期記憶和短期記憶機制,長期記憶就是端到端大模型,短期記憶則是由 DDOD+DDLD(基于數據驅動的感知模型)加上 DLP(基于深度學習的規劃模型)組成,主要用來驗證解決方法和訓練數據是不是好方法、好數據,快速高效試錯。被短期記憶驗證的方法和數據,經過積累再應用到端到端大模型上,保證長期記憶的訓練高效。
增加短期記憶設計,是為了降低試錯成本,短期記憶的訓練成本較低,訓練周期較短。相比之下,大模型訓練的試錯成本非常高,如果方法或者數據錯誤,損失慘重。對比直接采用端到端大模型訓練,IM AD 長短期記憶架構的訓練成本應該能低 10 到 100 倍。
從技術、到理念、到可行性,IM AD 3.0 都做出了結構性和系統性優勢,落到實際體驗,就會發現這個版本也可以做到全國都能開、全國都好開的水平,智己在本月已經在全國範圍内開通全系車型 " 無圖城市 NOA",在典型復雜場景比如慢車 / 占道車繞行、橫穿預判、路口多人博弈等都能做到很好的通行效率,同時兼顧安全冗餘。
長期主義兑現:同時具備
L2、L3、L4 量產能力的第一品牌
今天來看,IM AD 得以在一兩年内從默默無籍到飛速成長,一個重要原因是早期蓄勢過程中少走很多彎路,他們很早就确定數據驅動路線。
智己選擇和 Momenta 合作是在 2021 年。當時業内就曾有過流派之争,一種是規則算法(Rule-Based),另一種是智己選擇 Momenta 選擇的數據驅動(Data-Driven)。
放在早期行業聚焦高速 NOA 的背景裏,規則算法有其優勢,它可以更快針對場景做出賣點給到用户;而數據驅動相對訓練量更大,起步更難,盡管有些場景會有驚豔表現,但是很多場景會有很多匪夷所思的問題,需要不停學習優化。所以前幾年很多智駕產品都選擇規則算法。
但是智己和 Momenta 一直相信智駕很快會實現城區 NOA,會從 L2++ 實現到 L3、L4。一旦場景從規則化道路切到城區,復雜程度指數級增加,數據驅動就會是更優解。這和他們到今年堅定一段式端到端,是一樣的終局思維,以終為始去做難而正确的事。
在把握大趨勢之後,真正決定智駕產品水平的指标,一是數據飛輪體系能力,二是系統迭代效率。
為此,智己搭建了全級别的智駕平台,共平台開發 L2、L3、L4,共享數據池和一段式端到端大模型。比如 L2++ 采用 12 個攝像頭,加上三個毫米波雷達、一個激光雷達和冗餘攝像頭,就能做 L3;增加三個激光雷達、執行器和控制器等冗餘增量,就能做 L4,當然算法和安全要求會有不同。
這樣做的好處,不僅是可以提供不同維度層級的服務,也能以更好的成本、更好的效率提升 IM AD 的系統迭代。比方説,通過大量 L2 工程實踐、數據獲取和訓練,支撐 L3、L4 研發;L3、L4 的核心是去提升智駕系統的可用性、和對復雜場景的應對,這些高級别成果能賦能到 L2 場景,提升 L2 的性能。通過這種方式,智己成為全國唯一同時具備 L2、L3 和 L4 研發和量產能力的品牌,IM AD 也得以瘋狂成長。
去年 IM AD 僅用 8 個月開通全國高速高架 NOA,到 2024 年初在上海首發城市 NOA,到 9 月底全新 LS6 上市開通全國無圖城市 NOA,過程中還經歷從原來的高精地圖方案切換成輕地圖方案的技術變更,挑戰很大。
這樣的進步,一方面是源自開發邏輯和架構設計,另一方面也是源自團隊戰鬥性。智己和 Momenta 雖然是兩個公司,但是合作效率驚人。IM AD 系統内部提出 " 智駕摩爾定律 " 的概念,就是硬體每兩年成本降一半,軟體每兩年水平至少提升 10 倍。這是經驗公式,他們認為能超越定律的公司才能存活。
而作為目标他們追求更高,比如要求數據閉環效率從以月為部門加速到以天為部門。同時在開發過程中,比如 OTA 更新上什麼功能,系統版本涉及到的變更,都由兩個團隊共同讨論評估。放在任何一家公司的内部團隊,都是業内鳳毛麟角。
用技術引領,定義智駕第一梯隊
今天行業裏針對第一梯隊會提出很多技術、場景、人才、資源投入的标準。歸根到底,那些得以進入第一梯隊的公司,區别其他公司的标志,是對于智駕的認知和決心,是不是跟風、是不是投機、是不是炫技,還是真實相信它是下半場的決勝要素,在技術周期尚不明朗的時候勇敢抓住趨勢,快速試錯、快速成長、快速發展優勢。
智己在成立之初就有清晰的思考,把智駕當做核心 DNA。這不是靠説的。你可以在產品上看到這種核心的位置。
比如智己主打靈蜥數字底盤,和智駕互為賦能,它的 " 雲台車身 " 依托智駕系統的精準感知,識别大曲率彎道,對底盤進行智能調整;反過來,城市 NOA 遇到調頭會用到智慧四輪轉向,更小半徑的調頭,不用在雙向兩車道的道路上頻繁打方向,提升智駕體驗降低復雜度。
你也可以在營銷策略上看到智駕的邏輯。比如在最近推出的新車型智己 L6、全新 LS6 上,都是全系标配激光雷達、Orin X 芯片,同時軟體終身免費。智己的想法是,基于數據驅動,就是要讓所有用户都能用到高階智駕,如果采用收費制度,使用高溢價模式,就會提升使用門檻,不利于快速迭代。就像拍照之于智能手機,必須标配。
而這種放眼未來的眼界,正在逐漸等來加速而來的時代,根據智己的數據,上周用户在日常出行當中使用 IM AD 的比例是 81.4%,使用 IM AD 均值 95.65 公裏,NOA 均值 102.5 公裏,ACC 最少 2.5 公裏,Pilot 均值 23.3 公裏,IM AD 使用黏性非常強。
智駕不再是個别企業的自嗨,随着技術和體驗成熟,逐漸滲透購車決策,權重會變得越來越高。智能電動車下半場真正泄洪,那些長期主義的投入,回報不會太長。
>