今天小编分享的科技经验:车企上马端到端智驾,自研还是「华元魔」?,欢迎阅读。
文 | HiEV 大蒜粒车研所,作者 | Will,编辑 | 德新
在过去的两个月内,地平线、文远知行、小马智行等智驾科技公司先后上市,目前市值分别达到 559.69 亿港币、47.68 亿美元和 50.58 亿美元(截止 12 月 2 日)。
这一批智驾公司多数创办于 2016 年前后的智驾创业潮。
如果从 2009 年 Google 无人车项目启动开始算,智能驾驶已经风云跌宕了十几年。2016 年这一年,Google 无人车项目 Waymo 拆抽成为一家独立公司,并完成了巨额融资,是全行业发展的一个重大节点。
在那之后,在技术爆发、人才涌动、资本助推的浪潮下,各路智驾公司群雄并起、逐鹿九州,创造了智能驾驶快速发展和商业化的一个「小时代」。从 2016 年到 2020 年,智驶从一系列的原型技术的组合迅速地走向了大规模量产。
太阳东升西落,资本也如潮水。这个极度消耗资源、资金和人才的行业,在经历了一系列融资、扩张、量产、裁员以及 IPO 之后,到 2024 年已经进入了更加理性的阶段。
曾经活跃在各个不同板块、不同场景的数十上百家智驾公司,绝大多数被出清。今天仍活跃在市场上的智驾方案公司数量已寥寥无几,如果按照「仍具有可持续发展能力,能在新一轮的智驾竞争中持续投入」这个标准,这样的公司已经不足 10 家。
一部分曾在学术前沿和资本市场长袖善舞的弄潮儿们,经历了量产的捶打,撸起袖子走完量产流程,在他们完全不熟悉的领網域实现了前装上车。
在当下,AI 与大模型驱动智驾飞速迭代的今天,我们没有比任何一个时刻更加接近于有机会实现「自动驾驶」的远大目标。不过新一代智驾技术所需要的资金、工程能力和数据规模,也决定了这是一场高段位玩家的游戏。
一、真假降维:从 L4 到 L2+
2012 年,深度学习爆火引发了 AI 革命,自动驾驶发展也从中受益。
在短短几年内无数学界、产业界大佬纷纷下场,涌现出一批至今耳熟能详的名字,如小马智行、元戎启行、文远知行、Momenta 等等,绝大多数公司在 最初选择了 L4 级自动驾驶作为业务目标。
Robotaxi 固定运营的策略,在初期很容易跑出不错的效果,但时间一长,它没有办法获得大规模泛化所需要的优质数据。由此,到了 2020 年,叠加资本市场的低潮,多数企业不得不主动做出选择,转向做他们最初并不感冒的高阶辅助驾驶量产。
「L4 都做了,高阶辅助驾驶有啥不能做的?」在这群钻研 AI 算法的人眼里,从 L4 到高阶辅助驾驶属于技术下放,也称「降维」。
事实证明,并非如此。「做 L4 不计成本,堆料可以有效解决许多技术难点,但硬體成本极高,Waymo 是最典型的代表。」一位智驾算法工程师表示。
由于 L4 多数是限定场景,量产业务面对的是开放场景有更多未知的 corner case,对鲁棒性要求极高。元戎启行 CEO 周光在最近的一次采访中说,「原来做 L4,一万次有一次失误已经很牛了。量产里面有一个标准,每百万次出现一次失误。以前觉得一千次、一百次都很厉害,一万次对于 demo(样车)来说是不敢想象的,这对我们价值观冲击蛮大的。」
那些曾经以为从 L4 到高阶辅助驾驶是「降维」的想法,被现实「痛打」。
工程化,虽然是许多 L4 智驾公司降维的短板,它可以通过招聘和时间补齐。真正难以调和的是团队的战略意志和组织架构——「整个团队,从研发体系、商务团队、交付团队乃至考核体系 ... 都是一次颠覆性的改革,势必会发生旧团队体系与新技术路线不兼容的问题,可能会导致人才流失、内斗等各种风险。」
并且,量产项目周期极长,内卷的车市又倒逼供应商,许多项目都是补贴成本报价,短时间很难看到盈利的希望,这显然与投资人最初造富的梦想相去甚远。
目前市面上从 L4 成功转型高阶辅助驾驶的方案商并不多,元戎启行算是其中的代表。
接近元戎启行的人透露,元戎启行突然急转做高阶辅助驾驶并不意外,「周光一直在尝试无人驾驶商业化,只做 L4 相当于闭门造车,永远也到达不了自动驾驶的终局。因此不论是商业上,还是从技术终局来看,先做高阶辅助驾驶都是当下最优选择。
还有就是周光本人非常大胆,笃定一件事就开干。」
另一家头部智驾方案商 Momenta 如今也拿到了众多主机厂的项目,一位接近 Momenta 的投资人表示,虽然现在看起来很是风光,但在第一个量产项目时,Momenta 花了两年多时间才磨出来。
然而,即便像 Momenta 和元戎启行这类已经获得不少主机厂青睐的方案商,也并不能说其商业化落地画上了圆满句号。
毕竟主机厂们到底是自研还是合作,还未完全尘埃落定,自研方案是否成功,将直接决定供应商们长期的命运。
二、两年三代技术,高阶三强杀出血路
进入 2024 年,智驾已经成为车企传播的重中之重。
比如这届广州车展上,长城汽车偌大的展台甚至只摆了一款车,20 多台全新魏牌蓝山智驾版展示出这家自主品牌智能化的决心。
一些新车的发布会上如果没有智驾的更新,不仅少一个卖点,而且相当于间接承认自家技术没有进展——因为技术迭代周期已经很短。
如果从 2022 年下半年,城市 NOA 试水向用户开放到现在,在短短两年之内,智驾的主要技术栈已经更迭了 3 代:从有高精地图,到无高精地图,现在已经是端到端大模型智驾。
无论对主机厂和智驾方案商来说,这都是从技术决策、技术能力、组织架构、战略资源以及量产能力的全方位挑战。今天对于腰部及以下的智驾团队面临的巨大压力是,上一代的技术还没有搞定,头部公司已经在下一代技术上达成了相当不错的进展。
正如眼下一部分国际 Tier 1 正在跟进有图城市 NOA 的量产,自主品牌的自研团队大部分刚刚实现了自研高速 NOA 的量产,而智驾头部公司华为、元戎、Momenta 已经全面切换到了端到端大模型的架构。
「主机厂可以自研低阶方案,比如 ACC、LCC 甚至高速 NOA,因为方案成熟、路径清晰;高阶方案却很难做,因为没有太多积累,短期难补课;而且新技术迭代非常快,团队内耗或者走错路线,很容易拉大技术差距,得不偿失。」一位供应链人士认为。
周光认为,做智驾「要点 Tech Vision (技术预判)」。前融合、车端推理引擎以及时下最新的「视觉 - 语言 - 动作 VLA 模型」,这些都是元戎最早一批在行业内提出的。
周光记得大概在 2020 年左右,有行业大佬来访询问周光对于智驾下一步趋势的看法,周光当时认为是「去高精地图」,对方不以为意,而后这些预判被一一验证。
这样的预判能力,周光认为,核心是源于元戎是一波原生做 AI 的团队,「一个 AI 问题,应该用 AI 的方式去解决。」
据悉, 元戎的智驾方案已经随魏牌蓝山改款上车。
接近元戎启行的行业人士表示,「元戎是行业内少数能够拿出成熟无图方案的公司,项目刚开始接洽的时候,给车企试了效果很好,但认为元戎不是真无图。为了自证无图能力,元戎用板车拖着试验车,让客户指定地点直接过去,卸车就开始了随机路测,效果也挺好,元戎这才拿下了第一个项目。」
到 2024 年下半年,除了蔚小理代表的新势力车企之外,在高阶智驾方案上,绝大多数主机厂都选择了与华为、元戎、Momenta 中的至少一家展开合作。
这也说明智驾格局正趋于收敛,主机厂与方案商的共创成为大部分车企建立智驾能力的必经之路。随着方案的大规模量产,新的盟友关系、数据闭环和商业闭环也在形成。
三、大模型之战:AI 是智驾的底色
在智驾技术正快速迭代的 2024 年,有两个趋势正在成为汽车行业的共识:大模型成为智能车越来越重要的开发方式;端到端智驾提升速度飞快,并且远远还没有到 Scaling Law 的上限。
理想、小鹏都公布了下半年,在几个月的时间内,其智驾基于端到端的版本接管指标和体验上,有 3 - 4 倍以上的提升。
周光认为,「自动驾驶刚刚进入端到端,车端的 Scaling Law 至少还有 5 年。我认为接下来几年端到端的进展是极其大的。落后一年的东西,基本上就不太可用。」
端到端使智驾被赋予了更加浓重的 AI 的底色,从第一性原理出发,「算力、数据、算法」的重要性前所未有。
根据华为、理想、小鹏的规划,到明年基本上智驾第一梯队的云端训练算力规模都将达到 10 EFlops 级别。由于车端算力、供电的局限,车端的模型规模不会像云端一样迅速暴力增长,Scaling Law 会拉得更长。
但相比起大模型,端到端模型的训练算力需求并没那么大。因为它不需要基于互联网上海量的文字、图片信息去训练,只需要驾驶行为中可能涉及的路标、路况等相关信息。
开车过程遇到的大多数的场景和路况都是重复的,这代表大多数的数据都是已有数据,这并不是训练模型所需的数据,端到端需要的是高质量的边缘场景数据。
同样算力的情况之下,模型能力和数据挖掘能力更加需要被发挥到极致,并不是一味堆数据、堆算力的暴力解法。
充裕的云端算力基础上,如何挖掘高价值的数据,来训练一个「全知全能」的智驾世界模型;以及在有限车端算力基础上,如何保障有限参数规模下单一端到端模型的下限,并极致压榨其上限,是目前全行业都在共同求解的两大议题。
在元戎这次 C1 轮融资披露的同时,周光对外强调下一代方案,将量产「视觉 - 语言 - 动作模型,VLA 模型」。
一部分行业人士将 VLA 视为「端到端」方案的下一代版本。
四、端到端,大玩家决赛
如果说智驾的上半场是资本撒下种子,而今一部分创业公司已经成长为茁壮的树苗。当市场格局、商业模式逐渐清晰,下半场是这些树苗,如何长成参天大树的争夺战。
数据是决定智驾模型上限的核心资源。
目前大部分智驾数据都掌握在主机厂手里,但绝大多数数据难以充分发挥效用。面对日益陡增的数据量,匹配少数合适的方案商,挖掘车主数据的价值,形成有主机厂特色的智驾体验,属于水到渠成、两厢奔赴。
大语言模型、多模态大模型的浪潮,使得算力资源成为稀缺的供给。
除了互联网行业之外,汽车行业对算力有最强烈的渴求。而背靠 BAT 这些互联网大厂的公司,则更容易「近水楼台先得月」,分别背靠华为云、阿里云、腾讯云的华为 ADS、元戎启行以及 Momenta,天然更有优势。
「模型架构决定方案上限」,端到端的战役,也是最顶尖的 AI 人才的争夺战。
从某种程度上讲,下半场的竞争实质已经不是单一智驾公司的竞争,而是「车企 + 互联网巨头 + 智驾头部公司」这种超级产业联盟的竞争。
华为车 BU 副总裁江利旗在十月份的一场演讲上表示,华为认为未来的智驾市场份额会高度集中。
无独有偶,Momenta CEO 曹旭东也在接受媒体采访时也认为:「智驾最后在全球可能就三、四家公司,中国可能就两、三家公司。格局可能是 7-2-1,第一名占 70% 的市场。」
正如《三国》一样,智驾的群雄争霸,十八路诸侯最终只剩下少数力量。如果按照已量产了端到端高阶智驾方案这个标准:
华为可以说是赛道里面的绝对核心玩家,拥有完全自主可控的芯片、算力、作業系統等底层资源,有自身深度参与操盘的汽车品牌矩阵,在供应链上有强势的话语权,并且已经实现了正向盈利。 Momenta 的优势在于,入局很早,有丰富的量产经验、高度标准化平台化的产品能力,是目前业内与主机厂供应合作最多的方案商,尤其在海外市场的长周期定点上。Momenta 也在深度布局芯片、網域控,旨在拿下最大的市场份额,但这也站在了核心芯片供应商的对立面。 元戎启行属于入局量产业务相对较晚的选手。行业混战时期,元戎启行凭借无图方案突围并一举拿下长城魏牌定点,在短短 8 个月内在无数次捶打下,完成高阶智驾量产,成为了今年行业最突出的黑马。元戎的 AI 长板够长,有利于合作主机厂占据技术高地。智驾供应格局逐步收敛,但主机厂不想被垄断「灵魂」,扶持一匹有 AI 基因的黑马既是大势所趋,也是市场格局需要的。
头部智驾公司,明年的量产车数将迎来 10 倍级别的提升。
能够留在牌桌上的方案商们站位已经越发明确,而通往自动驾驶的方向,也在随着技术和商业的更迭,更加清晰。