今天小编分享的互联网经验:大模型「上车」,车企打响「开城战」,欢迎阅读。
图片来源 @视觉中国
文 | 硅基研究室,作者|白嘉嘉
「鲶鱼」特斯拉游向了自动驾驶领網域。
8 月 14 日,特斯拉中国在一项声明中表示,特斯拉已经在中国建立了数据中心,所有在中国大陆市场销售车辆所产生的数据,都会存储在中国境内。
据 36 氪报道,特斯拉已经从总部派了工程师来华,计划组建一个 20 人左右的本地运营团队,以推动自动驾驶解决方案 FSD(Full Self-Drive)在中国市场落地。
此外,特斯拉还尝试在中国成立一个数据标注团队,规模约上百人,意图同样指向自动驾驶。
其实,早在特斯拉摆尾前,自动驾驶,尤其是 NOA(导航辅助驾驶技术,Navigate On Autopilo)领網域,资本市场早就从大模型的浪潮中觉察到了风向。
二级市场上,具备类似 NOA 等高速领航功能軟體开发能力的阿尔特(300825.SZ)自 4 月 25 日迄今股价累计最大涨幅达 80.45%。
拉长时间看,在城市 NOA 方面搭建面向自动驾驶全球数据的光庭信息(301221.SZ)年内股价累计最大涨幅达 114.29%。
《2022 年汽车行业报告:城市 NOA 重新定义智能汽车》指出,2023 年搭载 NOA 的汽车总量或将为 70 万辆,2025 年可能将达到 348 万辆。其中,支持城市 NOA 功能的车型占比将从 2023 年的 17%迅速上升到 70%。
那么在大模型的热度下,2023 年会是「城市 NOA 元年」吗?
从重地图到重感知,车企打响「开城战」
严格来说,从始至终,NOA 不是一项全新的、颠覆性的技术,它只是集成了 ACC 自适应巡航、LKA 车道保持辅助、ALC 自动变道辅助和高精地图定位四项功能。
过去,在 NOA 的前面往往还有个定语——「高速」,因为无论在里程数,还是路况复杂程度,「高速」扮演的显然是那个供新手练级的小 Boss 角色。
但城市,完全是另一个级别的对手。
小巷子里突然窜出的电瓶车、模糊的车道线、翻修道路导致的路线变更、更狭窄的视野……以高精度地图为基础的 NOA 技术在城市里处处碰壁。
城市的复杂直接反映在了车企的数据库里。
根据小鹏汽车的数据,其城市 NOA 的代码量是高速的 6 倍,感知模型数量是高速的 4 倍,预测 / 规划 / 控制相关代码量是高速的 88 倍。
但今年,车企和大模型玩家仿佛一起喝了「壮胆酒」,齐刷刷地将挺进这片 NOA 的深水区。
公开信息显示,小鹏汽车预计下半年将在数十个无图城市释放 XNGP;华为 ADS2.0 三季度将在 15 座城市实现无图商用辅助驾驶,四季度将扩大至 45 座城市;理想汽车将于年底前完成 100 个城市的 NOA 推送;毫末智行计划到 2024 年在 100 座城市落地无图城市 NOH。
是谁给了它们勇气?答案或许离不开算法与大模型。
首先,算法上的突破让汽车对现实的感知更加立体,车企在「重地图」之外有了「重感知」的新选择。
由于城市路况的复杂多变,「不依赖高精度地图」成为了车企将智能驾驶落地城市的方案。探索过程中,特斯拉的 BEV+Transformer 方案为行业「脱图」提供了技术上的可行性。
简单来说,这套方案是将传统自动驾驶的 2D 影像视角(Image View)加测距的感知方式,转换为了鸟瞰视角下的 3D 感知,优势在于保证了信息的完整性,有效解决物体遮挡问题,并极大方便后续规划和控制任务。
放在大模型的语境下,这意味着在 BEV 空间内,感知和预测都在同一个空间进行,可以通过神经网络实现端到端优化,输出并行结果,避免上下游误差的传递与放大,从而开启了借由数据驱动实现快速迭代的可能。
2021 年特斯拉推出「BEV+Transformer」方案后,逐渐成为了行业的主流,蔚小理均跟进,其中,华为的 ADS2.0 采用 GOD(融合激光雷达的 Occupancy+Transformer)被光大证券认为,有可能已经领先特斯拉。
算法搭建起了闭环框架,剩下的工作就是往框架中填充数据,并让飞轮转动起来。狂飙的大模型,无疑是这套方案最强劲的引擎。
在云端,大模型的大容量优势,可以帮助车企完成绝大多数的数据标注和挖掘工作,降低数据标注成本。同时,生成式模型的「涌现能力」,构建出了更多的仿真场景。
在车端,经由将多个分管不同子任务的小模型合并为一个大模型后,可以大幅减少车端推理计算时间,为消费者关心的安全性问题上了一重保险。
更重要的是,从传统的分模块处理到端到端感知决策一体化,大模型的泛化能力被认为有希望突破自动驾驶系统必须事先学习相应的情况才能做出反应的限制,克服困扰行业的长尾难题。
算法和大模型两团火照亮了自动驾驶的前路,也为车企勾画出了一条可以落地的产品路径。
跑道清晰后,关键性节点随之浮现。
如火如荼的城市 NOA「开城战」,本质上是车企间的数据收集战,谁能率先用数据投喂出具备落地能力的「车载大腦」,谁就有希望领先行业站上新的维度,在这个汽车几乎要卷成家电城的年份打出最有竞争力的王牌。
绕不过的 L3,责权归属成终极难题
今天车企们涌向城市 NOA 的景象,很容易让人联想到 2017 年的自动驾驶热潮。
当年,奥迪发布了全球首款可以实现 L3 级别自动驾驶的新型轿车奥迪 A8,这款车型也被定义为首款专用 L3 级别自动驾驶而开发的量产车型。
随后,包括吉利、广汽、长安在内的大量车企跟进,纷纷向外透露了 L3 自动驾驶量产车型的计划。
直到特斯拉的一起事故将自动驾驶从技术层面拉到了伦理和法律层面。
2019 年 3 月,美国佛罗里达州的一辆特斯拉 Model 3 由于没能识别出前方的大货车,没有自动变道也没有提示驾驶员,以每小时 110 公里的速度从货车底下钻过,致驾驶员死亡。
虽然这起事故被美国国家运输安全委员会(NTSB)认定为驾驶员过度依赖 L2 级自动驾驶系统,但事故背后的所折射出的法律真空和 L3、L2 之间的微妙差别,给所有的车企泼了一盆冷水。
L3 是自动驾驶中最难过的一道坎,被业内人士称为「恐怖谷」。
国际标准中,自动驾驶被分为 L0 到 L5 六个级别。L0 到 L2 阶段被称为辅助驾驶,驾驶员把控方向盘,系统提供类似加减速、变换道的辅助。L3 到 L5 被称为自动驾驶阶段,由系统逐渐接管车辆控制,适用范围不断扩大,驾驶员参与程度依次降低。
其中,L3 级自动驾驶由系统和驾驶员「共享」方向盘,常规情况下由系统把控,特殊情况下需要司机接管。
据当时特斯拉所搭载 Eye Q3 芯片的制造商 Mobileye 所说,马斯克曾当面向他保证,Autopilot 会引入某种机制,保证司机必须手扶方向盘。而特斯拉所打出的「自动驾驶」的噱头,却让消费者产生了可以松开方向盘的印象。
责权归属的模糊使 L3 成为了一块车企不敢轻易踏入的禁地,行业也因此产生了分歧,一部分玩家选择跳过 L3,直接开发 L4 无人驾驶系统,而另一部分玩家则选择停留在 L2 或 L2+,甚至是 L2++。
玩家的分歧造就了今天自动驾驶市场的多面向。
第一个面向是「无人车跑在伊甸园」。
以北京亦庄自动驾驶示范区为例。在建设早期,亦庄就把高精度的数据地图列为了重点建设项目之一,而这也是后来无人驾驶研发商能够上路的基础。全国有类似基础的地区甚至都找不出第二个。
而且,即便实现了车内无人,运营中心仍需配备后台工程师随时监控。来去之间成本并没有降低多少。
类似的困境包围着所有致力于 L4 级研发的车企,资本眼看落地无望,纷纷抽身离场。Waymo 估值从 1750 亿美元下跌至 300 亿美元,亚马逊无人配送车 Scout 项目于 2022 年十月被关停,数据显示,和巅峰期相比,自动驾驶相关企业市值整体缩水 80%。
第二个面向是「沿途下蛋」。
既然 L4 难落地,许多人萌生了技术赋能车企做辅助驾驶的想法,一能回笼资金,二能扩充数据量。
但这条路也没那么好走,与期待质变的 L4 领網域不同,身处 L2 的车企还需要考量成本、续航、设计等内容,辅助驾驶往往只是锦上添花,加上责权不清晰等因素的干扰,无论是车企还是消费者,都不敢轻易地迈出那一步。
第三个面向则是「人员流动频繁」。
据「硅基研究室」统计,2023 年至今,自动驾驶相关的高层人员离职事件就高达 22 起,其中不乏曾被资本捧在手心里的企业。
有观点认为,人员流动频繁可以促进企业间的技术交流,但观察这些人员的流向,整体呈现出向产业链上游汇集的趋势,也就是从车厂走向了大模型。
这条趋势固然和眼下的大模型热有关,究其根本,行业破局的关键仍要从大模型下手。
与车企纷纷下场开城结合,上述三个趋势隐隐透露出一股决心,将事故率从 1% 降低到 0.001% 甚至更低并非毫无意义,过去被刻意回避的 L3 也已避无可避,剩下唯一需要考虑的问题是,如何用大模型撬开它。
同时,困扰行业已久的责权模糊问题,正在被提上日程。
在 6 月下旬,工信部副部长辛国斌表示:" 将支持有条件的自动驾驶(L3 级自动驾驶),及更高级别自动驾驶功能的商业化应用,并将发布新版智能网联汽车标准体系指南。我们已经启动了这项工作,地方也在积极响应 "。
大模型「上车」,战场在云端
今年 8 月 2 日,马斯克在「X」平台上发布帖文,其中提到了特斯拉正在开发 " 车辆控制是特斯拉 FSD 人工智能的最后一块拼图,目前正在接受训练 ",并透露 AI 将使原始 FSD 中的三十万行 C++ 控制代码减少约两个数量级。
与 7 月 20 日他在第二季度财报电话会议上透露出的," 明年底之前,我们将花费远远超过 10 亿美元在 Dojo 智算中心项目上,我们有数量惊人的视频数据要进行训练 " 相结合,不难看出 FSD 快速成长的背后,智算中心所起到的关键作用。
而这也透露出,未来车企间的战场,其实在云端。
之所以特斯拉选择投入大量资金自建智算中心,效率和成本是两个关键词。
自动驾驶任务训练的特点是檔案多而杂,且多为视频、影像数据,因此这类模型的训练和测试,靠的并不是 CPU,而是以 AI 加速器为主的浮点计算能力,智算中心的特征就是以大规模 GPU 算力作为 AI 模型迭代的基础。
云计算的本质是租赁计算设备,云服务商的设备都是统一采购,为了获得更多客户,这些设备都具备很大的通用性,设备内部使用的 CPU、GPU/AI 加速器、内存的型号与规格都相对固定,很难与车企和自动驾驶公司的算法形成最佳匹配。
并且,云服务厂商对自动驾驶算法的了解程度不高,不可避免的会在调度算力时出现损耗和效率不高的问题。
而自建算力中心可针对自动驾驶应用特征布置更专业的算力集群、性能加速工具和 AI 大数据平台,使得模型训练性能、GPU 资源利用率和算法研发效能都大大提升。
小鹏汽车董事长何小鹏曾表态:" 如果现在不以这样的方式(智算中心)提前储备算力,那么今后 5 年内,企业算力成本会从亿级,加到数十亿级。"
目前,国内已经有多家车企与云厂商合作建立专用的智算中心。
比如,小鹏汽车与阿里云合建了智算中心「扶摇」,专门用于自动驾驶模型训练,算力可达到 600PFLOPS;毫末智行与火山引擎联合打造了国内自动驾驶行业最大的智算中心「雪湖 . 绿洲」,每秒浮点运算可达到 67 亿亿次;吉利也与阿里云合建了星睿智算中心,计算能力达到了 81 亿亿次 / 秒,结合领先的算力调度管理算法和研发体系,吉利的整体研发效能取得 20% 的提升。
从这个角度来看,强调「不造车」的华为,将成为特斯拉最有力的竞争对手。
近日,华为智能汽车解决方案 BU CEO 余承东在微博上曝光首款搭载鸿蒙 4 的车型——华为和奇瑞合作的首款纯电轿跑车「Luxeed」。
这意味着,奇瑞将极有可能成为继赛力斯后,第二家与华为合作发布华为智选车产品的合作车企,而华为一直期望打造的智选车生态品牌联盟,也有望加速取得实质性进展。
关于智选车业务,市场「忧喜」参半。
「忧」在于,智选车的潜力肉眼可见的狭窄。欧美日企业无法选择它,国内新势力有自己的追求;传统的车企,如果怕失去「灵魂」也不会选它。
而华为在智选车业务上投入巨大,若没有大量使用、大量销售,就不能实现商业闭环。
「喜」则是因为,在华为智选车模式推出之前,业内并没有一个既有智能化核心技术与解决方案,又有强大 to C 能力与营销零售渠道的角色。
通过智选模式,华为将深度参与品牌打造、产品设计和定义、营销服务,赋能中小车企。
同时,华为汽车云所提供的数据生成、自动标注、模型训练、云端仿真、虚实结合仿真、数据闭环等一系列能力,也能帮助车企和商用车企业加速自动驾驶算法的开发验证和优化迭代,降低成本和风险,提升效率和安全性。
大洋的彼岸,特斯拉也透露出公司正在讨论将其全自动驾驶(FSD)驾驶辅助技术授权给另一家主要汽车制造商,并表示,授权 FSD 技术一直是计划的一部分。
值得一提的是,特斯拉在中国建立数据标注团队和数据存储中心,除了顺应国家在信息安全方面的硬性要求外,也收获了更丰富的工具包。
对转型不畅或技术落后的部分造车新势力来说,特斯拉 " 数据 + 算法 + 存储 " 的一条龙服务,显然吸引力不小。
从最初的分布式计算、单个子系统拥有自己的 ECU,到網域控制器逻辑、以功能划分集成化控制运算,再到最终实现整车运算能力的高速集中、智能化分配算力,汽车从工业品向电子消费品、智能终端逐步演化。
高通公司首席商务官吉姆 · 凯西的比喻或许最为贴切:" 汽车正在成为‘车轮上的联网计算机’ "。
在这一过程中,固然还有软硬體成本过高、法律法规不完善、消费者认同度较低等问题,但好在新的赛段已经到来,也终归是「车到山前必有路」。