今天小编分享的互联网经验:小鹏智驾李力耘:我们处于无人化前夜,智驾Scaling Law还有很大红利,欢迎阅读。
文丨李安琪
编辑丨李勤
从美国试驾完特斯拉 FSD 回来,小鹏智能驾驶负责人李力耘有两大感受。其一是,特斯拉 FSD 在北美地区的确是独一档,但他也意识到,需要对特斯拉祛魅。
" 中美路况非常不一样,我们更懂中国路况,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强。" 李力耘说。
角逐和较量在智驾圈里已经不新鲜。过去一年里,小鹏等车企迅速卷入了 " 全国都能开 "" 端到端 " 的智能驾驶竞争。
在今年 12 月末,小鹏还计划交付 " 车位到车位 " 智驾驾驶功能,技术模型也更新为 " 一段式端到端 ",可实现全场景覆盖,包括园区低速行驶,未来会覆盖泊车、高速场景,甚至海外智驾。
" 车位到车位 " 是当下车企智能驾驶竞争的技术高地。如字面含义,车企希望用户在车位就能启动智驾,车辆低速巡航、自主过闸机、上高速,在城市道路通行,最后泊入目的车位。
12 月初,特斯拉向部分测试用户推送的特斯拉 FSD v13.2 更新版本,就包含了从停车状态启动的 FSD,也就是 " 车位到车位 " 功能。前不久理想汽车也宣布突出该功能,华为和小米汽车的类似功能,同样即将推出。
智能驾驶走向自动驾驶的过程不是一蹴而就,而是车企们通过技术攻坚,不断完成高速、城区、泊车、园区等场景拼图。如今,这一步即将完成。
李力耘也表示,现在小鹏处于 " 无人化(驾驶)前夜 ",明年在能力上会有更大突破," 可能先在 Max 车型上,小鹏智驾逐步提供类似无人驾驶的能力。"
这几乎是最早给出无人驾驶节点的国内车企。
小鹏的确是国内最早贴上 " 智驾 " 标签的车企之一。2019 年,小鹏就在轿跑车型 P7 上开发了高速 NGP 功能,对标特斯拉 NOA。
但因为起步早,小鹏几乎走过所有技术路线,从依赖高精地图,转向无图方案,随后进化到端到端。2023 年 8 月,小鹏智驾还经历了灵魂人物吴新宙离职、团队动荡等。小鹏智驾由此进入守城阶段。
同一时期,行业有玩家迅速进入了高阶智驾量产状态。比如压强式投入的华为,率先推出了 " 全国都能开 " 智驾功能;理想汽车则由于轻包袱,果断切入 " 端到端 " 技术,甚至直接更换到激进的 " 一段式端到端 " 方案。
从今年中以来,小鹏智驾试图回归与反击。
近日,小鹏智驾负责人李力耘接受了 36 氪的采访,他分享了小鹏如何将 AI 融入智驾,以及标配纯视觉智驾后,如何实现科技平权与商业闭环。
李力耘告诉 36 氪,小鹏对于端到端的研发始于 2023 年 4 月,当时主要是想用 AI 的认路能力,摆脱对高精地图的依赖。
结果小鹏发现," 一段式端到端 " 大模型上线之后,原来需要花很长时间打磨的场景,如特殊分流、右转或掉头等问题,很快就被解决了。
今年 5 月,小鹏正式推出 " 端到端 " 智驾大模型,包含神经网络 XNet、规控大模型 XPlanner、大语言模型 XBrain 三大部分。
端到端智驾依赖的核心资源之一就是数据,小鹏宣称,其端到端大模型训练数据量已经达到 2000 万 clips。理想汽车也公开过其端到端的训练数据,目前大约在 800 万 clips。
对于 2000 万 clips 的数据起点,李力耘告诉 36 氪,这得益于过去基于规则的智驾经验积累,小鹏当前的数据采集和训练效率很高,例如通过车端规则经验实时标注,精准采集训练所需片段,从而针对目标场景进行精准密集训练。
他同时认为,在海量数据、不断提升的云端和车端算力下,自动驾驶的 Scaling Law 还有很大红利。
Scaling Law 是大模型行业的一个定律,通常表示模型参数越大、数据集越大和计算资源增多,模型性能更好。
小鹏推出 " 端到端 " 大模型智驾方案的标志性成果,就是更果断摆脱对激光雷达的依赖,将纯视觉作为智驾技术路线。例如在新车 P7+ 上,小鹏就标配了纯视觉智驾 AI 鹰眼方案。
但在行业中,未来数年的主流选择还是以视觉 + 激光雷达作为主要传感器。对此,李力耘向 36 氪汽车表示,走纯视觉路线其实是出于第一性原理。
在他看来,人们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人设计的," 人最重要的传感器是眼睛,所以纯视觉一定是最直接、最高效的解决方案。"
小鹏也宣称,其基于 AI 鹰眼的纯视觉方案,能做到比人眼视觉更好的效果,可以很好应对大光差、逆光场景。
在纯视觉智驾之路上,小鹏汽车决定走到底,李力耘告诉 36 氪,从 P7+ 车型开始,不再有 Max 和 Pro 的版本区分,而是 " 全系标配 Max,也就是小鹏 AI 图灵智驾(NGP),都会用纯视觉方案。"
这背后蕴含着一套清晰的智驾商业化策略," 我们会用一段式端到端放大我们的车型优势,不仅标配所有车型,更希望覆盖所有功能,实现点到点,包括赋能海外的智驾。" 纯视觉智驾方案,无疑在成本上拥有先天优势。
实际上,凭借在同级车型中做出 " 智能差异化 " 的赛马策略,小鹏已经在两款新车 MONA M03 和 P7+ 上,尝到了甜头。
M03 自 9 月上市以来连续 3 个月销量破万,P7+ 上市 3 小时也获得了超 3 万大定。这两款车的售价都在 20 万元以下,这个价格带是比亚迪等老牌车企的优势领網域。
" 智驾是小鹏 P7+ 用户购车的 top 理由。" 李力耘说,当下熱賣款 M03 的泊车体验也与 Max 版智驾同级。
智能驾驶技术在车企的商业体系里已经越嵌越深,同时,也在承接整个 AI 技术的发展红利,快速迭代。这是资源和效率交织的产物。
李力耘说,如果把端到端的技术趋势看作智能驾驶驾领網域的一场 " 工业革命 ",能真正实现转型更新的企业其实是少数,大部分人还是会面临更残酷的竞争。
因为,端到端不是让事情变得更简单,而是让整个迭代链条变得更长,更加不可控,某种程度上需要投入更多的资源,包括更大算力,更加精英的 AI 研究人员。
" 我更愿意相信是车企,而不是供应商,能够率先从辅助驾驶突破到无人驾驶。"
以下是 36 氪汽车与小鹏智驾负责人李力耘的对话,内容略经编辑:
「谈体验:" 车位到车位 " 之争,用户会为更好的体验买单」
36 氪汽车:听说你刚从美国回来,有体验特斯拉的 FSD v13 吗?
李力耘:但很遗憾,因为 v13 还没有量产推给用户,我没机会试 FSD v13,但开了一个星期 v12.5。有两点可以总结,第一是祛魅,第二特斯拉在北美是独一档的存在,很多值得学习的地方,包括停车场激活、开进停车场,这些是用户非常喜欢的功能。
去魅的话,我觉得中美路况非常不一样,无论是我们 XNGP 5.4.0 还是即将发布的 5.5.0 版本,智驾都和特斯拉不相伯仲。我们更懂中国路况,更懂国人的驾驶习惯,特斯拉可能更懂美国人的驾驶习惯,很难说谁更强,我非常期待 FSD 进入中国之后的表现。
36 氪汽车:行业会说特斯拉技术领先国内半年到一年,您觉得这种技术领先现在还有多少?
李力耘:从技术方法论上,小鹏和特斯拉、OpenAI 这样的全球 AI 企业不谋而合,我们强调云端大模型,参数量是车端 80 倍以上。我们云端大模型的训练数据量达到 2000 万以上 clips。每个 clips 可以理解成大约一分钟的小电影。每个模型都基于大量数据、在云端训练。我们有个说法叫 " 云上一天,地上三五年 "。
我们希望把云端能力通过蒸馏下放到不同芯片平台,甚至未来换芯片后也能把云端模型下放。
36 氪汽车:您觉得特斯拉 FSD v13 上的 " 车位到车位 " 跟国内的 " 车位到车位 " 有区别吗?
李力耘:我们即将推给用户的 XOS 5.5.0 版本上,用 " 一段式端到端 " 给用户提供了一个完整的 " 车位到车位 " 体验。其实在停车场和地库,2021 年我们就推出了 VPA(记忆泊车)功能,但用户体验并不好,用户渗透率没有城区智驾那么高。
所以,我们用 " 一段式端到端 " 实现所有车型标配后,现在去实现全场景覆盖,包括 " 车位到车位 " 低速行驶、园区行驶,未来还会覆盖泊车、高速,甚至海外智驾。我们希望给用户带来更加连贯、丝滑的体验,而不是有割裂感、类似于 VPA+NOA 的组合体验。
36 氪汽车:用户第一次开到新的地库,需要先记忆一遍才能实现点到点吗?
李力耘:第一次肯定没有地图,很难,如果有园区内导航指引会好一些。就像你第一次去一个地库,也需要一些指引或者借助他人的记忆,我们可以做到无感学习和记忆。第二次去就可以有丝滑的 " 车位到车位 " 能力。
36 氪汽车:小鹏之前也有记忆行车,比如记忆 10 条路线,这跟 " 车位到车位 " 的本质区别是什么?
李力耘:最大区别还是体验层面。小鹏智驾在 2024 年最大的两个变化,第一是 AI 化,面向 AI 进行组织变革,进行 AI 能力提升,另一个变化是,我们觉得用户不会为更好的科技买单,但一定会为更好的体验买单。
用端到端大模型赋能 " 车位到车位 " 后,用户体验会大大提升,虽然有时候可能需要学习、参考先验信息,但学习感会很弱。
「谈 AI:智驾 Scaling Law 还没到尽头」
36 氪汽车:今年智驾行业变化很大,年初卷 " 全国都能开 ",后来变成端到端,现在是 " 车位到车位 ",您怎么看这种竞争?明年的竞争重点是什么?
李力耘:原来小鹏智驾是孤勇者,现在是百舸争流,明年的竞争一定会更加激烈和有趣。
今年从 " 全国能开 " 逐步走向端到端,比拼的是博弈能力、比拼拟人化。到 " 车位到车位 " 之后,我觉得我们处在 " 无人化的前夜 " 阶段,小鹏智驾会笃定地走向无人驾驶。
我们希望,明年在能力上有所突破,可能先在 Max 车型上,小鹏智驾逐步提供类似无人驾驶的能力,接管次数无限降低。随着法规推进,或者新车型推出,我们一定会做出走向无人化的能力。小鹏的最终目标是解放驾驶员的双手、解放精力。
36 氪汽车:怎么做到?Scaling Law 在智驾领網域有效吗?
李力耘:小鹏是 Scaling Law 的忠实信徒。虽然最近很多 AI 前沿工作说 Scaling Law、预训练遇到了瓶颈。但从算力、数据量来看,我觉得自动驾驶的 Scaling Law 还有很大红利。
数据方面,互联网优质数据大概 600-700T 之后就会有瓶颈。但智驾大部分企业今年才逐步转向端到端,自动驾驶大量优质驾驶数据积累还没有到尽头。
另外,无论车端还是云端算力,都会有着更显著的增长,模型参数也会进一步扩大。我觉得自动驾驶的 Scaling Law 还没有到尽头。
36 氪汽车:行业会有些做法,比如将端到端大模型跟视觉语言模型融合,您认同这种观点吗?
李力耘:我不反对。这些观点在以不同的视角来描述端到端,在我看来可能殊途同归。无论是视觉语言大模型,还是视觉动作大模型,本质是通过大量数据输入,有一定推理能力,很好地实现类人驾驶的模型。
小鹏以视觉为主,我们实现了 " 光子进、控制出 "。当然,从多模态输入角度来看,视觉只是一个传感器,本身还有各种车道、GPS 或者是各种各样多模态输入。
网上的海量数据会让模型有更强的认知能力,识字认路。但是我们认为,拥有高质量的、丰富驾驶数据可以更好解决车辆驾驶的小腦问题,这跟大模型不冲突。
很多驾驶是相对本能的动作,就像人类的小腦,当然也需要大腦的能力。所以在我们的一段式端到端大模型中,Xbrian 可以认路识字,做一些简单推理,但更多时候还是对加减速控制、变道时机选择,或者绕行处理,更偏本能的小腦行为。
我们是既希望有聪明的大腦,能够推理思考,还是一个比较灵敏的、肌肉记忆很好的老司机。
36 氪汽车:小鹏是从什么时候开始做端到端大模型?
李力耘:2023 年 4 月份,我们开始布局整个 " 端到端 " 技术栈。那时候我们希望用端到端来解决对高精地图的依赖问题,做到全国都能开,所以当时智驾 AI 化,更注重识路、找路。2023 年底,我们意识到需要把端到端的能力进一步扩大,做成一段式端到端。
36 氪汽车:2023 年 4 月您和团队当时是怎样的状态?
李力耘:当时主要在开城,状态很难,因为把高精地图的拐杖扔掉之后,尝试用实时算法去认全国各种各样的路况,并且让车能够配合好行驶,是非常困难的。唯一能够彻底解决这件事就是靠 AI,用类人的方法把路认好、把路选好,让车开好。
36 氪汽车:那时候就定下了整个端到端、AI 模型的框架吗?
李力耘:方向是笃定的,但我觉得技术变化会非常快。今年以来,我们也看到了类似于 Sora、ChatGPT 非常强的 AI 能力涌现。我们也更新了 AI 的战略,包括对云端模型 Scaling Law 的认知,紧跟 AI 最前沿,然后应用在自动驾驶领網域。
36 氪汽车:小鹏智驾起步非常早,经历了很多个版本,在端到端进化这条路上你们甩掉了哪些包袱?
李力耘:端到端模型的建立是个非常缓慢的过程。系统工作方式从原来多技术模块变成 AI 中台。我们会着重建设数据采集能力、数据清洗,模型快速训练、部署、调试,确保模型高效解决问题。
规则还是很重要的兜底能力,一方面是为安全兜底,第二,原来规则积累的工程基础,可以让我们把整个数据闭环、飞轮非常高效地建立起来。
36 氪汽车:从 2023 年到现在,如果要选取比较重大的轉捩點,您觉得会是什么时刻?
李力耘:重大转折是今年四五月,小鹏一段式端到端大模型上线之后,我们发现,原来需要花很长时间打磨的一些问题,比如花几个月去打磨一些特殊的分流、右转或者是掉头等场景,解决得特别快,我们很惊讶。
原来的方案是小模块 AI 驱动,然后做路径规划、速度规划,整个链条非常长,遇到的问题很多。但我们用了 AI 能力后,环岛掉头、小路、很难的右转场景都有很大的能力提升,效率比原来高很多。
36 氪汽车:华为没有把纯视觉当成主流方案,小鹏为什么会这么坚决地要做纯视觉?
李力耘:其实就是第一性原理。我们生活的交通环境,包括路牌、路标、红绿灯,整个道路甚至车的造型都是为人来设计的,人最重要的传感器是眼睛,所以纯视觉一定是最直接、最高效的解决方案。特斯拉也分享过观点,认为激光雷达 + 纯视觉 1+1 并不大于或等于 2,而是小于 2。
小鹏的 AI 鹰眼视觉做到了比人的视觉更好的效果。在很多大光差、逆光的情况下会比人眼有更好的识别效果,这也是我们 LOFIC 架构的特点。当然我们也没有放弃主动的传感器,也会通过多模态跟毫米波雷达,超声波雷达去做融合。
36 氪汽车:在高速道路上或者一些特殊天气,激光雷达还是有很好感知效果,小鹏纯视觉有没有解决这种特殊天气场景下的方案?
李力耘:我恰恰觉得,这些情况下,第一性原理是更好的。再好的激光雷达在远处的点云也是比较稀疏的。激光雷达不是完美的,在一些雨水天气情况下它也有问题。小鹏 AI 鹰眼视觉是通过更大算力,看得更清楚、更远、反应更快,车辆反应速度提升了百分之四十几,对场景做出很好的响应。
36 氪汽车:后续像在 X9 这些车型上,还是会保留激光雷达和纯视觉两种不同的方案吗?
李力耘:我们会全系标配 Max,也就是小鹏 AI 图灵智驾(NGP),都会用纯视觉方案。
36 氪汽车:那方案配置方面,还会分 Max 、Pro 吗?
李力耘 : 我们会标配 Max,从 P7+ 开始。
36 氪汽车:小鹏自研的智驾芯片,结合你们的軟體方案后,可以发挥出什么样的效果?
李力耘:小鹏自研芯片的初衷就是实现软硬體一体,最大效能地发挥軟體的威力。但更重要的是在云端模型的赋能下,我们会对芯片做针对性优化,给用户提供最好的体验。
36 氪汽车:小鹏智驾下一个轉捩點会是什么时候?
李力耘:2025 年小鹏智驾轉捩點会在年中,智驾能力会有更大飞跃,可能会从一段式端到端,跨越到全新的 AI 迭代模式。
36 氪汽车:智驾行业密集迭代,公司创始人何小鹏怎么保持对智驾前沿的认知?
李力耘:小鹏智驾真正的一号位和灵魂就是何小鹏。因为他笃定 AI,笃定智能驾驶到自动驾驶,才有小鹏智驾的自我变革。他非常从用户视角来看智驾,会去开智驾的中间过程版本和量产版本,感受变化,反馈问题。
所以对行业态势的感知一定是多模态的。现在我们特别注重用户反馈的 NPS,智驾每个版本都会去做用户调研。当然也会和顶尖 AI 企业保持紧密接触,包括去美国开车、取经等,兼听则明。
36 氪汽车:何小鹏上一次给你反馈智驾问题是什么时候?
李力耘:不久前,我们把 XOS 5.5.0 过程版也推给了他,他觉得我们又解决了 30%-40% 的问题。
36 氪汽车:端到端方案依赖海量数据,小鹏达成了 2000 万 clips 的训练数据,在这方面小鹏有没有什么心得?
李力耘:得益于两方面,一方面是 AI 智驾铁军,车端积累多年的规则和严谨算法,很多事情在车端做是事半功倍的。
另一方面,得益于小鹏 AI 的进展,我们需要大量、高效敏捷地去挖掘数据,训练模型。所以我们既做车端模型、云端模型,也做了非常好的 AI 工具来挖掘数据。
这背后是组织方式的改变,我们有个 AI 效能部门,今年年中面向 AI 成立的新部门,专门训练各种各样的 AI 提效工具,包括用 AI 写代码、检查代码、自动挖掘数据。
36 氪汽车:小鹏智驾 2000 万 clips 的数据是如何达成的?
李力耘:我们大约在 2022 年底,就开始预研如何引入 AI 大模型,已经有了几年的积累。而且我们地把规则时代积累的经验移植到当前的数据采集和训练里,例如通过车端规则经验实时标注,精准采集训练所需片段,从而针对目标场景进行精准密集训练,能够大幅地提升采集和训练效率。
「谈竞争:智驾工业革命,转型成功的是少数」
36 氪汽车:友商通过端到端快速实现了高阶智驾量产。端到端会是行业其他人弯道超车的方案吗?
李力耘:如果把端到端技术趋势看作智驾领網域的一场 " 工业革命 ",每一次工业革命中,真正实现转型更新是少数,大部分人还是面临更残酷的竞争。
端到端不是让事情变得更简单了,组织架构的确跟原来不一样,原来每个技术模块都要基于规则的工程师,比如定感知、定位、规划、融合、地图、控制,现在就变成了数据闭环的问题。
数据采集、模型训练、模型部署,模型调试,它让整个迭代链条变得更长,更加不可控,某种程度上需要投入更多的资源,包括更大算力,更加精英的 AI 的研究人员。
36 氪汽车:智驾供应商跟传统车企如果保持比较深度的绑定,能继续参与这场游戏吗?
李力耘:第一,智驾真正从辅助驾驶走到无人驾驶一定是满足第一性原理的。我更愿意相信是主机厂,而不是供应商,能够率先从辅助驾驶突破到无人驾驶。
第二,主机厂在软硬體方面的配合、数据和中后台的配合,可能是事半功倍;对非主机厂而言,可能更不容易,数据背后的闭环是更隐形的挑战。
36 氪汽车:小鹏智驾成为标配,要从哪些角度去评估智驾技术的商业价值?会有指标吗?
李力耘:现在智驾就像当年的手机行业,我们一定要把智驾价格打下来,未来的车型都会标配高阶智驾。其实,智驾是小鹏 P7+ 用户购车的 top 理由。我们不会用智驾能力再做二次收费。
在小鹏 X9 上,73% 的车主都选择了 Max 车型。我们也会持续关注用户对智驾的反馈,比如他们喜欢的一些亮点或者不喜欢的槽点;在标配智驾后,我们会看用户的渗透率,比如在能开智驾的地方,用户是不是都开。
36 氪汽车:市场上会有观点说,小鹏现在车卖得好不是靠智驾,比如 MONA M03。您会反驳这种观点吗?
李力耘:在 MONA M03,智驾也起到了很重要的作用。同样价位上,小鹏 MONA M03 的智驾仍然领先,比如 MONA M03 率先推出断头路泊车,体验上和主销车型 Max 版泊车能力一样。春节之后,MONA M03 的 Max 版本也会上 AI 鹰眼视觉方案,实现高阶智驾的普惠跟平权。
36 氪汽车:CEO 何小鹏对明年的智驾提出了哪些考核和要求?
李力耘:我们希望 2025 年,在拟人感、安全感、舒适和效率上,做到更不一样的台阶和层次,与行业明显拉开代际差距。
更重要的是,我们会用一段式端到端放大我们的车型优势,不仅标配所有车型,更希望覆盖所有功能,实现点到点,包括赋能海外的智驾。
36 氪汽车:海外市场智驾会是你们明年发力的重点吗?
李力耘:对,小鹏非常坚定国际化,未来 10 年海外销量要占全部销量一半。2024 年小鹏的出海非常不错,但我觉得智驾还可以更好。明年,小鹏会根据海外当地的驾驶习惯和法规,把智驾体验按照当地用户喜欢的方向去做,提供给当地用户。
36 氪汽车:除小鹏本身之外,智驾团队还要支持别的项目吗,比如参与大众的项目?
李力耘:我们一直跟大众配合很好,无论是在车型上,还是电子电气架构上,或者智驾上,双方都是紧密合作。智驾会有专门的虚拟团队和项目组去跟进,和大众合作的车型会很快和大家见面。
36 氪汽车:在大众项目之后,小鹏的智驾还会有单独商业化的可能吗?
李力耘:小鹏是非常笃定地把辅助驾驶推向极致,走向无人驾驶的。在 AI 辅助驾驶的理念下,我们会更看重像 AI 鹰眼视觉带来的智能驾驶体验平权。至于真正的商业化,可以关注小鹏在 2026 年无人驾驶的进展。
36 氪汽车:你们会对 L3 有更多探索吗?还是会直接进入到 L4? 哪个更快?
李力耘:我们一定会推进 L3 和 L4。哪个更快,这个取决于法规进展,我们一定紧跟着法规进展。在明年的 Q1、Q2 某个时候,随着我们体验和能力更进一步的提升,大家会看到更多可能。