今天小编分享的科技经验:对话小马智行彭军:不要迷信大模型,自动驾驶格局已变,欢迎阅读。
小马智行的故事,是一类中国科技公司的缩影:在面对巨大变革的浪潮时,他们不断挑战技术和工程的极限。这样的旅程充满了不确定性和巨大的投入,不是辉煌的成功,就是惨痛的失败。
然而,要实现如此激动人心的目标,过程是异常艰辛的。随着外部环境的冷热交替,资本市场的不断开合,自动驾驶也经历了从风口浪尖到谷底的剧烈变化。
但很多人可能未曾留意,小马智行们已经从小规模商业走到大规模量产的前夕。
小马智行开启北京大兴机场至北京亦庄之间自动驾驶载人示范 | 图片来源:小马智行
小马智行是彭军和楼天城的第一次创业,之所以选择在自动驾驶赛道开启这次创业,并不是源于某种商业推理的逻辑,而是源于一种大趋势到来时的时不我待。彭军回忆创业瞬间时说,他不知道实现 L4 要多久,但就是觉得这件事情值得做。
在创业的初期和随后的几年里,L4 一直是他们的「原力」和「定海神针」。在美国,自动驾驶市场主要还是谷歌、通用 Cruise 以及车厂等巨头的游戏;但在国内,自动驾驶是从「黄埔军校」——百度开始,随后不断出走、裂变、再裂变,形成了一张充满活力的中国自动驾驶创业版图。当然,这其中也少不了复杂的结盟与背叛,闹剧、谎言和绯闻。
然而,小马智行似乎并未受到太大影响,保持了自己的节奏和定力。深入了解小马智行,我们听到最多不是融资、新概念,而是对「以终为始」和「规模化」的持续关注。多年来,小马智行都给人一种武林「扫地僧」的感觉。
当然,创业的路上也充满了意外和挑战。彭军在创业前,觉得创业就是一直朝着目标冲。但他后来意识到,短期和长期目标之间并不是一条直线,就像攀登珠峰需要建设 6 个营地一样。这是他创业最大的感触。
疫情的突然来临打乱了原本的计划,他们做了很多调整,包括开始尝试乘用车 L2 业务,开始销售一些硬體产品。同时,也开辟了 Robotruck 的业务条线。
小马智行一直是一家典型的技术驱动型的公司,推崇工程师文化,信仰用技术改变世界。这种信念不仅体现在公司的愿景中,也融入了每个员工的工作和思考方式。今天中国有不少有科技公司,但真的相信技术能带来核心价值的人并不多。
在北京亦庄的小马智行办公室里,极客公园见到了彭军。他给人的感觉是一个内敛的人,交流中没有那么多激情四溢的语言,很容易被看作典型的工程师。然而,他所做的事情却充满了「梦想家」的气质,这种气质也深深植入了小马智行的企业文化。
如今,小马智行已经走过了创业的「少年期」,正进入「青春期」。回顾这八年的创业历程,小马智行有着自己的坚持和变化:不变的是出发时的愿景、目标,和以始为终的思考方式;不断变化的,则是他们灵活调整的短期目标。最新的挑战是到 2025 年实现规模化,然后等待技术与市场的交汇点。
勤工俭学的大二学生
极客公园:小马智行从 2016 年成立到现在过去 8 年了,经历了许多关键时刻。在你看来,如今在中国的自动驾驶行业,已经走过了婴儿期吗?
彭军:对,婴儿期已经过去了,现在正处于青春期。目前,小马基本上可以说已经在大学上了一两年级,目前在勤工俭学。虽然还没毕业,但个人世界观和价值观已经形成,知道自己喜欢什么,努力的方向在哪。不过,未来能否找到最理想的工作,还是未知数。
极客公园:回到创业的那一刻,很多人都会有一些梦想或使命的驱动。当时你决定离开大厂创立小马智行,是因为大厂不追求 L4 这个目标吗?
彭军:不是不追求目标,而是大厂动作太慢了。大公司病、政治斗争,各种问题导致进展缓慢,不如自己做得快。
极客公园:小马智行一开始是坚定地要做 Robotaxi,还是先追求 L4 技术,然后选择了 Robotaxi 这种商业模式?
彭军:应该说是后者。从终局来看,L4 技术在前期能够实现规模化应用定制的,一定是 Robotaxi。因此,我们坚定地选择了 Robotaxi,当然后面的驱动力是 L4 技术。
极客公园:你当时觉得多快能实现目标?有没有大致的时间框架?因为融资、团队搭建和业务成长线都需要有一个预期?
彭军:说实在,要做多久我不知道,就是觉得这件事情值得做。从终局来看,Robotaxi 行业是机器代替人,那么它的规模会很大。无论是五年还是十年,做到行业头部一定有价值。因此,我们最早融资时,并没有跟投资人说明确的时间预期,而是说我们能做到行业头部,可以引领行业发展。
极客公园:我们管这种叫顶尖创业者的「逻辑轮融资」,算不出具体数据,主要看逻辑和候选人。从天使轮到 A 轮,小马大概拿了 1 亿美元融资。那个时候,你是如何规划业务预期的?
彭军:自动驾驶的不确定性很大。早期还是希望技术先成熟,因此 A 轮甚至到 B 轮前期,基本都是在拼技术。这就像制药行业,研发一个药需要十年时间,但早期至少能在动物实验中看到效果。所以当时我们希望尽快把技术进展展示出来,因为商业的路径还是很长。
极客公园:那当时技术进展体现在哪里?比如说从几台车到 100 台车?
彭军:关键不在于数量,而是安全性、接管率和复杂场景处理能力。说到底,从 100、500 到 1000 台,在技术不成熟之前并没有本质区别。从 A 轮末期和 B 轮初期,大家关注的是乘车的体验、能力,不只是看简单的功能,更重要的是处理复杂场景的能力。
极客公园:在那个时代,如何保持技术足够的领先?跟大厂有什么不同?
彭军:最大的不同其实是团队合作。自动驾驶是一个复杂的系统,不可能靠「一招鲜」实现。就像医生看病,不是头疼医头,而是需要系统性调养。有时表面上看是规划的问题,实际上可能是感知或预测的问题。我觉得整个团队的协同能力,不甩锅的能力是最关键的。
很多人宣传端到端技术多厉害,实际上背后有一整套体系支持。同样用端到端,只有特斯拉做的好,其他人效果一般。所以特斯拉用不用端到端其实不重要,就是他做得好,所以端到端就牛逼了。
L2 的问题在没做出用户可感知的差异化
极客公园:你最开始决定做 Robotaxi 时,肯定也考虑过 L2 相关的技术和产品,但没有选择它。是因为当时大模型还没有出现吗?
彭军:其实,端到端自动驾驶在 2016、2017 年就已经被提及,只是当时技术不够成熟。我们也做过很多探索,大概在两三年前,很多端到端的技术我们已经在使用。
现在回想起来,我们的创业出发点与很多人有些不同:对我们来说,创业是为了实现自己的追求,而不是为了创业而创业。当时我们认为自动驾驶很有价值,创业是为了实现用机器代替人类驾驶,所以最开始没有选择 L2。
极客公园:L2 不值得你投入如此大的精力?
彭军:对。很多人觉得 L2 的市场有吸引力,但我觉得天花板太低。即使中国一年有 2000 万辆车,每辆车装配 L2 技术的价格在几千元。即使装配率达到 100%,整个市场规模不是特别大。而且很多主流车企都选择自研,十几家供应商平均份额可能只有几百万辆车。加上要承担的风险,我觉得不值得投入太大精力去做。
极客公园:那回到疫情这几年,全球的融资环境并不好。在那段时间内,如何调整团队的目标?
彭军:在这个时候,我们进行了许多调整,尝试了很多新的策略和调整。最初我们认为 Robotaxi 三五年就能大规模商用,但疫情期间,我们意识到可能还需要五六年的时间。但作为一家公司,那时候已经成立了四五年,我们需要学会如何商业化,即使这并非 Robotaxi 的商业化。那个时候,我们开始涉足 L2 业务,开始销售一些硬體产品。
极客公园:如果说天使轮、A 轮关注逻辑,然后 B 轮关注技术。那 2020 年左右小马进入到 C 轮融资,就需要看看这个技术能不能带来一些收入。在 Robotaxi 还没有商业化的时候,你们选择了 L2++ 业务。它对技术的发展会有帮助吗?
彭军:最大的帮助,是使得大家能够更清晰地知道应该做些什么,以及整个商业化过程中可能需要经历的事情。特别是对于公司里一些纯技术高管来说,他们可能没有闯荡过真实的商业世界。
我不指望 L2++ 业务能立刻养活我,但很多体系建设、跟车厂的合作能力和合作方式,这对将来 L4 也是必需的。
极客公园:在 L2 领網域,你们对客户选择有特定的策略吗?
彭军:我们主要是做 L2++,一些复杂的功能,更偏向城市高级驾驶辅助系统(NOA)。因为高速 NOA 的功能谁都能做,跟友商卷价格,我们无法赢过他们。我们更擅长处理城市中最复杂路况的处理能力,这是我们能做得比任何人都好的地方。
极客公园:目前 L2 市场本身就有限,但部分客户还在自研,如何看待这种现象?
彭军:说到底,今天的 L2 产品很难做出用户感知的差异化。你可以说他每小时接管一次,你每 3 小时接管一次,或者他开 5 个城市,你开 20 个城市,但用户感受不到这些区别。
极客公园:我觉得自动驾驶的问题是,车厂们都觉得有希望,而自动驾驶公司都感到绝望,本质上是技术没做到位。那么,如何实现差异化呢?
彭军:目前有一些迹象,部分车厂正在逐步放弃,认为自己做不了。
因为自动驾驶公司和传统车厂对文化和组织架构的要求不同:对车企来说,供应链管理是核心竞争力,但在技术发展方面可能就不行了。如果为了自动驾驶,要建立一个新的技术团队和内部文化是很难的。事实上,在大公司工作过的人都知道,找外部供应商要比内部合作容易得多。
极客公园:那有什么因素会加速车厂放弃全栈自研,而转向分工体系?
彭军:一般来说,基础能力车企会找供应商,差异化部分要自己建。完全放弃自研不太可能,那车企就没有可以宣传的亮点了。他们仍然需要进行差异化的开发,所以会自己找团队来建设这些能力。这就类似于安卓这样的汽车作業系統,车厂在上面做很多定制 APP。
极客公园:小马智行有三个业务板块:Robotaxi、自动驾驶卡车(Robotruck)以及乘用车智能驾驶领網域(POV)。这三块业务的商业化进展如何,预计哪块会走得更快一些?
彭军:我认为,乘用车 L2+ 业务商业化速度最快,但是天花板偏低,后劲不足。相比之下,Robotaxi 的天花板足够高,技术比较难但实现后价值巨大。因此,我们的主要发力点依然是在 Robotaxi 上。
至于 Robotruck,与 Robotaxi 在技术上有相通之处,但在业务逻辑和应用场景上也有很大的不同,需要去找布局。不过,Robotaxi 的大规模商业化速度肯定比 Robotruck 快得多。
所以,小马商业化的节奏应该是这样:勤工俭学是 L2++,真正的主力职业是 Robotaxi 和 Robotruck,但从长远来看,还能在干线物流领網域创造更大的社会价值。
极客公园:这跟很多人的认知好像不太一样?
彭军:很多人可能不理解,实际上关键在于市场接受度和安全性能的要求不同。Robotruck 要做一个 Demo 很容易,但要将其真正产品化,比起 Robotaxi 来说难度要大得多。
举个例子,人类司机在城区大约每 2-3 万公里发生一次事故,而卡车司机在高速公路上可能需要驾驶 30 万公里才发生一次事故。换言之,卡车在高速公路上的安全性是城市驾驶的 10 倍。因此,要做好 Robotruck,至少需要达到 Robotaxi 的 10 倍安全性能,这在技术和实现上都是极大的挑战,但是我们做到了。
极客公园:如果一家公司选择的路线是,主打跟人一样的安全性,但成本下降呢?
彭军:即使安全达到跟人类司机相似的水平,也是困难重重。技术的实现不仅仅是 AI 的问题,还包括控制精度、天气、环境等多重因素。同时,即使 AI 技术可以达到 10 倍的安全性,AI 与车辆的整合是否能达到这个水平还是个未知数。
Robotruck 的技术入门低,但要做到及格很难。很多人只看到易上手的一面,但是要在高速公路上做到真正精通,处理的问题远比城市驾驶复杂。在高速公路上,并不是很多人想象的没有人,它也需要处理各种复杂情况。
极客公园:那到底 Robotaxi 为啥反而更容易呢?
彭军:实现 Robotaxi 到处通用确实很困难。但它的优势在于,只要在几个城市能够运营,就已经有了商业价值,形成商业闭环也更为容易。作为出租车公司,我可以在北上广深等大城市运营大量车辆,这本身就是一个巨大的市场。相比之下,货运公司不覆盖全国主要干线就没有商业价值。
极客公园:就是闭环的门槛不能太高,否则会成为不断烧钱的过程?
彭军:所以我不需要追求无图的方案,因为不需要在全国范围内运营。在一个城市内,出租车司机都是带图的。因此,我觉得我们讨论技术时不能脱离商业逻辑。
极客公园:很多人提到,高精度地图方案的成本很高?
彭军:大家有时混淆了一次性成本和维护成本。为什么高精地图昂贵?因为更新和维护成本高。对地图供应商来说,要做到全国实时更新,需要大量的人力、车辆,所以成本很高。
但对小马来说,如果在北京有 5 万辆车在路上,每天都返回数据,那我的地图就是最新的,并没有额外的成本。
大模型给 AI 圈来了场「全民健身」
极客公园:最近这两年,大模型技术在自动驾驶领網域也开始应用。特斯拉的端到端技术加入后,接管率明显下降。那端到端对智能驾驶是有多大的助推?
彭军:我认为至少对 L2 有很大推动作用。说到底,端到端、数据驱动结合大模型,能够大幅降低开发成本并提升通用性,对用户体验和技术迭代都有很大帮助。例如,很多车企过去需要一个一个城市去开放,如果我买一辆车,只能在十个城市使用,其他地方不能用,这种用户体验很差。但端到端很好地解决了通用性问题。
极客公园:您提到端对端对 L2 有很大帮助,但对 L4 作用不大,L2 技术无法渐进到 L4,是因为 L4 更复杂吗?
彭军:不是更加复杂,而是要求不同:对于 L2 来说,核心是低成本和通用性,而端到端技术很好地解决了这两个问题。L2 对安全性的要求达到一定高度即可,比如每半小时接管一次,用户已经觉得很好。
但对于 L4 而言,核心是足够的安全性,之后再考虑通用性。Robotaxi 的核心诉求是在足够大的有限区網域内(比如几个城市),能实现比人类司机高十倍的安全性。
打个比方,通过端到端,可以培养一个略逊于人类司机的驾驶系统,它通用性很高,能在各种环境中行驶,但时不时会犯错。所以,我们在 L4 技术中也会使用端到端技术,它对新城市的早期拓展有很大帮助。但我们还需要在此基础上进行许多其他优化,仅靠端到端是无法实现 L4 目标的。
小马智行在亦庄开启无人自动驾驶出行服务(Robotaxi)运营 | 图片来源:小马智行
极客公园:我觉得现在很多大模型公司打的是乱仗,数据、算法、工程、产品从第一天就必须捏在一起,否则就不 work。您认为这会对自动驾驶的组织形态产生影响吗?
彭军:短期内不会。核心原因在于驾驶和大模型不完全相同,尤其是与大语言模型不同。
大语言模型追求的不是底线足够高,而是上限足够高,可以容忍某些方面的偏差。比如大语言模型可以文生图、视频,100 个视频中只要两个可用就很牛逼。
但对 Robotaxi 来说,开 100 次车有一次出问题就是大麻烦了。它需要底线足够高,可解释性和可重复性要求都很高。所以,我们在大模型之上需要做很多额外的工作,确保系统不会低于这个底线。
极客公园:如果量化一下,你觉得大模型对自动驾驶实现 L4 的进程会缩短多少年?
彭军:智能驾驶过去的技术栈过于复杂,没有五到十年的积累很难有所突破,但现在两年的时间就可以完成通向通用性认知的过程,这是核心的变化。就像医生培训的时间从十年缩短到六年一样,大模型技术让人们更容易进入这个行业。
这可能是最本质的变化。大模型技术相当于 AI 圈的全民健身运动,提升了国民的身体素质。虽然这些人还不能立即成为职业运动员,但让国家队选择的范围变大了很多。
极客公园:马斯克在 8 月 8 日宣布推行 Robotaxi 计划,您怎么看待这件事?
彭军:我猜测马斯克更可能是推行 Robotaxi 的计划,而不是立即推出 Robotaxi 产品。如果他要做 L4,那一定是一个新的产品线,这有可能,但他不可能用 L2 技术直接更新到 L4。
极客公园:今年 5 月,Waymo 宣布其 Robotaxi 出租车服务在三个城市每周完成超过 5 万次付费出行。这个水平如何评价?
彭军:在我看来,这个并不重要。大厂内部有自己的指标和需求,需要向领导展示成绩。在毛利没有偏向正之前,铺的量越多亏损越大。因此,我的追求不在于开始量产后就盲目增加规模,那会是在浪费钱。
这个指标不是我要对标或追求的,我更关注的是车辆数量能否产生足够的数据,支持技术迭代和验证我们的运营效率,而不是过分迎合短期目标以取悦老板。
不能把 KPI 拆得过细
极客公园:在硅谷,很多创业者先谈 Why,然后在谈 How、What。目前来看,你们团队的技术迭代速度明显高于大厂,核心原因是啥?
彭军:表面上看,我们的车在复杂场景下的处理能力显然很好,但真正的核心在于背后的体系建设。
自动驾驶技术本质上并不高深,就是不断解决路上遇到的问题。但这项技术之所以复杂,是因为有很多权衡取舍(trade-offs)。比如开车时,如果这个弯没拐好,可以拐大一点,但这可能会引发更多问题。最大的难点在于副作用很多,就像治病一样,用药多了会有副作用。我把肝治好了,但肾不能坏掉。
极客公园:掌握这个度非常困难,这也是自动驾驶面临的挑战。那从组织上如何实现整体把控呢?
彭军:为了实现这一点,在组织架构建设就不能像某些大厂那样过早地拆分 KPI。中国一些大厂在组织体系上很强,比如数据驱动和流量驱动的业务上表现非常好,是因为他们能够层层拆分 KPI,每个团队都有自己的目标。
然而,自动驾驶领網域也需要拆分 KPI,但如果拆分得太细,反而会适得其反。一个 KPI 指标表现很好,可能会导致其他指标下降。
所以,最终不是一个拆分 KPI 的过程,而是大家整体来背 KPI 的过程。比如我们可能为了优化车辆变道能力,会组建一个专注于变道的虚拟团队,让感知、规控等人员都加入其中。这些团队在一段时间内的绩效指标会集中在变道方面,但他们又能在各自领網域内协调资源。
用户搭载小马智行的无人化测试车辆 | 图片来源:小马智行
极客公园:所以就是相当于纵向组织建立起横向联系,各个团队都能理解其他团队?
彭军:对。我们的组织架构,特别是研发体系,一直倾向于这种网格状的结构,同时有垂直团队也有横向团队。所以,与很多公司不同,小马每个员工可能有不止一个老板,可能同时有两三个。所以一开始有些人确实适应不了。我常常看到这些文章,说新人跨级汇报是职场的大忌,但小马却非常鼓励。
极客公园:这其实对人本身是一种挑战?
彭军:是的。因为我们不是单一目标优化,而是要多目标优化,甚至几个业务指标之间是有冲突的,而且在不同事务上有不同的老板来负责。这对人提出了很大挑战。有些人很聪明、很有能力,最后却因为这个原因不开心而离开。
极客公园:小马已经成立八年了,你对于 L4 的判断有过什么样的变化或调整吗?
彭军:大方向和使命应该没有变化,但在一段时间内,我们的关注点会不断进行小调整。我们坚持用终局思考,基本上还是沿着原路坚定地走下去,当然走的路程充满曲折。
极客公园:你说的曲折,是指什么呢?
彭军:曲折,应该是说当你要把长期目标拆为可控制的短期目标时,它一定不是一条直线的。
这个话题其实很有意思,我在创业之前从未考虑过,但创业后感触很深。创业就像爬山一样,如果你的目标是攀登珠穆朗玛峰。走了很久,你告诉团队目前只爬了一半,所有人都不会喜欢那样。
真正的创业者,不仅仅要设定攀登珠峰的最终目标,更重要的是如何在中途建立六个前进营地。因为攀登珠峰就是经过六个营地,才能最终登顶。特别是自动驾驶这种没有人做过的领網域,这些营地需要自己去建立,实际上是更加困难。这也是对一号位、二号位最具挑战性的部分。
当下最紧急的是规模化
极客公园:目前来看,Robotaxi 的成本比人低一半,你觉得未来这种比例还会下降吗?
彭军:今天目标并不是追求进一步降低这个比例,而是实现规模化。之前的许多努力已经证明了这种模式的可行性,但现在缺乏足够的资源和政策支持来大规模推广。
极客公园:要实现规模的增长,总需要一些动力来推动,成本继续下降是一种很好的方式吗?
彭军:基本上目前的成本效率已经接近极限了。实现规模增长并不是一推动二、二推动三,而是一个相互踩跷跷板的过程。只要经济效益、安全性都足够高,就会有更多人愿意尝试,政策支持也会增加,更多车厂愿意合作生产,这样就能推广到更多地方,最终形成滚雪球效应。
极客公园:所以,目前阶段只是算直接成本。那如果我们设想一个比较乐观的预期,未来 18 个月内,Robotaxi 的规模会达到什么水平?
彭军:整个行业会超过一万辆。我们的目标是在未来两年内达到几千辆。
极客公园:在走向 Robotaxi 的过程中,小马的商业模式和定位是如何设计的?
彭军:如果展望未来 5 到 10 年,小马的核心还是提供虚拟司机。从商业模式上看,我们既可以通过第三方平台获客,也可以有自己的平台,两者可以互补。至于如何抽成,只要合理都是可以的,有更多的获客端其实是有利的。
同时,为了让这个虚拟司机更好地发挥作用,我们会做很多定制化工作,比如参与车辆的生产过程,以及出租车的运营。
极客公园:从长期来看,你们的商业效率如何?你们对未来的利润和毛利有过推演吗?
彭军:假设我们提供的虚拟司机,一年能够节约的成本是 10 万元,这已经是巨大的市场。
这些都基于我们有几个核心判断:因为安全性、法规,Robotaxi 的门槛其实是很高的。即使在十年后,Robotaxi 也不会变得烂大街。只有少数长期投入的公司才能做到这一点。因此,只要我们能比人类司机便宜 20% 到 30%,就具有很大的竞争力。另外,从长期来看,人类司机的数量肯定是越来越少,价格一定是越来越高的。
小马智行与丰田联合开发的铂智 4X Robotaxi 概念车 | 图片来源:小马智行
极客公园:在当前阶段,什么是小马最重要和紧急的事情?
彭军:我认为最重要和紧急的是实现规模化。这个过程其实非常复杂,如果在拆分一下的话,我的核心目标是确保毛利为正,这是最重要的指标。
极客公园:很多厂商提到局部城市能够实现毛利为正,你怎么看呢?
彭军:设定指标有很多方式,但我认为不需要欺骗自己。有些公司宣称很快就能实现毛利为正,但实际上他们可能隐藏了很多成本,并未计算在内。
我们的团队目标是要坦诚地将所有成本计算在内,实现真正的毛利为正。毛利为正,就意味着你的业务被认可为资产、生产工具,可以用来获得银行贷款等支持。
极客公园:那当你的业务上量,毛利开始转正,如何面对大厂的竞争?我觉得这是创业者都会面对的一个问题。
彭军:大厂拥有显著的资源优势,但也面临着自身的劣势。特别是在涉及到前沿技术和创新,或者短期目标不明确的时候。
同时,在早期技术不够深的时候,大公司可能通过高薪挖几个人一拼就可以了,这在中国以前也发生过很多次。但现在自动驾驶技术发展已经到了一个新的阶段。自动驾驶技术的发展已经足够复杂,不再是简单地挖人就能解决的问题,而是需要更复杂的体系和更深的技术积累。