今天小编分享的互联网经验:对话元戎启行CEO周光:不打价格战、不搞车海战术,欢迎阅读。
过去,智驾方案领網域一直有着 " 地大华魔 " 等四家国内头部智驾玩家的说法。如今,以城区高阶智驾为一道分界线,以 " 华元魔 "(华为、元戎、momenta ) 为代表的第三方 " 端到端 " 技术供应商,逐渐抢占了技术方案与车型落地上的先机。
北京车展期间,华为、元戎、Momenta 均推出了端到端的量产智驾方案。
华为一直是话题流量的王者,拥有极强的技术号召力,研发规模达 7000 人。2022 年之前,华为也在用高精地图,而后坚定地走无图路线。2023 年 4 月 16 日,华为正式发布不依赖高精地图的 ADS 2.0。
Momenta 则是依靠自己丰富的量产经验,与比亚迪、广汽、丰田、奔驰、通用等车企的合作,为它的端到端方案提供了数据养料。
相比于前两者,元戎的特点在于原生的 AI 基因,发力时间早。如果以端到端的研发时间来看,元戎 2023 年 3 月就确定了端到端方向的研发,8 月就完成了端到端模型的道路测试。从这点看,元戎是国内最早把端到端模型测试车跑在城市公开道路的方案商。
据雷峰网了解,元戎的第一款车的量产仅仅花了 8 个月的时间,而后续一个新的车型适配时间会缩短到 3-4 个月。10 月,吉利与奔驰合资的 Smart 品牌旗下的 smart 精灵 #5 上市,该车型也采用了元戎启行提供的无图城区 NOA 功能方案。
11 月初,元戎启行完成一轮 1 亿美元的融资。截至目前,元戎启行已完成 6 轮融资,累计融资金额超 5 亿美元,高阶智驾平台 DeepRoute IO 已成功搭载上车,与车企共同打造的量产车已超 2 万台,并与多家主流车企共同推进 10 个量产项目,涵盖了 SUV、MPV、越野等各种车型。
端到端的原理无需赘述,想要做好一个端到端模型有三个因素:好的模型、海量的优质数据和大算力。更容易形成壁垒的,是前两者。
与大语言模型在互联网上爬取海量文字数据用于训练不同,端到端智驾需要的视频数据获取成本和难度极高。量产上车,是获取优质数据、迭代模型的一条必经之路。这也决定了端到端是一条 " 强者恒强 " 的技术路线,留给后来者的时间視窗则会越来越小。
元戎启行 CEO 周光说,元戎已经投入了更多的精力在下一站的 VLA 模型。VLA 模型是一个融合了视觉、语言和动作的多模态模型,可提高模型的泛化能力和判断推理能力。到 2025 年,元戎的 VLA 模型将基于英伟达下一代智能驾驶计算平台 Thor 正式发布,届时元戎将成为业内首批将 Thor 芯片部署上车的智驾公司之一。
目前,行业里流行的做法是 One Model 端到端 +VLM 技术架构。
在周光看来,VLM+ 端到端与 VLA 模型的区别在于,前者是教练通过语言的形式教学员开车,后者是教练自己开车。" 教练开车和学员开车,两种方式你更放心哪一个?"
元戎有着不同于行业的竞争心态:不打价格战、不搞车海战术。周光表示," 如果合作的车型只能卖 100、200 台没有意义。我们需要的是数据,所以我期待有更多的爆款车,来补齐工程化的基因。
明年,元戎会基于端到端架构去拓展 Robotaxi 业务,并且积极开展海外业务,明年还会参加日本车展。
周光认为," 元戎启行的公司愿景是为真正的 AGI 做一些贡献,汽车不应该定义成汽车,而是一个机器人的载体,希望元戎启行的技术能够应用到整个物理 AI。"
11 月 3 日,雷峰网《新智驾》与周光进行了一次对话。以下为对话内容,结合了部分元戎融资沟通会的问答。
新智驾:元戎的这轮融资,应该是今年智驾行业比较重磅的一笔。
周光:近两年从投资机构拿钱挺难的,其实我们也有能力去融一些比较好拿的钱,但没必要。我们账上还有余粮。而且,我们的风格是该花的花,该砍的砍,我们砍掉了港口,也砍掉了 L4。
新智驾:这笔钱对于行业有什么样的激励作用?
周光:行业里有做得好的拿到了钱,这很正常。最差的情况是什么?你做到最好也拿不到钱。
新智驾:能不能谈谈你们跟客户第一次见面时的场景?对方提了那些要求?
周光:我挺佩服他们的。第一次就见了他们总裁,只对我们提了一个要求,要求我们 all in,在量产车上实现跟今天一样的效果。实际上,做到今天这样上车的效果,没有双方 all in 是不可能的。他们也是全力以赴,特别开放地投入。
而且,我们量产真的是第一次走完全程,不是几百台工程车,所有的问题都是在万级的数量级去体验。你不知道我们客户会把车开到哪里,就好像有的 case 在农村,到处都是鸡。但最后,我们也都处理好了。
新智驾:在这些极端场景里,元戎做的怎么样?
周光:跑得可以。2023 年 3 月,我们就发布了 " 无图 " 方案,我们第一个搞出来的。但当时我们做了一个非常巨大的决定:量产端到端。这就意味着,我们是原生的端到端,一开始就是端到端的技术架构,所有的产品、工具链都是围绕端到端来开发,不能先上一套 rule-based 的无图方案再去迭代。
我们是唯一一个,你跟我约定一个城市,我们就能在约定地点一起接车,马上去测试的公司,我觉得直到今天也很难有公司这么做。
做得好也因为我们足够 all in,我有三四个月待在主机厂所在的城市,回到深圳的家都有点陌生。但做项目需要双方都 all in,如果是各怀鬼胎没有意义。
新智驾:八个月的量产时间是如何做到的?
周光:我们之前也有过几乎量产的定点项目,这个项目还是现在智能化营销做得最好的一个品牌。借这个机会,我们也积累了很多的项目经验。
虽然我们在技术上走得最早,但当时行业认知是,做自动驾驶必须有图,大家都认为 " 无图 " 是皇帝的新衣。光靠元戎根本不可能(把市场教育起来),连车都上不了。只有这个品牌有能力成为 " 鲶鱼 ",去把智能驾驶行业搅活起来。
这个公司学习了元戎的技术,干出了第一版 " 无图 " 方案推向市场。所有主机厂才慌了,才掀起了国内的智能化浪潮,中国汽车市场的智能化水平才能像现在这样。
新智驾:跟主机厂的合作,让你们学到了什么?
周光:我们跟主机厂的合作,本质是把我们变成更 to C 的公司。哪怕是端到端、" 无图 " 技术,没到量产前,都还是通过 demo 获取客户,你只关心这个系统的上限。
但是真正的量产,需要把产品交到消费者手中。你对底线的把控、对稳定性的把控、对一致性的把控,这非常重要。2020 年,我们 10 台车里只有 7 台能用,其余 3 辆不知道什么原因用不起来,这也是量产上的经验不足导致的。
跟头部主机厂从 0 到 1 量产合作,是极其难得的机会。因为 0 到 1 是最关键的,市场机会是逐渐收敛的,没有人再愿意冒险把车给没有量产经验的厂商。我觉得元戎是最有 tech vision 的。
新智驾:第一个量产项目有没有挣到钱?
周光:营收很可观。但如果要覆盖研发成本,那(第一个项目)还不够。高阶智驾和低阶智驾不一样,高阶智驾的市场没那么恶劣。我们现在跟别人谈都说:元戎比别人贵,但是效果好。并且比现在某头部厂商,我们(智能驾驶系统的)价格还是很亲民的。
新智驾:有哪些量产经验可以沉淀下来?
周光:核心还是系统稳定性。本质我们是一个 AI 系统,不是靠代码,按道理我们的工程难度比中低阶 rule-based 公司难度低。他们写 if-else,遇到问题就反复调。我认为这不是工程学问题,我们是 AI,为什么要调整那些规则呢?
新智驾:基于 AI 就不会出现 bug 吗?
周光:不能叫 bug,并且我们有安全机制。第一,我们出现问题的概率很低,第二,我们对安全问题有兜底。另外,安全兜底机制肯定要迭代。随着 AI 能力的提升,你会更不想去限制这个 AI。只是在某些场景下,兜底机制会去接管这个车辆,避免风险发生。其实,今天的 AEB 就是人类智驾的兜底,我觉得未来 AI Safety 会变成新的 AEB。
新智驾:未来合作车型有什么进展?
周光:在共同推进 10 余款车型的量产。我们是和客户深度合作,跟一些厂商的车海战术风格不一样。这样的逻辑,车企也愿意跟我们一起打造爆款车型。
新智驾:数据背后,数据的带宽和存储费用就很巨大,这个成本和算力储备问题如何解决?
周光:端到端跟 VLA 对算力要求没有语言大模型那么大,今天的 Orin 能够实时跑的也就是 10 亿的参数,车端的端到端 VLA 跟真正的大语言模型比起来是个小网络。
做端到端和 VLA 的时候,算法是巨大的差距,对算力的要求没有大模型那么大,我们自己投了不少钱在卡上,也有自己的算力储备。同时阿里也是我们的股东,我们在有算力需求时候也可以跟股东寻求帮助,这并不是问题。
新智驾:目前元戎团队规模如何?
周光:集团人数 800 人左右。人越多说明你越原始,越不是端到端。AI 相关人才难以快速扩招,但是量产交付的工程团队相对好点,这么多年,主机厂、传统 Tier1 已经培养了很多工程人才。
新智驾:元戎是行业里比较早做无图的公司。但是此前,在我们的采访中,有地图厂商的负责人直言:过去,高精度地图全部装在车机端的,现在变成在训练端。一些车企每时每刻都在用高精度地图,同时通过数据采集,进行云端训练。什么才是真实的无图 NOA?
周光:我们是最早的,不是比较早。比较早期的版本,确实很难看出来是不是无图。但是端到端模型做出来的时候一定是基于 " 无图 "。你想做好 AI,你就没办法用高精地图的形式去做。高精地图是矢量数据,AI 不擅长处理矢量数据,就跟人对加减乘除一样天生不擅长。
新智驾:目前,高阶智驾里有一个不成文的 " 华大地魔 " 的第一梯队的说法,您认可吗?
周光:华大地魔是去年的说法。去年能跑高速 NOA 的就能称为高阶,但今年的高阶就是真高阶,要有城市 NOA。现在已经量产城市 NOA 的智能驾驶公司也就三家,元戎是其中一家。
新智驾:今年的快速发展,元戎是不是已经进入了第一梯队?在您的标准里,哪些要素是成本第一梯队必备的?
周光:具备 " 无图 " 端到端的城市智驾能力,才有可能进入第一梯队。但这是一个鸡生蛋、蛋生鸡的问题。你要做端到端就要先量产,没有量产数据玩不了端到端。但你现在没有端到端,之后就量产不了。这就是为什么我说以后的智驾方案商会很难,身位会被拉得越来越远。没量产经验的,想让车厂付出一定的时间成本陪你玩,这很难了。
另一方面,成为第一梯队,你需要有万台级起步的量产车,低于万级没有意义。端到端 1.0 能有万台级的车,效果就很好。要做 VLA,10 万台车的规模才是一个理想状态。VLA 对数据量的要求会比端到端 1.0 多一个数量级。国外的一些端到端公司没有量产项目,解决不了数据问题,10 亿美金也买不到数据,物理 AI 在中国的机会还是比较大的。
新智驾:此前,元戎被媒体报道会采用高通的智驾芯片。但是您在公开演讲中也表示,基于端到端模型,元戎启行正基于 Thor 芯片研发 VLAM(Vision-Language-Action Model,视觉 - 语言 - 动作模型),该系统将于明年推出。高通的这一说法靠谱吗?
周光:我们还在评估。我们的方案可以适配各家芯片厂商,可以根据主机厂的要求去做适配。芯片是主机厂选,尤其是海外的主机厂,会更提前选定芯片厂商。
新智驾:现在是 11 月,明年到这个时候,端到端会有什么样的变化趋势?
周光:可能今天你用高速 NOA 觉得很舒服。但在端到端出来之前,城区高阶智驾就不是好用的状态,真正好用还是在端到端出来之后。
到明年这个时候,你用城市 NOA 就会像高速 NOA 一样舒服,百公里级的接管频率明年应该能看到。当消费者很愿意用的时候,市场就真的收敛了。
新智驾:今年年初,您关于 L4 的说法引起了不少争议,您的看法还是这样吗?
周光:L4 这条路就是有局限性,它商业化落地就是很难。我觉得,大模型出来之后,大家更信 AI 了,这是一个价值观的变化。你不能对这个世界发生的事情无动于衷。
我是 2020 年就意识到(基于高精地图方案的)L4 这条路存在不足,但是我们会做 robotaxi,以端到端架构支持运营,而不是基于模块化的、基于高精度地图去做,那没有意义,没有商业化。我们的运营模式就是没有区網域限制的运营。
物理 AI 最根本的目的一定是取代人,自动驾驶的最终目的也是把人去掉,让机器帮我们开车。技术线路的问题,就是说你不要拿 Waymo 这套技术线路和特斯拉的技术线路比,两个出发点是不一样的。
新智驾:元戎有上市计划吗?
周光:我们不急。因为我们走在正确的路上,也有自我造血能力,没有什么上市压力。