今天小编分享的科技经验:智舱界的黄埔军校,为何开启二次创业?,欢迎阅读。
出品 | 虎嗅科技组
作者 | 丸都山
编辑 | 苗正卿
头图 | 《蜂鸟计划》剧照
在见到戴玮之前,我并不相信 " 乐观主义者 " 的标签,会与一个岗位频繁调动的人有什么关系。
自 2007 年加入阿里巴巴,戴玮先后在淘宝、支付宝、OS 事业群、阿里文娱等部门任职,并于今年 4 月正式担任集团旗下的斑马智行 CEO。
作为新上任的掌门人,留给戴玮的好消息是,斑马智行这家公司有着极为高光的时刻,因为做出了业内最早的互联网车机系统,一度被视为国内智能座舱行业的黄埔军校;而坏消息是,上一次真正意义上的高光时刻,大概出现在 8 年前。
" 元宝(戴玮花名)在我们内部,属于是专打逆风局的角色 ",斑马智行的首席产品官蔡明如此评价道。
但面对如此开局,戴玮也只是面带微笑地表示," 其实也还好。"
" 至少从行业来看,现在无所谓‘逆风’ , 过去技术迭代没那么快时,留给斑马的机会确实比较有限,但眼下新技术所孕育的机会太多了,我们一定要把握住。" 戴玮向虎嗅表示。
基于这样的想法,戴玮在接到集团任命后,火速集结了一帮 " 老哥们 ",又拉来了一批技术专家,开始了斑马智行的 " 二次创业 "。
审视过去
在这一轮生成式 AI 爆发前,斑马智行可谓是 " 起了个大早,赶了个晚集。"
2016 年,YunOS for car,即斑马 1.0 系统随上汽荣威 RX5 车型发布,驾驶员通过一句 " 你好,斑马 " 的唤醒语,即可通过语音指令完成对车辆的行车导航、娱乐影音、空调车窗等功能的控制。
图片备注:斑马 1.0 系统的语音操作界面
今时今日,这些功能早已屡见不鲜。但在当时,大多数的车厂根本没有智能座舱的概念,即便是改变世界线的 Model 3,此时都没有进入正式量产阶段。
一年后,斑马系统的累计装机量达到了 40 万,这对于车厂来说已经足够优秀,但阿里的理想远不止如此。
2017 年 9 月,阿里在整合原 YunOS 移动端业务后,正式推出作業系統 AliOS ——覆盖汽车、IoT 终端、IoT 芯片及工业领網域,并整合原 YunOS 移动端业务。在这个庞大的设想中,斑马系统,或者说是这个系统的智能座舱部分,自然也与 OS 深度绑定。
但问题是,基于一个如此庞大的 " 物联网 " 作業系統,原本的斑马系统开始愈发臃肿,尽管 OS 技术储备不断加深,但斑马智行的产品创新却 " 肉眼可见地 " 慢了下来,直到今年 " 大模型上车 " 的计划正式加速。
在戴玮、蔡明等人回归斑马后,对公司的业务进行了多次深刻的讨论与梳理,并多次在高管中达成一致:All in AI。
首先公司内部明确的一点是,斑马必须扔掉沉重的包袱。为了让业务更加聚焦,未来只做智能座舱——在此之前,斑马智行秉承着明线发展 " 智舱 "、暗线发展 " 智驾 " 的策略。
在蔡明看来,专注于智舱更加符合斑马智行的实际情况,原因在于目前智驾行业内各家的同质化已经比较严重,已经出现价格战趋势,而且智驾方案在卖给厂商后,也没有任何新的商业模式能够带来后向收入。
所以斑马现阶段必须要将资源集中在智舱上,因为智舱与应用的联动可以产生稳定的后向收入,考虑到斑马大部分人在阿里系的背景,他们更加了解生态该如何运营、维护,这属于斑马得天独厚的优势。
另外一点被明确的,就是智舱 AI 技术与 OS 的解耦。当然,这并不意味着要与 Ali OS 割席,而是分化为两条商业路径:
第一种,保持智舱 AI 技术与 AliOS 紧耦合,这样做的好处是数据打通能够更加顺畅,但客户相对受限。
另外一种就是对智舱及 OS 进行解耦,仅保留部分中间件,给客户提供大模型语音及 Agent 集成的平台体系,甚至是用对话式的小程式上车,无论客户的系统是基于安卓,还是 Linux,都不影响智舱 AI 技术的向上框架。
在明确这两个问题后,戴玮和团队成员开始盘点手中所掌握的资源:较为扎实的 OS 系统框架、阿里通义大模型的支持、还有自 YunOS 时代就参与互動设计的团队,以及新 " 入伙 " 的一众 AI 研发人员。
戴玮接手斑马的一个月后,围绕 " 智能座舱 AI 技术 " 的开发工作,按下了加速键。
淘汰 APP?
作为 YunOS 和斑马 1.0" 高光时刻 " 的亲历者,戴玮和蔡明并不满足于 " 让大模型上车 ",他们更关心的是如何做出一款 " 好用的 AI 操作平台 "。
" 智能座舱这事在行业里压根就没有做成。" 在蔡明看来,通过装机量、渗透率去评估智舱发展毫无意义,决定生态能够跑通的只有服务数量及用户时长两个指标。
有调研机构曾做过统计,除了地图导航和音乐等少数 APP 外,在常见的互联网服务中,座舱端的年使用率(一年打开一次即作计数)差不多是全端的三分之一到五分之一。
这说明大多数 APP 在车上,根本无法触发高频应用,进而让车厂与互联网厂商同时陷入一个尴尬的境地:前者甚至愿意为 " 应用上车 " 而付费,这在移动互联网时代是无法想象的;而后者又不愿费时费力地适配应用,去换取车上本就不多的活跃用户。
因此,在斑马的产品开发团队看来,智能座舱 AI 技术,势必要去 APP 化,让服务和内容直达用户。
这里还有一个考量就是,APP 有着严格规划的操作层级,如果使用传统的触控互動,在行车的过程中操作非常不便,因此在去 APP 化的同时,尽量使用语音互動,减少非必要的触控。
以上的技术设想,在产品开发的过程中,逐渐转变为两条基准原则:互動变革与服务重塑,并在此基础上开发出一款通用型智能座舱 AI 技术平台。
尽管斑马在智舱系统上有着不错的 " 底子 ",但按照目标让大模型上车,基本相当于要做一次推到重做。
" 就单讲语音,整个语音系统由四段组成,分别是前端声学、ASR(语音识别)、NLU(自然语言理解)、TTS(语音合成),除了第一段外,其他部分都需要用到不同的大模型,有些需要在云端做泛化,还有些则需要彻底的重构。" 蔡明向笔者解释道。
图片备注:元神 AI 的语音演示 Demo
而相比于技术问题,更难的其实是工程问题。
" 我们之前做测试,可能同样一款车,仅仅是隔音层薄了一些,用户甚至根本感知不到,但语音系统就得全换,而我们还需要在不同的路面、不同的车内环境下做各种调优。"
作为产品和 AI 的负责人,蔡明为了协调各部门之间的进度,干脆把公司所有的 P7 职级以上的 Leader 聚在会议室中,用一整天的时间逐一跟进各部门遇到的问题。
四个月后,斑马智行如期交上了 "AI 上车 " 的第一份答卷。
智舱的 iPhone 时刻?
在前不久举办的云栖大会期间,斑马智行联合通义发布了全新智舱技术品牌 " 元神 AI"。
元神 AI 基于通义大模型,以自然交流为基础,围绕感知场景、组织服务、认知进化构建 AI 技术体系,旨在解决传统座舱体验不佳、服务低频的问题。当前已基于英伟达 Orin X 平台与通义端侧多模态大模型做出了 POC(产品概念化验证)。
在发布会现场,斑马智行演示了基于元神 AI 的典型 Agent 产品——与钉钉联合打造的 " 闪记车听 "。
基于自然对话,用户可以在车内进行线上会议,拓展功能包括前序会议追溯、弱网参会、对话式摘要、自动設定日程与待办等功能。同时,斑马智行还对硬體配置做了 AI 算法优化,如阵列式降噪麦克风、头枕播报等。
有处细节是,在现场的演示 Demo 中,Agent 产品大多是阿里巴巴集团旗下的应用,比如大麦、高德等,但是第三方应用愿意向斑马开放接口吗?
对于这个问题,蔡明认为,目前 CP(内容提供商)/SP ( 服务提供商 ) 在移动端或是桌面端的增量早已见顶,他们需要的是有人能够建立出新的场景,而智能汽车就是个很好的场景。
" 假设放在几年前,比如之前滴滴、快的争抢市场的那种状态,那我们是无法完成应用聚合的。换句话说,当下做智舱的 Agent,最大优势在于各行业也在摸索应用 AI 化的路径,我们有机会把用户常用的应用聚合在多任务列表里,让用户获得完整的 AI 体验。" 戴玮补充道。
值得一提的是,随着元神 AI 的发布,斑马智行还为这套系统制定了一个非常有特色的目标,即 "100 次座舱服务调用不超过 1 次触控互動 "。
与之对应的是,在元神 AI 智舱平台上,几乎所有的非驾驶操作都通过语音互動完成。
至于这个目标是否符合现在用户的普遍操作习惯?蔡明举了一个例子,在 iPhone 诞生时,大家都觉得它不符合传统 T9 键盘的输入方式,但现在不会有人再要求 " 手机要有打字手感 "。
" 只要互動体验做得好,用户是完全不会介意互動模式改变的。" 在蔡明看来,互動变革和服务重塑,实际上就是在推动智能座舱 "iPhone 时刻 " 的到来。