今天小编分享的互联网经验:GPT上车只为人车互動?车企还在憋大招,欢迎阅读。
图片来源 @视觉中国
文 | 元宇宙日爆
ChatGPT 改造汽车的序幕已经拉开,奔驰率先出手。
不久前,梅赛德斯 - 奔驰将 ChatGPT 集成到了车机上,开启了为期三个月的测试,结果显示,它的语音助手不仅可以完成简单地指令,还能进行连续多轮对话,理解能力和响应质量都有较大提升。
理想、创维、蔚来等汽车厂商随即蜂拥而入,用前沿的 GPT 能力让车机智能化程度更上一层楼。车机也彻底从最初的 " 收音机 " 变成了功能丰富的智能终端,加上 GPT" 大腦 " 后,又开始从木讷、鸡肋的机器向行车伙伴转变。
而人车互動不是 AI 上车的尽头,自动驾驶才是未来。以往的自动驾驶解决方案过于依赖高精地图,一旦地图更新跟不上瞬息万变的路况,行车安全将受到威胁。AI 大模型的进化更新,让车企们看到了机会。
让 AI 主动感知和决策,放弃对高精地图的依赖,正在成为一种主流趋势。几天前,理想汽车开启城市 NOA(导航辅助驾驶)内测,它将 BEV(Bird ’ s eye view,鸟瞰图)大模型作为主要解决方案,让汽车模仿人类 " 腦回路 " 驾车。通过连续学习,城市 NOA 还能被训练成用户通勤路线上 " 代驾 "。
接棒互联网,AI 正在对汽车进行更深层次的改造,四个轮子的大家伙越来越神似变形金刚。
车机 +GPT,奔驰先出手
一场由内而外的 " 变形记 " 正在席卷汽车圈,从传统燃油动力到新能源,从驾驶工具到智能化产品。多年以来,科技驱使下,汽车不断变幻着外貌和内在,互联网改造汽车后,人工智能又来了。
梅赛德斯 - 奔驰在这股新浪潮中一马当先,要把 ChatGPT 移植进车机。
6 月 16 日,奔驰为期 3 个月的 ChatGPT 测试计划在美国启动,它与微软合作,通过 Azure OpenAI 服务将 ChatGPT 集成到车机中。车主可以通过 Mercedes me APP 选择使用 ChatGPT,还有更直观测试方式——直接在车内使用语音命令 "Hey Mercedes,我想加入测试计划 ",奔驰的 MBUX 信息娱乐系统就会将语音助手 "Hey Mercedes" 自动接入 ChatGPT。
过往,Hey Mercedes 可以提供体育、天气等信息,并回答有关车辆周围环境的问题,还能控制用户的智能家居,这都是制式化的。ChatGPT 加入把问答变灵活了,用户能询问目的地详细信息,获得晚餐建议,可以不断提出问题,连续收到回复。这是 ChatGPT 的看家本领。
当前,仅在美国地区约 90 万辆配备 MBUX 的奔驰汽车可以优先测试 ChatGPT,奔驰打算利用这个初始测试期深入了解用户提出的请求,来确定未来开发的优先事项,以及调整不同市场和语言的推出策略。
关于接入 ChatGPT 这事儿,奔驰给了一个充满感性的声明," 一切目标都围绕着重新定义您与梅赛德斯的关系。" 奔驰要让 ChatGPT 重塑人车互動体验,更形象的类比是,车机从一个木讷的注重功能性的机器 " 活 " 起来了,向着车内生活伙伴的角色转变。
奔驰之后,国内的汽车厂商率先跟上。
6 月 19 日,理想汽车推出了自研的认知大模型 "Mind GPT",这个大模型由理想的空间算法团队研发。据说大模型训练的开始日期早在 ChatGPT 发布之前,Mind GPT 基于数 10 TB 的原始训练数据,使用了 1.3 万亿个 Token 进行基座模型训练,能识别声纹和语音内容,还能听懂方言,同时能为车主提供出行规划,甚至具备 AI 绘画和 AI 计算等功能。
理想透露,Mind GPT 发布后,理想汽车将新增 LUI(用户语言界面)互動方式," 比如你想吃个火锅,只需要呼叫理想同学,车机界面就会生成火锅的图片供你选择,随后自动算好出行路线。"
创维汽车也在近日宣布,旗下两款车型创维 EV6 Ⅱ及创维 HT-i Ⅱ在智能车机上集成了 ChatGPT,此外,长城汽车、蔚来汽车、小鹏汽车、奇瑞汽车四家车企都在上个月申请了 GPT 相关商标。
GPT 上车成为一股潮流。奥纬咨询董事合伙人张君毅认为,GPT 技术的接入能够提升车的人机互動能力和综合环境问题的互动能力。今后车企在同一价位段的硬體方面的品牌差异会越来越小,当舒适性、安全性、动力和续航里程上竞争难以产生太大的差异时,卷智能就成了必然选择。
给智能座舱装上 " 大腦 "
ChatGPT 上车又是汽车进化史上可书的一笔,最前沿的自然语言处理大模型应用到了人类的出行工具上,更丰富的车内生活体验将会出现。
回望 30 多年前,车载娱乐功能和车机智能化,尚是一片空白。第一代车机诞生于上世纪 80-90 年代,当时人们普遍的关注点还是汽车的发动机、底盘和变速箱 " 三大件 ",突然有一些车型不仅能听收音机,还能吞进磁带,自由播放音乐,汽车有了一些第二生活空间的影子。
第二代车机则加入了 DVD 播放、MP3,娱乐性凸显的同时,汽车又向驾驶体验迈了一步,加入了车载导航。此时,解决 " 路盲 " 问题成为一个主流趋势。许多老司机一定记得,在没有车联网的时代,凯立德车载导航成了高端车型的标配,它使用 GPS 卫星定位和存在车机里的地图包数据,实现相对准确的导航精度。
但除了导航和听歌、收音之外,当时的人们并不对车机抱有太多期待,车机也往往不是决定购车与否的主要因素。
进入 21 世纪,电子数码技术不断发展,手机的形态先变了。循着这个进化思路,车机上出现大屏,智能化成为新卖点。基于 linux、WinCE、安卓等系统的车机陆续被汽车厂商采用,而后汽车不仅可以免费实时导航,还具备全景可视系统、汽车驾驶辅助系统,比如 360 度影像等。
当汽车连了网,一切由变得更不一样。在线观影、路书、语音控制、预约保养、远程诊断等功能被加入车机,中控台的螢幕越来越大,功能越来越多,一些厂商直接在驾驶室装上了比平板电腦还大的显示屏,甚至厂商们近来卷起了 " 全面屏 ",就连副驾和后排都要装上螢幕。
终于," 第三块屏 " 的概念越来越显眼,主机厂们希望,车机能够成为继电腦和手机之后,影响人类生活的第三代智能终端。用富含科技感的车机占领用户心智,拓展更多的商业模式,成为现在的车企们攻坚的方向。
现在," 车机 " 这一原始概念逐渐被 " 智能座舱 " 所替代。蔚来甚至造出了 " 第二起居室 " 的新词,不仅车机越来越智能化,车企们开始卷内饰用料、音响系统、灯光系统,蔚来还发布了一款 AR 眼镜,支持随车巨幕观影;理想 L9 甚至配备了一个后排冰箱,让汽车成了可移动的房子。
但无论是车机还是智能座舱,语音对话一直都是发展相对滞后的功能,考虑到驾驶安全性,语音操控又十分必要。
过去近十年来,几乎所有车企和大量的 AI 创业公司,在自然语言处理领網域投入颇多,希望优化车内的语音互動体验。许多车机都能回答简单的预设命令,比如调高温度、预报天气等,更新和创新围绕拓宽自然语言口令展开,比如当用户说 " 有点热 " 后,车机可以打开空调制冷或调低温度。
但想让车机听懂更多 " 人话 ",比如用各种方言规划路线、甚至找餐馆,可能还真不如车主自己用手机地图和大众点评来得有效,更丰富的语音式人车互動陷入瓶颈,直到 ChatGPT 出现。
自然语言大模型产品(ChatGPT、文心一言、通义千问等)直接开放给 C 端使用,使智能座舱的开发者们看到了曙光。强大的理解能力和逻辑推理能力,有望让车机成为行车助手,暗藏商业可能。
比如,车主可以告诉语音助手," 帮我找出目的地附近有团购优惠、评分超过 4.5 的火锅店,一会有 5 个人用餐,给我预定一下位置,再看一下哪里停车方便。" 放在以前,车机绝对无法一次性理解如此多的信息,但对 ChatGPT 来说,这只是它的基操,只要实时数据源足够多,需求被满足的可能性能够无限大。
GPT 的加入并不只是让对话更流畅了,而是让车机具有了 " 大腦 ",不仅能回答问题,还能理解需求并生成答复。至于智商有多高、反应有多快,取决于汽车厂商对上车大模型的训练能力,以及敢不敢 " 氪 " 金上更牛的硬體(芯片)。
AI 如何让自动驾驶 " 腦回路 " 更像人?
车内生活的丰富,让汽车逐渐成长为一个充满温情的载体,它不再是枯燥、冰冷的代步工具,转而成为一个舒适的生活空间。
而 AI 主导的汽车进化还不止于 GPT 上车,它对自动驾驶的技术推动更加意义重大。
传统的自动驾驶研究方法是通过采集大规模的驾驶数据、测试更长的驾驶里程来覆盖所有可能的驾驶场景,以确保发生突发状况时汽车有预先设定的应对方案。但突发状况的复杂程度往往难以预料,一旦系统中没有应对某种特殊突发状况的预案,驾驶安全就将受到极大的威胁。
这也是为什么当前的辅助驾驶系统,必须要求驾驶员手扶方向盘以应对实时突发情况。而 AI 的学习能力将有可能改变这个现状。
不久前,清华大学研究团队提出了自动驾驶 " 可信持续进化 " 技术,该技术是基于动态评估 AI 的可信赖程度进行学习训练,保证自动驾驶汽车在遇到陌生新场景时,其驾驶能力可从基础性的主动避让开始持续提升,在确保安全前提下达到更好的驾驶表现。
简单理解,利用 AI,自动驾驶功能的汽车能主动学习、熟悉各种新遇到的场景,进行持续进化,随着驾驶里程与数据量的累积,性能得到持续提升。
理想汽车正将 AI 大模型用到自动驾驶领網域。6 月 17 日,理想宣布开启城市 NOA(导航辅助驾驶)内测,并将在下半年向用户开放通勤 NOA 功能。与常规解决方案不同的是,理想采用了 BEV(Bird ’ s eye view,鸟瞰图)大模型,来实时感知和理解环境中的道路结构信息,让汽车更能模仿人类驾驶员的操作习惯。
以往多数汽车上的辅助驾驶系统,大多是采用高精地图方案,相当于实时把路况投喂给自动驾驶系统,让其做出决策。但在复杂的城市道路中,总会有高精地图无法覆盖和无法及时更新的区網域,这成为了该方案的一大缺点。而采用 BEV 大模型后,相当于 AI 主动感知实时路况,自主决策驾驶操作。
当然,BEV 也有缺点,例如在一些跨度较大的路口,通行车辆较多,传感器视野容易被遮挡,导致车端实时感知的结果会丢失局部的信息。为了弥补这一不足,理想据称搭配了神经先验网络(NeuralPriorNet,简称 NPN)和端到端的信号灯意图网络,前者的作用相当于每当车走过自动驾驶车队走过的路口,都有影像参考;后者则是学习大量人类司机在路口对于信号灯变化的反应,帮助自动驾驶系统理解交通信号。
根据实际的测试反馈,理想城市 NOA 还不能够完全实现自动驾驶,它存在转弯不够及时和不擅长超车的问题,此外,面对一些特殊障碍物,算法无法做出决策,必须进行人工接管。
不过,相比于传统的训练方式,大模型的引入最大的改变还是让自动驾驶系统有了更强的学习能力,这意味着自动驾驶能力会逐渐提升。典型的案例是,理想汽车推出了通勤 NOA 功能,在开启该功能之前,车主需要先设定通勤路线,通过日常通勤时的自动化训练积累 NPN 特征,大约 1 至 3 周时间后,AI 可以成长为通勤路段的 " 代驾 "。
这个过程体现了 AI 大模型加持下的自动驾驶汽车操作思路:先学习和熟悉路况,再进行辅助驾驶," 腦回路 " 更像人类了。
用 AI 大模型研发自动驾驶鼻祖不是理想,而是特斯拉。早在 2021 年,特斯拉就曾推出基于 Transformer 架构的 BEV 感知方案,随后华为、百度等企业也在 "BEV+Transformer" 上展开布局,目前,特斯拉、小鹏汽车、问界汽车等都在落地和不断优化类 " 城市 NOA" 功能。
大模型的持续进化,很可能让车企们找到了自动驾驶技术的突破方向,摆脱对高精度地图的依赖是第一步。现在的自动驾驶还停留在 " 辅助驾驶 " 阶段,未来,你很有可能会将你的交给 AI 接管。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App