今天小编分享的汽车经验:不止卷硬體!!理想新一代VLA智驾大模型有望下半年落地,欢迎阅读。
快科技 3 月 10 日消息,据媒体报道,理想汽车正在研发下一代 VLA(视觉 - 语言 - 动作)智驾大模型,目标是于今年下半年实现项目落地。
理想汽车在去年二季度财报电话会议上表示已启动端到端 VLA 模型的研究,将两个模型合二为一,使多模态大模型内化为端到端智驾大模型的一种能力。
那么,VLA 智驾大模型与此前的智驾系统有何区别呢?
VLA 智驾大模型结合了端到端和 VLM(视觉语言)多模态模型的优势,能够提升智驾系统对复杂场景的理解能力,从而提高智能驾驶的精准度。
与端到端大模型相比,VLM 对影像和场景的理解能力更强,但端到端大模型存在决策不可解释以及难以处理部分场景的缺陷。
当前,VLA 是智能驾驶领網域的核心竞赛之一,理想汽车、吉利汽车和元戎启行都在积极推动其落地。
然而,VLA 的落地面临较大挑战,除了模型研发需要时间外,目前市面上的芯片性能大多无法支持其运行。
不过,英伟达即将量产的 Thor 系列芯片有望解决这一问题。