今天小編分享的科技經驗:不止卷硬體!!理想新一代VLA智駕大模型有望下半年落地,歡迎閲讀。
快科技 3 月 10 日消息,據媒體報道,理想汽車正在研發下一代 VLA(視覺 - 語言 - 動作)智駕大模型,目标是于今年下半年實現項目落地。
理想汽車在去年二季度财報電話會議上表示已啓動端到端 VLA 模型的研究,将兩個模型合二為一,使多模态大模型内化為端到端智駕大模型的一種能力。
那麼,VLA 智駕大模型與此前的智駕系統有何區别呢?
VLA 智駕大模型結合了端到端和 VLM(視覺語言)多模态模型的優勢,能夠提升智駕系統對復雜場景的理解能力,從而提高智能駕駛的精準度。
與端到端大模型相比,VLM 對影像和場景的理解能力更強,但端到端大模型存在決策不可解釋以及難以處理部分場景的缺陷。
當前,VLA 是智能駕駛領網域的核心競賽之一,理想汽車、吉利汽車和元戎啓行都在積極推動其落地。
然而,VLA 的落地面臨較大挑戰,除了模型研發需要時間外,目前市面上的芯片性能大多無法支持其運行。
不過,英偉達即将量產的 Thor 系列芯片有望解決這一問題。