今天小編分享的科技經驗:背靠百度,極越就敢説自己是智能化标杆了?,歡迎閲讀。
前兩天,極越搞了個 AI DAY 發布會。
開頭兩句話就把我給吸住了。
極越 CEO 夏一平説 " 極越 01 的上市拉開了智能汽車的序幕,極越 01 成為整個行業的智能化标杆,沒有之一。 "
不兒,現在大家都這麼猛的嗎?
以前都是小鵬説自己智駕标杆,現在華為靠着一手全國無圖智駕,也成了标杆。這極越作為一家入場并不算早的新勢力,咋也成汽車智能化的标杆?
越往後聽越發現,你别説這極越的 AI DAY 還真有點東西。
極越背靠百度,把文心一言大模型給搞車裏了。作為國產語言大模型的小标杆,文心一言先是被三星 S24 作為國内 AI 助手的候選人。最近聽説又被蘋果瞄上了,果子準備在下一代 iPhone 16 加入文心一言。
而極越作為一輛車,把文心一言搞進去又是做啥用的?
首先是讓語音助手更聰明,以前只能開個窗關個空調,現在是行走的百科全書,堵車的聊天神器。
跟文心一言談笑風生或是在線答疑,主打就是一個陪伴。
而且按極越的統計,極越車主日均調用文心一言服務可以達到 7.1 次,説明車主用上基本就離不開了。
好好好,中年男人不回家,坐在車裏合着不是玩王者榮耀,而是跟極越車機講相聲?
當然,除了要聰明,車機語音助手最關鍵的功能,是讓智能座艙變得實用。
先來説智能座艙這個點,極越提到了一個 " 全網域全端側 " 的互動概念。
説起來也簡單。
像咱們平常用語音互動的時候,主要頭疼也就這麼幾個事,一是沒信号,二是有卡頓,三是聽不懂,四是沒隐私,那麼這個 " 全網域全端側 " ,其實就是為了解決這些問題。
先説沒信号,目前汽車的語音助手其實都要依靠 " 雲 " 技術來實現。
説白了就是需要聯網,沒網就用不了了。有的地下車庫信号不好,有的山區根本沒網,語音助手就互動不了一點。
所以,極越把整套語音互動相關的模塊,都塞在了車載芯片的 NPU 裏,相當于車自己就有個腦子,就沒網其實也能聊。
其次,極越把語音助手的邏輯運算和深度學習模型都放在 NPU 裏,不僅是聯網的問題,還可以減少中間流程,減少卡頓,最終可以使互動速度提升到 700 ms 以内。
隐私就更好保護了,畢竟離線語音,你的聊天記錄不會發送到車企總部,就不怕你和 AI 助手的聊騷被車企員工标注了( 狗頭 )。
然後還有一個識别率的問題,有時候還真不能怪 AI " 人工智障 " ,其實在嘈雜環境下, AI 收到的音頻和咱們考六級聽力測試沒啥區别,換人來聽也未必準确,説實話遇到普通話不好的,我是真的耳背。
所以,極越把本來用在智駕上的多模态策略用到座艙上了。説白了,不僅聽你語音,還對你口型,這樣一套 " 多傳感器融合 " 方案,據説可以達到 90% 的正确率。
你别説,背靠老大哥的 AI 技術,座艙這塊搞得真可以。那智駕這塊你靠誰?
哎!還真讓它找着靠山了!靠誰呢,先買個關子,咱們接着看。
和大多數車企走純視覺路線不同,極越是純視覺 + 一點有圖的 " 非主流路線 " 。。。
先説純視覺,在上一次 OTA 之後,極越就用上了 OCC 占用網絡技術,這個技術簡單説就是将多個攝像頭觀測到的二維圖形進行算法處理,形成三維建模,最後整出一個類似《 我的世界 》的 " 體素 " 世界。
而且,用户可以通過車機實時查看,更好地感知汽車機器人的世界。
它們把這個 OCC + BEV + Transformer 稱為 B.O.T 三向箔,不過,這套東西倒不是極越首創,在本質上它和特斯拉是同一個邏輯,但是在國内這麼做的,極越還真是第一個。
想當年,特斯拉之所以不做多傳感器融合,主要還是激光雷達的價格太貴,現在國產化的激光雷達早不是曾經這個價位了,極越就不能拿它當理由了吧?
所以,極越的解釋是,純視覺具備更快的迭代速度和更高的技術上限。
有一説一,激光雷達确實可以精确地判斷物體體積,但純視覺可以通過色彩等信息,對物體進行識别,不過這要更強大的算法才能實現,按百度王亮的説法, " 激光雷達初速度高,純視覺加速度更快 " 。
這就不得不説,百度的 AI 在智駕訓練上的優勢。比如説,通過文心一言可以快速找到相關屬性的智駕訓練素材,好比一個考試題庫,随時挑重點難題對 AI 進行特别培訓。
據説,在智駕訓練用上文心大模型之後,成本會大幅降低,效率會大幅提升。
所以,從上市到現在,極越 5 個月 5 次 OTA ,每個月都搞了個新版本,好好好,月月開新車是吧。。。
而且在下個大版本更新後,極越 PPA 也可以 " 全國都能開 " 了。但準确的説是 " 有百度地圖的地方,極越 PPA 都能開 " ,畢竟它還是有圖的嘛。
所以主流車企都在無圖化,為啥極越偏要做有圖呢?
其實,咱們得糾正一個觀點,目前大家談的有圖和無圖,其實沒有那麼明确的非黑即白,而是處于一個灰色中間态。
首先無圖不是真沒地圖做參考,導航用的 SD 地圖還是要看的,不然都不知道往哪裏開了。
而且大多數車企會選擇 " 有圖用圖,無圖再説 " 的方案,這倒不是説無圖不行,而是需要大量的算法作為基礎,依然是一個門檻很高的操作,一般車企還真做不好,有現成的圖用着,那就先用着。
而有圖最大的問題是費錢,比如做完一個城市的高精地圖,可能得上億的成本,而且這還不是最關鍵的,還有修路、市容市貌修正等一些原因,高精地圖還要不停維護更新,基本是個無底洞。
巧了,我極越智駕的靠山來了,百度地圖。
百度作為地圖行業的老大哥,也有它的理解,它的答案就是做一套 LD 地圖,在成本和效用上做了權衡,説有圖那确實是有圖,但其實也是做了妥協,精度沒有高精地圖那麼高,成本則會低得多。
有一個好處是,因為不用大規模制圖,即便是地圖更新的問題,也可以通過視覺實時建圖,降低成本。
所以説,極越這套純視覺 + 有圖的方案,決不是誰一拍腦袋做出的決策,而是背靠百度的存量資源,極越智能座艙有文心一言大模型做靠山,極越智駕有百度地圖和 L4 級别的蘿卜快跑做靠山。
所以這麼看下來,極越老板做标杆這句話還真不是吹牛口嗨,有點東西。看來我是時候向差評君申請,搞一輛極越來給大夥測測了。
最後,送上一個彩蛋!還記得前文提到的 " 體素 " 世界嗎,極越這次 OTA V1.4.0 版本後更新了一個 OCC 彩蛋,實在是太有意思了,直接上視頻,讓大家也感受一下。