今天小編分享的汽車經驗:大模型之戰,商湯押寶智能座艙?,歡迎閱讀。
如果說 2020 年是智能駕駛的元年,那麼 2023 年就是大模型的元年。今年 2 月份,由 OpenAI 開發的 ChatGPT 在國内一夜爆火,被 AI 震驚的同時大家都在問什麼時候國人能有自己的 ChatGPT,于是百度扛起大旗率先發布文心一言,緊接着各大科技公司相繼發布大模型。
AI 公司商湯科技也緊跟隊伍,發布了名為 " 日日新 SenseNova" 的大模型體系,并賦能于智能展示車艙。
當我體驗完就感受到大模型為什麼在車圈兒這麼火,它或許意味着,智能座艙的元年要真正到來了。
除了視頻裡展示的 " 唇語 / 唇動 "、" 智能救援 "、"Air touch(隔空手勢)"、"AR K 歌 " 以外,座艙還兼有 " 哨兵模式 " 和 " 智能屏保 " 功能。
怕車被刮花?打開哨兵模式,車輛就會開啟環視監測,通過人工智能算法,甄别車輛四周存在的威脅性行為,當人員或者物體靠近車輛一定安全距離以後才進行報警。
并且可以根據設定的敏感度進行不同級别的警告,然後通過亮屏、閃燈,或者直接發送消息到用戶手機進行提醒。同時應用深度學習和光流檢測技術,在夜間等低可視度場景下也能實現功能。
最關鍵的是,車輛還會記錄下畫面。在沒有攝像頭的路段," 手欠的嫉妒狂 " 也不能逍遙法外。
智能屏保則是采用 3D 技術引擎和人工智能感知相配合,通過主動推薦更換屏保樣式,以手勢、視線、表情等無感式互動打造沉浸式體驗。
比如當朋友第一次搭車坐在副駕駛的位置上時,表情被系統檢測到後屏保會做出相應的互動。後排入座兒童的時候,系統可以檢測并且推薦适合兒童的屏保,如知識問答或卡通片。
以上功能已經在二十多款量產車型上實現落地,例如極氪 X 就搭載了哨兵模式、乘客行為檢測、手勢識别等功能,這些場景的實現正是因為與 " 日日新 SenseNova" 大模型體系進行了深度融合。
商湯 " 大模型超市 "
" 日日新 SenseNova" 大模型體系雖然才公布一個月左右,但是其研發過程可以追溯到 5 年前,目前已構建了計算機視覺、自然語言處理、AI 内容生成、多模态、決策智能(AI 文生圖創作、2D/3D 數字人生成、大場景 / 小物體生成)等多個領網域的大模型。
就如其名字的寓意一樣:" 苟日新,日日新,又日新。" 這套大模型體系的能力會一直持續演進,并為我們開放各種應用體驗,比如:
1." 秒畫 " 文生圖創作平台,我們可以通過設定關鍵詞、尺寸、清晰度來獲得一張原創圖,直接擺脫做檔案時的找圖困擾,也不用擔心版權。在這裡,自己天馬行空的想象力也可以得到實現。
2." 如影 "AI 數字人視頻生成平台,僅需一段 5 分鍾的真人視頻素材,就可以生成出來聲音及動作自然、口型準确、多語種精通的數字人分身。
這個平台哪個二次元星人能拒絕?不過話說回來,這個功能在我看完一條 " 數字人直播帶貨一個月成本僅需 200 元 " 的新聞以後,确實有點引發職業焦慮。
3." 瓊宇 " 和 " 格物 "3D 内容生成平台,可以生成大規模三維場景和精細化的物件。
這就和當下流行的 " 元宇宙 "、" 虛拟世界 " 有關了。舉個例子,你在遊樂園或科技館高價體驗到的刺激、驚奇、怪誕的 3D 畫面,這個平台就能快速生成。大概未來在車裡戴上 AR 眼鏡你就能 " 穿越黑洞 " 了。
4." 商量 " 中文語言大模型應用平台,支持語言理解、文本生成、情感分析、文本摘要等功能。會議記錄員、百科全書甚至是編輯,它都可以勝任。
無論是語言大模型,還是文生圖或數字人生成,都離不開大規模 AI 基礎設施的算力支持。為了應對 " 大算力、大數據、大模型三位一體 " 的 AI 發展方向,商湯打造了 AI 大裝置 SenseCore。
商湯 AI 大裝置
商湯 AI 大裝置 SenseCore 以人工智能大模型開發、生產、應用為核心,打造一站式、自主研發 AI 雲、AI 平台、AI 服務解決方案。簡單來說就是推動所有軟體功能實現的載體。
為了将大規模技術帶來創新帶動商業模式發展這條路走通,商湯持續擴建 SenseCore AI 大裝置。
目前完成了 2.7 萬塊 GPU 的部署,可最多支持 20 個千億參數量大模型(以千卡并行)同時訓練,最高可支持萬億參數超大模型的訓練;算力方面最大可輸出 5000P 算力。
滿足算力需求并不夠,想要運轉起來,還需要以數據挖掘為起點和終點的數據閉環。簡單來說,由于商湯 TO B 的本質,這些算法需要跑起來,為客戶比如車企賦能。
基于 AI 大裝置 SenseCore 和 " 日日新 SenseNova" 大模型體系,商湯可以為行業夥伴提供全套的自動數據标注、隐私保護和數據安全能力,并可選擇需要回流的數據,進行自動标注和模型更新。
不僅是智能座艙,這些能力同樣可以開放給智能駕駛。以智能駕駛能力的持續拓展為例:快速自主為智能汽車生產 AI 模型,存儲、提煉數據、進行仿真訓練,打通基于數據驅動的算法生產全流程,就能加速高階智能駕駛技術的迭代。
舉個例子,通過 AI 對學校路标圖片的識别和語義的理解,我們就能在智能駕駛功能中設定在學校處減速的邏輯。
也就是說在訓練的過程中,商湯以人機共智的生态來推動任務的進展,人和 AI 一起用人類的思維去推算邏輯,而 AI 甚至可以提供更高的效率,使得成本大大降低。
大模型的 " 諸神之戰 "
ChatGPT、百度文心一言、阿裡 " 通義千問 "、商湯 " 日日新 SenseNova"...AI 大模型賽道突然展露出 " 諸神之戰 " 的局勢,更難得的是,這項技術在普通人的生活圈也迸發出極高的熱度。
企業紛紛入局會導致未來出現大模型行業過度飽和的現象嗎?大模型之争只是三分鐘熱度口的產物嗎?大模型為什麼如此火爆,我們會成為這陣浪潮的韭菜嗎?
首先我們需要知道大模型的落地十分艱難,動辄成千上萬的算力、超千億萬億參數的模型開發,對技術水平和資金規模的要求都極高,比如 ChatGPT 就燒了 OpenAI40 億美元才被創造出來。
所以也許會有企業在這條賽道上半途棄賽,但是 " 賽道擠不下 " 倒是不太現實,畢竟 " 報名費 " 就挺高的。
第二個問題,大模型國内玩家的入局絕不只為 ChatGPT 的爆火,也不是臨時能誕生的產物。
事實上,供應商們早就有所布局,例如百度文心大模型開發于 2019 年,不過當時那套大模型更面向企業們服務。想必百度文心大模型為航天公司訓練出的系統,應該也不會進入大家的視野。
且相對于 ChatGPT 來說,國内的大模型開發稍晚幾年,能力也稍有遜色,如李彥宏所說,ChatGPT 的能力如果是 90 分,文心一言的能力就是 59 分。不過不得不承認的是,ChatGPT 确實推動了國内這些大模型的亮相。
最後一個問題,大模型行業的諸神之戰為什麼能吸引我們普通人的關注。對我來說,大模型的核心詞匯就是 "AI",意味着類人。
我們驚嘆于人工智能帶來的便捷,同時也恐懼于 " 類人 " 凌駕 " 人類 " 的可能性,這也是為什麼大模型爆火的原因,它展示出的空前進展甚至引發了萬人抵制 AI 研發的事件。
而對樂觀派來說,這大概無異于科技改變生活的信号。就拿智能車來說,大模型的上車,能帶來效率、成本、突破三個方面的進展,打通座艙和元宇宙的壁壘,使自動駕駛更具人類思維,它将帶來智能車新一輪的變革。