今天小編分享的汽車經驗:階躍星辰×吉利汽車:聯合開源兩款多模态大模型,歡迎閱讀。
2 月 18 日,階躍星辰和吉利汽車集團聯合宣布:将雙方合作研發的兩款階躍 Step 系列多模态大模型向全球開發者開源。其中,包含目前全球範圍内參數量最大、性能最好的開源視頻生成模型階躍 Step-Video-T2V,以及行業内首款產品級開源語音互動大模型階躍 Step-Audio。兩款階躍 Step 系列多模态大模型的開源,為開源世界帶來了行業最強的多模态大模型能力,将顯著促進大模型技術的共享與創新,推動人工智能的普惠發展,為全球數字經濟發展貢獻吉利方案與中國力量。
階躍星辰是吉利汽車集團的科技生态戰略合作夥伴,擁有國際頂尖的算法團隊。2023 年開始,吉利便與階躍星辰在預訓練大模型、垂直領網域大模型、應用場景設計、工程開發等方面展開了深度合作。其中,吉利牽頭了場景設計、模型測評、工程開發等業務,階躍星辰主導了模型預訓練等業務,雙方優勢互補,顯著增強了兩款階躍 Step 系列多模态大模型的性能表現。
階躍 Step-Video-T2V 大模型參數量達到 300 億,可以直接生成 204 幀、540P 分辨率的高質量視頻,是當前全球範圍内參數量最大、性能最好的開源視頻生成大模型。階躍 Step-Audio 大模型能夠根據不同的場景需求,生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地高質量對話,是行業内首個產品級的開源語音互動模型。
作為中國汽車全球領跑者,吉利致力于成為智能汽車 AI 科技的引領者和普及者。早在 2021 年,吉利就圍繞芯片、軟體作業系統、數據和衛星網搭建了端到端的自研體系和生态聯盟,構建了完善的 " 智能吉利科技生态網 ",驅動用戶在智能駕駛、智能座艙上的體驗不斷進化。2022 年,吉利建成了全球車企首個 " 雲、數、智 " 一體化的星睿智算中心。2023 年,吉利發布了全球首個汽車行業全棧自研全場景 AI 大模型——星睿 AI 大模型,并獲得了中國通信院 "4+ 級 " 行業最高評級。2025 年,吉利發布了行業首個 " 智能汽車全網域 AI" 技術體系。
在全球最強開源的階躍 Step 系列視頻生成大模型、語音互動大模型,以及汽車行業全場景大模型的綜合賦能下,吉利将在行車安全、緊急避險、智慧泊車等全場景為用戶帶來自動駕駛程度更高、更安全的高階智駕體驗,同時打造更加智能的汽車情感座艙,重新定義人車互動體驗,推動 AI 科技在智能汽車領網域的普及應用。
吉利星睿 AI 大模型中的 AI Drive 大模型,具備強大場景生成與規劃能力,能夠根據雨雪等不同天氣光照條件、道路結構、擁堵路況、立體車庫和不常見的交通目标,構建出真實駕駛中難得一遇的極端駕駛場景。基于真實的駕駛視頻數據去優化階躍 Step-Video-T2V,可以将它變成一個自動駕駛數據合成器。星睿 AI 大模型正在探索将這些豐富的合成場景轉換成 " 以假亂真 " 的訓練數據,相當于自動駕駛系統打造了一個豐富的 " 虛拟駕考考場 ",從而顯著提升車輛在智駕行駛時面對各種路況的應變能力,保障行車安全。
在階躍 Step-Audio 大模型超強互動功能賦能下,吉利星睿 AI 大模型可以大幅提升語音指令響應速度,以及互動過程的情感理解與表達能力。當用戶說 " 導航,快遲到了 " 的時候,系統不僅會自動規劃更快路線,還會主動詢問是否需要播放輕音樂緩解情緒。同時,系統不僅可識别粵語、四川話等豐富的方言,還支持個性化聲音定制,用戶既可以選擇系統提供的人聲音色,也能錄制孩子的笑聲制作專屬提示音,甚至讓車載 AI 模仿山澗流水聲營造車内冥想空間,溫情陪伴每一次出行。
除此之外,吉利也是首家與 DeepSeek 完成深度融合的車企。通過攜手 DeepSeek-R1 模型,吉利将對星睿車控 FunctionCall 大模型、汽車主動互動端側大模型等進行蒸餾訓練。屆時,吉利智能汽車 AI 不僅能對用戶的模糊意圖實現精準理解,進而準确調用約 2000 個車載接口,還能基于車内外場景主動分析用戶潛在需求,并為用戶主動提供車輛控制、主動對話、售後等服務,智能互動體驗将大幅提升,加速 AI 在智能汽車領網域普及。
目前,基于 " 智能汽車全網域 AI" 技術體系打造的 AI 銀河精靈、Flyme Auto 智能座艙、無界空間、AI 雲動力、AI 繪本、AI 哨兵等一系列 AI 應用,已在銀河 E8、銀河 E5、銀河星艦 7EM-i 等車型上搭載。今年 3 月初,吉利還将對外發布重磅 AI 智能化戰略,加速推動 AI 數字底盤、高階智能駕駛等最新 AI 技術的逐步上車,為用戶帶來颠覆性的智能化體驗。