今天小編分享的汽車經驗:雷軍向AI大模型發起猛攻,歡迎閱讀。
作者 | 周智宇
小米在大模型上正發起一輪迅猛的攻勢。
華爾街見聞了解到,大模型上非常低調的小米,在過去幾個月裡持續提升算力儲備,也有了更高的算力資源投入規劃,為自家大模型研發提供更充分的算力供給。
在算力資源上進一步提升資本開支,是小米創始人雷軍向 AI 大模型發起一輪猛攻的側寫。此前,小米在内部組織能力建設、外部人才引入上,已有了諸多動作。
今年 11 月中旬,小米基礎技術平台部成立 AI 平台部,曾被雷軍公開稱贊是 " 小米的大神 " 的張铎,擔任 AI 平台部負責人。
随後,DeepSeek-V2 的關鍵開發者之一羅福莉也傳将入職小米,或入職小米 AI 實驗室。羅福莉在自然語言處理(NLP)領網域享有盛名,尤其是其參與的 DeepSeek-V2,因大模型使用成本遠低于行業均值,引發行業關注。羅福莉的加入也将助力小米在大模型領網域研發加速。
從種種迹象看,在雷軍的領導下,小米正在加速推進大模型的研發進展。不過小米在大模型上,過去一段時間裡頗為低調。
去年年度演講中,雷軍就表示小米會全面擁抱 AI 大模型。小米 AI 實驗室也在 2023 年 4 月設立了專門的大模型團隊。
接近小米的人士表示,小米對需要大規模燒錢的預訓練态度謹慎,而輕量級模型在某些特定任務上,比千億級大模型也具備一定優勢。這也使得小米在大模型上的側重點在于 " 輕量化 " 和 " 本地部署 "。
小米的大模型參數規模在百億,作為對比,vivo 在 11 月初推出的藍心大模型已經有了千億級參數量級的模型。
小米相關人士認為,小米與其他公司不一樣的點,在于注重產品落地。這使得大模型會跟着產品出來。
小米集團總裁盧偉冰也曾表示,目前發布的号稱 AI 手機的都是 AI Feature (特征)手機,也就是用 AI 的技術做了一些 AI 功能,而真正的 AI 手機是搭載基于 AI 大模型重構的作業系統。
這種思路使得外界對小米的大模型認知度并不高。
在今年底多家手機廠商的發布會中,大模型對自家產品智能化的賦能,都成為發布會宣傳的重點。小米則在今年旗艦手機小米 15 的發布會中,将小米澎湃 OS 2.0 作為突出重點,但對于大模型沒有更詳細的介紹。
不過小米自研大模型進展不小。今年 5 月,小米的大語言模型 MiLM 已成功通過大模型備案。
今年 11 月,小米第二代模型 MiLM2 系列發布,擁有 0.3B 到 30B 多個參數規模,以适配雲邊端各側場景的需求。
從模型規模上看,MiLM2 系列也延續的是輕量化思路,參數規模依舊在百億。MiLM2-30B 模型專為雲端場景設計,在指令遵循、常識推理和閱讀理解等方面,超越了主流競品大模型。
此外,截至 11 月中旬,小米智駕總算力達到了 8.1E FLOPS,在目前整車廠中處于第一梯隊。且累計數據積累達到了 300 萬 Clips,與同期理想處于一個梯隊。按照小米方面預期,其年底會完成 1000 萬 Clips 數據積累。
當然,這距離特斯拉 100E FLOPS 的算力還有不小差距。在新能源汽車智能化下半場裡,小米要繼續 " 守正出奇 ",也需要在智能化上加速。由此,小米在算力資源上進一步增加投入,并不意外。
相比其他科技大廠,小米擁有廣袤的終端生态,涵蓋手機、汽車和 IoT 等。這在 AI 大模型經歷百模大戰,進入尋找 AI 應用落地的階段裡,會是個優勢。但這也需要小米在 AI 大模型領網域有更加突出的表現。
随着小米加碼 AI 大模型領網域,這場 AI 應用之争也漸入高潮。