今天小編分享的科技經驗:DeepSeek倒逼,大模型資源再分配,歡迎閱讀。
模型的技術能力就是產品力,由于算力消耗預期的下降,将徹底倒逼基礎大模型公司在模型技術上創新。
編者按:DeepSeek 的爆火不僅掀起技術狂歡,更将中國大模型創業圈推入價值重估的十字路口。當行業開始追問 " 為什麼大模型六小虎沒有成為 DeepSeek" 時,更深層的行業洗牌暗流已然湧動。
近日,月之暗面被爆大幅收縮產品投放預算的消息,再次引發市場關注,"AI ‘六小虎’何去何從 " 的話題也被深思。
最新消息顯示,另一 AI 大模型獨角獸 MiniMax(稀宇科技)合夥人、公司副總裁、開放平台負責人魏偉,已經于近期離職。
一位 AI 產業鏈人士對創投日報記者表示,DeepSeek 的橫空出世,讓基礎大模型賽道的競争變得更加白熱化。原本包括百度、阿裡、字節、三大運營商,以及 AI" 六小虎 " 等在内的企業積極布局,但随着 DeepSeek 的出現,市場的天平開始傾斜。
其判斷:" 未來基礎大模型賽道将進一步整合,最終可能只剩下不到‘ 10 家基礎大模型’公司。"
在該位產業鏈人士看來," 模型的技術能力就是產品力 "。以前,許多基礎大模型公司都存在資源分配不合理的現象。" 一家融資規模達 10 億元的基礎大模型公司,其中 6-7 億元都可能投在算力上,而用于語料的資金僅有 1-2 億元,最後剩下的資金才用于公司運營。"
" 但 DeepSeek 打破了這種傳統的資源分配模式,由于算力消耗預期的下降,将徹底倒逼基礎大模型公司在模型技術上創新。" 該產業鏈人士繼續說道,這也再次證明了 " 產品力是模型的技術能力 " 的核心邏輯,不是投流,也不是算力的堆砌。
01
創投日報記者注意到,過去一年,B 站上曾出現過一波基礎大模型的 " 投流潮 ",多個 UP 主均表示接到過來自 Kimi、智譜、MiniMax 等在内大模型玩家的投流。此外,字節的豆包也加入營銷大戰,在抖音、B 站上投流。
一份數據顯示,去年 10 月,Kimi 的廣告投放金額達到 2.2 億元。彼時,Kimi 還曾因 "20 天燒錢 1 個億 " 登上熱搜。對此,上述 AI 產業鏈人士表示," 只能說,企業和投資人再一次被市場教育。"
另一位算法工程師則對創投日報記者表示,盡管 DeepSeek 強大,但技術還沒有在多模态上走通,僅僅是基于大語言模型,因此 " 差異化 " 一定是未來大模型要走的路。
在這一點上,創投日報記者注意到,大模型 " 六小虎 " 中的智譜、百川智能堅持走 TO B 路線,MiniMax 和階躍星辰雖然定位 C 端,但除了大語言模型,還有視頻生成和視覺多模态等技術應用。
比如,近日階躍星辰發布了兩款多模态大模型 Step-Video-T2V 視頻生成模型和 Step-Audio 語音模型;MiniMax 也有視覺多模态大模型 MiniMax-VL-01 等,這與 DeepSeek 目前聚焦的深度思考和邏輯推導,形成差異。
月之暗面方面,其在定位 C 端之餘,旗下產品 Kimi 也涉及多模态,但與 DeepSeek 一樣都關注長上下文處理,且都是開源代碼,以及免費的試用策略。" 其中,Kimi 是開放免費長文本處理,DeepSeek 是提供 API 免費額度,以此降低使用門檻,促進社交傳播裂變。" 上述一位算法工程師表示。
這意味着在很大程度上,Kimi 面臨的來自 DeepSeek 的直接競争強度更大。由此,月之暗面表示,公司近期受到 " 外部因素和内部戰略調整影響 "。
02
截至目前,創投日報記者注意到,除了零一萬物放棄訓練超大模型外,智譜、百川智能、MiniMax 和階躍星辰等似乎都沒有戰略上的調整,而是聚焦在戰術上的調整,比如選擇開源。
近日,階躍星辰與吉利汽車集團聯合宣布,将雙方合作的階躍兩款 Step 系列多模态大模型向全球開發者開源。
1 月 15 日,MiniMax 發布的新一代 01 系列模型同樣采用開源模式,并且 MiniMax 方面表示,未來也會繼續開源。
" 小虎 " 之外,昆侖萬維近日表示,開源國内首個面向 AI 短劇創作的視頻生成模型 SkyReels-V1。
更早前,字節發布的視頻生成實驗模型 VideoWorld,也選擇了開源。
接受創投日報記者采訪的多位業内人士認為,今年是 AI 應用大爆發的一年,大模型們在各個細分領網域找到各自的生态位才是最關鍵所在,而金融、醫療、零售、制造等領網域都有非常多的應用機會。" 此外,DeepSeek 的強化學習、算力調配,也是大模型公司們值得學習的地方。"