今天小編分享的互聯網經驗:大模型開源潮:DeepSeek領銜,六小虎、大廠齊發力,格局重構進行時,歡迎閱讀。
圖片來自視覺中國
藍鲸新聞 2 月 26 日訊(記者 武靜靜)DeepSeek 連續五天的開源動作還在持續,不僅将全球開源的讨論推到了新的高點,也帶來了更多閉源和開源的争議和疑問。
甚至 OpenAI 近日也公布了開源計劃,OpenAI CEO Sam Altman 在社交平台 X 上就公司下一個開源項目是o3-mini 級模型還是手機端側模型征詢公眾意見,讓用戶投票二選一。此前,在 2 月 6 日,OpenAI 也罕見地公開了最新模型 o3-mini 系列模型的思維鏈。
接下來,六小虎和大廠如何應對?閉源大模型商業模式如何面對市場新拷問?
六小虎陸續開源,大廠加速布局
被動或主動,從 1 月中旬以來,六小虎就陸續用實際的開源行動來應對這波開源潮。
1 月 15 日,MiniMax 發布并首次開源了其最新一代基礎大模型 MiniMax-01 系列模型,包含基礎語言大模型 MiniMax-Text-01 和視覺多模态大模型 MiniMax-VL-01,公開了技術報告,并開源了兩個模型的完整權重。
在 2025 GDC 全球開發者先鋒大會上,MiniMax 副總裁劉華分享稱,開源是推動行業發展的關鍵,此次開源,是希望更多開發者可以參與底層生态建設,加速非 Transformer 架構的創新。" 線性注意力探索方面,我們也只是起步,所以我們對所有的技術創新進行了全面的開源,希望有更多的開發者一起探索非 transformer 的底層架構,"
2 月 18 日,階躍星辰和吉利汽車集團聯合宣布,将雙方合作的階躍兩款 Step 系列多模态大模型向全球開發者開源—— Step-Video-T2V 視頻生成模型和 Step-Audio 語音模型。
階躍星辰副總裁李璟稱," 開源模型能夠為模型公司帶來更多的支持者和技術社區的反饋,從而促進模型的迭代和優化。"
李璟透露,接下來,階躍星辰會繼續開展更多開源計劃,在行業方面更加聚焦,之後也将也即将在三月份開源圖生視頻大模型。
之後,在 2 月 23 日凌晨,Kimi 宣布開源其最新技術報告和大模型 Moonlight。
頭部的基礎大模型創業公司之外,另一個備受關注的是大廠。
其中,阿裡對于開源的态度一直是支持,自 2023 年 8 月起,阿裡雲相繼開源 Qwen、Qwen1.5、Qwen2、Qwen2.5 等 4 代模型,囊括了 0.5B、1.5B、3B、7B、14B、32B、72B、110B 等全尺寸,大語言、多模态、數學和代碼等全模态。數據顯示,目前阿裡千問(Qwen)衍生模型數量已超過 10 萬個。
阿裡最新一次開源發生在 2 月 25 日晚間,阿裡雲旗下視覺生成基座模型萬相 2.1(Wan)也宣布開源,其中 14B 和 1.3B 兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務。
出乎意料的是,在 2 月 14 日,百度宣布将在未來幾個月中陸續推出文心大模型 4.5 系列,并于 6 月 30 日起正式開源。從宣布開源計劃到最終開源,百度計劃用四個月來實現,足以看出此次開源是計劃之外,也需要重新投入人力和資源才能達成。
目前字節在大模型領網域的開源主要在訓練框架方面,尚未公布更多基礎大模型的開源動作。
當下閉源份額高于開源,未來一兩年内會發生颠覆性變化
随着各家都在緊鑼密鼓地布局,更多讨論也随之而來,開源是否會衝擊現在閉源模型的商業模式,大模型生态将會發生什麼變化?
在 2025 全球開發者先鋒大會開幕式上,香港科技大學校董會主席、美國國家工程院外籍院士沈向洋、指出:"DeepSeek 的開源是開源社區的勝利。将了不起的模型開源出來,可以讓更多的人有機會在這些模型的基礎上做更多了不起的事情 "
沈向洋認為,目前市場上,閉源的份額可能略高于開源。但這種情況在未來一兩年内可能會發生很大的變化。" 開源和閉源并不是完全對立的,可以通過合理的商業模式實現兩者的平衡,未來需要找到一個平衡點,使得開源和閉源能夠更好地共存和發展。"
沈向洋并不認為開源就意味着就無法創造商業利益,他提到:" 可以通過提供軟體服務等形式實現商業模式的創新。例如,Red Hat 通過提供 Linux 相關的軟體服務,成為了市值數百億美元的公司。"
從技術和產品上來看,開源和閉源產品各有優劣勢。
Hugging Face 工程師王鐵震分享稱,相對于閉源模型,開源模型給予用戶所有的掌控權,包括給用戶微調模型的權利,還有在數據隐私方面有非常好的優勢,可以根據特定領網域的數據進行訓練,從而更好地适應和解決該領網域的問題。
但他也提到,閉源模型的優勢在于其產品化和易用性。" 閉源模型是一個產品,用戶只需調用 API 即可,無需自己部署和維護。相比之下,開源模型更像是一個工具,用戶需要自己搭建機房、申請伺服器、進行部署,并且需要一定的技術團隊來支持。"
開源和閉源的更多讨論還在持續,短期來看,DeepSeek 的開源勢必會縮窄各大模型能力差距,開源和閉源模型能力差異也越發不明顯,大模型的格局将會形成新的走向。
接下來,不論對大廠還是創業公司,如何打造產品能力,與產業深度融合,把壁壘建得更深厚,将成為大模型市場競争的關鍵。