今天小編分享的社會經驗:大模型“周一見”或成常态!深度求索發布V3模型更新,歡迎閱讀。
繼騰訊元寶 35 天更新 30 次後,今年 3 月堪稱見證了大模型領網域技術更迭的 " 忙碌月 "。其中,大模型 " 周一見 " 正成常态。
3 月 24 日周一晚,一如此前技術發燒友預期,深度求索 DeepSeek 再 " 突然 " 發布了模型更新。不過這次更新的并不是外界高度關注的新大模型深度求索 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的更新版。
目前,該開源版本已經上架開源網站,開源版本模型體積為 6850 億參數。當晚,深度求索微信官方公眾号小助手也确認,本次更新屬于小版本更新,目前已經在官方網頁、App 小程式等入口開放。
新版 V3 究竟有哪些更新?
在周一深夜,發布一小時後迅速吸引來全球用戶對其測試體驗。
要知道初代 V3 模型是在 2024 年 12 月發布,最出圈的曾以 "557.6 萬美元比肩 Claude 3.5 效果 " 的高性價比著稱。而更新後的模型由其新的 32KGPU 集群上改進的後訓練提供支持。但截至目前,還沒有任何關于新版 V3 的能力基準測試榜單出現。
不過,網友對新版 V3 的上手測試顯示,在編程能力新版 V3 模型編碼能力大幅提升。在提示詞測試上,不僅新版 V3 超過自身 R1,甚至與目前号稱 " 編程能力最強模型 " 的 Claude 3.7 相比,新版 V3 在編碼能力已在接近。這意味着深度求索 V3 編程水平更向 " 專業程式員水平 " 靠攏。
除編程能力,在其他用戶的測試中,新版 V3 在多輪對話中體現出了更強的上下文理解能力。
在 " 周一見 " 迎來了新版 V3,備受關注的 DeepSeek R2 或者 V4 模型會在何時發布,目前仍無詳細時間。讓我們拭目以待,下一個 " 周一見 "。
文|記者 王丹陽
圖|深度求索官方微信公眾号