今天小編分享的科技經驗:DeepSeek 發布 V3 模型更新:除了編程能力大幅提升,還有更寬松的開源協定,歡迎閱讀。
和上周不少朋友期待的一樣,新一周第一天的北京時間 3 月 24 日晚,DeepSeek 果然「突然」發布了模型更新。
但暫時還不是 DeepSeek V4 或 R2,而是 DeepSeek V3 模型的一次更新。目前,其開源版本目前已經上架開源網站。其開源版本模型體積為 6850 億參數。
深度求索微信官方公眾号也确認,本次更新屬于小版本更新,目前已經在官方網頁、App 小程式等入口開放。
初代 V3 模型最為人所熟知的,可能還是「557.6 萬美金比肩 Claude 3.5 效果」的超級性價比。而更新後的模型由其新的 32KGPU 集群上改進的後訓練提供支持。
截至目前,還沒有任何關于新版 DeepSeek V3 的能力基準測試榜單出現,但有了 DeepSeek V3 發布即成為 Chatbot Arena 榜單前十中唯一一個開源模型的刷榜歷史,還是在發布一小時後迅速吸引來全球用戶對其測試體驗。
根據目前最新的用戶上手測試,新版 V3 模型前端編碼能力的提升,是目前「感知最強」的部分。根據專業用戶對新版 V3 的綜合體驗判斷,V3-0324 的提升幅度大約相當于 Sonnet 3.5 到 Sonnet 3.6 的提升。
用戶按照下面的提示詞,同時對新版 V3 與 R1 下達任務,實際產出的效果已經出現巨大差異。
創建一個包含 CSS 和 JavaScript 的單個 HTML 檔案,以生成一個動畫天氣卡片。卡片應通過不同的動畫直觀地表示以下天氣條件:風:(例如,移動的雲朵、搖曳的樹木或風線)雨:(例如,落下的雨滴、形成的水坑)晴:(例如,閃耀的光線、明亮的背景)雪:(例如,落下的雪花、積雪)并排顯示所有天氣卡片。卡片應具有深色背景。在此單個檔案中提供所有 HTML、CSS 和 JavaScript 代碼。JavaScript 應包含一種在不同天氣條件之間切換的方法(例如,一個函數或一組按鈕),以演示每種天氣的動畫。
左側是 DeepSeek 新版 V3 模型的生成結果,右側為 R1 的生成結果。
除了對比 R1 ,用戶還用類似的提示詞,對比了 Claude 系列。Claude 3.7 作為目前号稱「編程能力最強模型」,實際編程能力使用體驗也是多次被評為「已經達到專家級程式員水準」。
同一提示詞給到 Claude 3.5/3.7 後,模型生成的前端内容如下所示:
除了這個測試案例,根據更多用戶對之前 prompt 測試的結果,普遍結論是當前新版 V3 在編碼能力已經接近 claude3.7 ,同時也是目前第一時間上手中,大家覺得比之前的 v3 能力提升最大的部分。
針對前端網站搭建測試,新版 V3 所生成的網站(上)在與 Claude 3.7 Sonnet 生成的結果(下)中,也快速「拉齊」了網站的構建效果
除了編程能力,在其他用戶的測試中,新版 V3 在多輪對話中體現出了更強的上下文理解能力。
當然,與往常一樣,DeepSeek 也沒有同時公開表示 R2 或者 V4 模型會在何時發布,但不少用戶在體驗過新版 V3 後,都覺得似乎 R2 的到來,也已經不遠了。
還有一個普通用戶「感知不強」,但讓開源社區非常興奮的改變。新版 V3 的開源許可與 R1 一樣,也更新變成了 MIT 開源許可(MIT License),這意味着新版 V3 有着比初代 V3 更寬松的開源使用條件。
并且 MIT 開源許可一向以商業友好而著稱,使用 MIT 許可的項目可以與商業和專有軟體集成,這或許對于希望在商業項目中使用新版 V3 模型的開發者來講,是本次更新最重要的改變了。