今天小編分享的互聯網經驗:網友熱評Deepseek新版V3:編程堪比最強AI,期待更強R2!,歡迎閲讀。
悶聲幹大事!DeepSeek 悄然發布 V3 新版本。
沒有發布會,沒有媒體宣傳,3 月 24 日晚間,DeepSeek 就這樣 " 悄悄地 " 将其最新版 V3-0324 模型上傳至 Hugging Face。
根據社區測試和分析,此次更新雖然不是全新一代模型,僅屬于 " 小版本更新 ",但其編程能力已達到與 Claude 3.7 Sonnet 相當的水平,在某些測試場景中甚至表現更佳。
有網友表示,新版 V3 較上一代來説,相當于 Sonnet 3.6 之于 Sonnet 3.5 的飛躍。
還有網友指出,新版 V3 模型的編碼能力完全超預期,堪稱目前最強大的免費 AI 模型。
負載均衡策略:更高效的 Moe 架構
據介紹,DeepSeek V3-0324 不是推理模型,采用了具有 6710 億參數的專家混合模型(MoE),激活參數 370 億。
為解決傳統 MoE 模型中的負載不均衡問題,DeepSeek 團隊引入了創新性的 " 偏差項 " 機制,旨在幫助 V3 在訓練過程中有效平衡專家負載,提升模型性能。
此外,V3 還采用了節點受限的路由機制,以減少跨節點通信開銷,提高訓練效率,這對于大規模分布式訓練至關重要。
這些技術創新使得新版 V3 在推理速度上實現了顯著提升,使 V3 能在保持高效計算的同時,擴展到更多節點和專家。
編程能力再進化:一個提示詞生成完整前端頁面
根據國外開源評測平台 kcores-llm-arena 的最新測試數據,V3-0324 的代碼能力達到了 328.3 分,超過了普通版的 Claude 3.7 Sonnet(322.3 分),接近思維鏈版本的 334.8 分。
這一成績意味着,新版 V3 已成為目前編程能力最強的開源模型之一。
實際測試中,用户用一個簡單的提示詞就讓 V3-0324 生成了整個登錄頁面。
還有用户直觀地指出,只是點了兩次 "continue",看看生成的代碼量有多恐怖!
再加上不限時、完全免費的 " 殺手锏 ",可以説在前端開發層面,新版 V3 已經打敗了 OpenAI 的 o1-pro 和 GPT-4.5。
新版 V3 的審美也很在線,用户用同樣的 prompt 生成的網頁畫面,新版 V3 的設計明顯比上一版要好看得多。
根據 prompt:" 寫一個精美的落地頁,内容是 deepseek v3 發布 ",這是上一版 V3 生成的網頁:
新版 V3 的落地頁則是這樣:
開源協定更新:商業應用門檻大幅降低
不僅技術能力提升,DeepSeek 還将 V3-0324 的開源許可與 R1 一樣更新為 MIT 開源許可,這意味着新版 V3 有着比初代 V3 更寬松的開源使用條件。
公開資料顯示,MIT 許可以商業友好著稱,使用該許可的項目可以與商業和專有軟體自由集成。
這一變化對希望在商業項目中應用高性能 AI 模型的開發者和公司來説,可能是本次更新最具戰略意義的改變。它進一步降低了 AI 技術的使用門檻,加速了技術普惠進程。
開源浪潮湧動,商業模型 " 瑟瑟發抖 "
DeepSeek V3-0324 的出現表明,開源 AI 模型正在以驚人的速度追趕甚至在某些方面超越頂級閉源商業模型。這種趨勢正在給 OpenAI、Anthropic 等商業 AI 公司帶來前所未有的壓力。
正如海外用户所評論的:" 很高興看到這些開源模型繼續給大公司施壓,促使它們以更低的成本構建更好的模型。"
随着 DeepSeek 這樣的開源模型不斷提升性能并放寬使用條件,AI 技術的民主化和普惠化進程正在加速,一個更加開放、創新的 AI 生态系統正在形成。
網友不禁感嘆:DeepSeek 簡直讓科技普惠成為現實!
還有網友大膽猜測:新版 V3 來了,R2 還會遠嗎?