今天小编分享的互联网经验:网友热评Deepseek新版V3:编程堪比最强AI,期待更强R2!,欢迎阅读。
闷声干大事!DeepSeek 悄然发布 V3 新版本。
没有发布会,没有媒体宣传,3 月 24 日晚间,DeepSeek 就这样 " 悄悄地 " 将其最新版 V3-0324 模型上传至 Hugging Face。
根据社区测试和分析,此次更新虽然不是全新一代模型,仅属于 " 小版本更新 ",但其编程能力已达到与 Claude 3.7 Sonnet 相当的水平,在某些测试场景中甚至表现更佳。
有网友表示,新版 V3 较上一代来说,相当于 Sonnet 3.6 之于 Sonnet 3.5 的飞跃。
还有网友指出,新版 V3 模型的编码能力完全超预期,堪称目前最强大的免费 AI 模型。
负载均衡策略:更高效的 Moe 架构
据介绍,DeepSeek V3-0324 不是推理模型,采用了具有 6710 亿参数的专家混合模型(MoE),激活参数 370 亿。
为解决传统 MoE 模型中的负载不均衡问题,DeepSeek 团队引入了创新性的 " 偏差项 " 机制,旨在帮助 V3 在训练过程中有效平衡专家负载,提升模型性能。
此外,V3 还采用了节点受限的路由机制,以减少跨节点通信开销,提高训练效率,这对于大规模分布式训练至关重要。
这些技术创新使得新版 V3 在推理速度上实现了显著提升,使 V3 能在保持高效计算的同时,扩展到更多节点和专家。
编程能力再进化:一个提示词生成完整前端页面
根据国外开源评测平台 kcores-llm-arena 的最新测试数据,V3-0324 的代码能力达到了 328.3 分,超过了普通版的 Claude 3.7 Sonnet(322.3 分),接近思维链版本的 334.8 分。
这一成绩意味着,新版 V3 已成为目前编程能力最强的开源模型之一。
实际测试中,用户用一个简单的提示词就让 V3-0324 生成了整个登录页面。
还有用户直观地指出,只是点了两次 "continue",看看生成的代码量有多恐怖!
再加上不限时、完全免费的 " 杀手锏 ",可以说在前端开发层面,新版 V3 已经打败了 OpenAI 的 o1-pro 和 GPT-4.5。
新版 V3 的审美也很在线,用户用同样的 prompt 生成的网页画面,新版 V3 的设计明显比上一版要好看得多。
根据 prompt:" 写一个精美的落地页,内容是 deepseek v3 发布 ",这是上一版 V3 生成的网页:
新版 V3 的落地页则是这样:
开源協定更新:商业应用门槛大幅降低
不仅技术能力提升,DeepSeek 还将 V3-0324 的开源许可与 R1 一样更新为 MIT 开源许可,这意味着新版 V3 有着比初代 V3 更宽松的开源使用条件。
公开资料显示,MIT 许可以商业友好著称,使用该许可的项目可以与商业和专有軟體自由集成。
这一变化对希望在商业项目中应用高性能 AI 模型的开发者和公司来说,可能是本次更新最具战略意义的改变。它进一步降低了 AI 技术的使用门槛,加速了技术普惠进程。
开源浪潮涌动,商业模型 " 瑟瑟发抖 "
DeepSeek V3-0324 的出现表明,开源 AI 模型正在以惊人的速度追赶甚至在某些方面超越顶级闭源商业模型。这种趋势正在给 OpenAI、Anthropic 等商业 AI 公司带来前所未有的压力。
正如海外用户所评论的:" 很高兴看到这些开源模型继续给大公司施压,促使它们以更低的成本构建更好的模型。"
随着 DeepSeek 这样的开源模型不断提升性能并放宽使用条件,AI 技术的民主化和普惠化进程正在加速,一个更加开放、创新的 AI 生态系统正在形成。
网友不禁感叹:DeepSeek 简直让科技普惠成为现实!
还有网友大胆猜测:新版 V3 来了,R2 还会远吗?