今天小编分享的科技经验:数据揭露DeepSeek崛起的秘诀,欢迎阅读。
出品|虎嗅科技组
作者|余杨
编辑|苗正卿
头图|视觉中国
DeepSeek-R1 的推出促使全球资本重新评估中国科技公司的价值。2 月 11 日消息,梁文峰因 DeepSeek 的成功而财富激增,身价或将超过英伟达 CEO 黄仁勋,问鼎亚洲新科技首富。彭 * 博社调查显示,DeepSeek 估值在 10 亿至 1500 亿美元之间,梁文峰持有 84% 股份,投行看好 DeepSeek,认为其估值可达 OpenAI 一半,即 1500 亿美元,梁文峰股份价值或达 1260 亿美元,超过英伟达 CEO 黄仁勋的 1180 亿美元。
自去年 12 月底到今年 1 月底,一个月的时间,DeepSeek 全球用户数从 34.7 万激增至 1.19 亿。Xsignal(奇异因子)的创始人刘震博士认为,"DeepSeek 现象和去年豆包等 AI 应用的火爆有着根本的不同。"
根据 Xsignal 提供的最新 DAU(日活跃用户)数据,截止 2 月 8 日,DeepSeek 国内 APP 端日均活跃用户数达到 3494 万;海外 APP 端 DAU 达到 3685 万,全球 Web 端日活更是直击 4800 万。全球日活用户总量达到 1.19 亿。
2025/01/10-2025/02/08,DeepSeek 日均活跃用户数(部門:万),数据来源:Xsignal(奇异因子)
这组数据意味着什么呢?
从全球 AI 应用赛道来看,达到这一用户规模,ChatGPT 用了两年时间,DeepSeek 仅用了一年多时间便实现了。
而在国内,DeepSeek 直接刷新了豆包、Kimi 和文心一言等国内大模型的用户量榜单,2025 年 1 月,DeepSeek 月均活跃用户数跃居第一。
DeepSeek 仿佛一夜之间站上了风口。但从其自身成长动态的周期数据来看,这 " 泼天富贵 " 并不是 " 突然 " 到来的。以时间为轴,通过 DeepSeek 内部模型迭代过程和外部用户增长数据的对比,我们或许更能透视出 DeepSeek" 蜕变 " 的关键时间节点。
DeepSeek 崛起的四个关键时刻
DeepSeek 自 2024 年以来,以惊人的速度不断迭代更新,其发展历程如下:
数据来源:Xsignal(奇异因子)
2024 年 1 月 5 日:DeepSeek LLM 首次亮相,这是 DeepSeek 在大型语言模型领網域的初步探索。
2024 年 2 月 5 日:DeepSeek-Math 版本上线,专注于数学问题的解决能力。
2024 年 3 月 11 日:DeepSeek-VL 发布,引入了视觉语言融合技术,拓展了模型的应用场景。
2024 年 5 月 7 日:DeepSeek-V2 版本发布,优化了语言生成的流畅度和准确性。
2024 年 6 月 17 日:DeepSeek-Coder-DeepSeek-VL2 推出,进一步强化了代码生成和多模态互動能力。
2024 年 10 月 17 日:DeepSeek-Janus 版本推出,引入了多语言和跨领網域的能力。
2024 年 12 月 13 日:DeepSeek-VL2 更新,提升了视觉理解与生成的性能。
2024 年 12 月 26 日:DeepSeek-V3 版本发布,进一步提升了模型的综合性能。
2025 年 1 月 20 日:DeepSeek-R1 发布,凭借其强大的性能和创新的功能,迅速登顶美区 App Store 免费榜。
2025 年 1 月 27 日:DeepSeek-Janus-Pro 版本上线,为专业用户提供了更强大的功能支持。
结合以下的 DeepSeek 用户增长数据,刘震分析认为:" 它的‘爆火’并非毫无预兆,这里有几个关键时间节点:2024 年的 4 月、10 月、12 月,以及 2025 年 1 月 20 日。"
DeepSeek 日均活跃用户数总量趋势,数据来源:Xsignal(奇异因子)
从去年 4 月份开始,DeepSeek 即迎来了一波迅速增长,Web 端 DAU 数据不断攀升。下面这组 DeepSeek 全媒介月度声量的变化和活跃用户数趋势一致。
DeepSeek 全媒介月度声量总量趋势,数据来源:Xsignal(奇异因子)
放大看,到了 1 月 20 日,随着 DeepSeek-R1 的发布,全媒介每日声量趋势呈现出质的变化,从 1 月 26 日开始极速增长,并持续至 2 月 10 日,单日媒介声量超 20 万。
DeepSeek 全媒介月度声量总量趋势,数据来源:Xsignal(奇异因子)
根据以上数据,我们大致可以作出以下判断:1 月 20 日 DeepSeek-R1 的发布彻底引爆了 DeepSeek。那么,R1 模型到底有什么魔力?DeepSeek 爆火的背后逻辑又是什么?
DeepSeek 的成功,这里有几个关键词:中国,高水平,低成本,新路径,开源。
首先,DeepSeek 在技术层面过硬。在 Artificial Analysis 给出的人工分析质量指标数据中,R1 模型达到了可以媲美 ChatGPT-o1 推理模型的水平。这一点,我们从 2 月 8 日 OpenAl 不得不作出应对而发布 o3-mini 也可以看出。
人工分析质量指标(包括 MMLU、GPOA Diamond、MATH-500 和 HumanEval ) ,数据来源:Artificial Analysis
其次,从研发来讲,DeepSeek 采用了巧妙的技术路径,通过优化模型架构和训练方法,大幅降低了训练和推理成本。例如,其 MoE(Mixture of Experts)架构通过动态路由技术,实现了高效的计算资源分配,推理成本仅为 GPT-4 Turbo 的 17%。这种低成本的新开发路径对国内大模型能力提升是一个很好的启示。不过,稍后我们也会谈到,这种跟随式的开发方法也为大模型的能力上限埋下了 " 隐忧 "。
DeepSeek-R1 以低成本打破 AI 市场:在不同的人工智能模型上处理一百万个 tokens 的预估价格,数据来源:Statista
这并不意味着 AI 大模型的入局 " 门槛 " 降低了。DeepSeek 并不是完全意义上的 " 低成本 ",模型诞生之初 DeepSeek 训练模型也消耗了相当的 GPU,幻方量化前期为此付出了相当的投资,换句话说,要先训练出一个模型来。
另外,在中美 AI 竞争的背景下,美国在 AI 领網域一直在舆论上 " 处于领先地位 ",中国发展自己的大模型,受到海外芯片、算力等硬體和技术上的多重限制。从拜登政府开始,美国就采取了限制高性能芯片等手段。并且,国外头部的大模型大多不开源。
Deepseek 在资源受限的开发环境里走出一条创新之路,在技术上对标国际头部水平,在应用场景和用户体验上也进行了创新,如此横空出世,让中美两国皆感震惊。在中国 Deepseek 激发了民族自豪情绪,在美国,Deepseek 让硅谷震惊于东方大国的 AI 实力。结果是,Deepseek 在两个国家成为共同的热点话题。
与此同时,DeepSeek 的开源战略也是其成功的重要因素之一。
我们知道,ChatGPT-o1 是收费的,但 DeepSeek 对同等高水平模型的开源,极大地吸引了普通的用户,有利于大模型端侧应用的普及和生态的发展。同时,其闭源版本为企业客户提供了定制化服务,满足了不同用户的需求。这种双轨战略不仅推动了行业生态的多元化,还打破了闭源模型的垄断局面,迫使 OpenAl、谷歌 Deepmind 全系列在内的大模型推出低收费版本模型,极大地推动了 AI 的普及、普惠和平权。
DeepSeek 和豆包们:本土两种不同的崛起之路
实际上,这并不是本土 AI 大模型的第一次 " 火爆 "。2024 年,DeepSeek 还未崭露头角,豆包和 Kimi 等国内大模型驱动的 AI 应用也刷爆过多个网络平台,但刘震表示,DeepSeek 的火爆的内在逻辑与豆包等 AI 产品显然不同。
以豆包为例,DeepSeek 的火爆和豆包的火爆,首先是企业推动和国家推动的区别。
我们通过一组 DeepSeek 和豆包的全媒介声量对比数据具体看看。
DeepSeek 与豆包全媒介声量对比数据,数据来源:Xsignal(奇异因子)
第一部分显示的是全媒介的总声量,豆包是 DeepSeek 的 8 倍;但在第二部分的总互动量中,DeepSeek 是豆包的 7 倍,远远超出了豆包,在平均互动量中也是如此。
可以看出,DeepSeek 获得了大量的媒介互动,是过去 4 个月里最火热的话题。
再结合以下全媒介新闻、社媒、短视频的分布数据,可以清晰地看到,豆包的流量九成来自短视频,其爆火有着字节跳动天然良好生态的加持;而 DeepSeek 的媒介声量中,新闻、社媒和短视频占比分布均匀。
DeepSeek 与豆包全媒介新闻、社媒、短视频的分布对比数据,数据来源:Xsignal(奇异因子)
也就是说,从全媒介数据来看,新闻端和社媒端对 DeepSeek 的传播起到了巨大的推动作用,而豆包更多是在自己的流量生态 ( 短视频 ) 中传播。
另外,回顾 DeepSeek 的 DAU 数据,DeepSeek 国内 APP 端达到 3494 万,而海外 APP 端达到 3685 万,全球 Web 端达到 4800 万, DeepSeek 的用户量,海外市场几乎贡献了一大半。而豆包,我们知道,主要面向的是国内用户。这也显示出DeepSeek 和豆包市场定位的差异。
DeepSeek 的爆火有着显性和隐性的多重原因,高水平、低成本、开源免费等因素组合在一起原本就具有天然的流量爆点,全球 AI 竞争态势下的国家竞争更是将其推向了 " 时代风口 "。
此次 DeepSeek" 震撼 " 登场后,不少网友很好奇,国内的大模型排名数据发生了哪些变化?DeepSeek 的成功是可以 " 复制 " 的吗?
在 DeepSeek 火爆前,国内大模型的 DAU 排名格局相对稳定。排在前三的是豆包,Kimi 和文心一言。以下分别是 2024 年度 APP 端和 Web 端的 MAU(月度活跃用户)数据。
2024 年度中国 APP 端 TOP 50 AI 应用年度榜单,数据来源:Xsignal(奇异因子)
直到 1 月 20 号,DeepSeek 才发布 APP,因而没有 APP 端数据,只有以下的 Web 端数据。
2024 年度中国 Web 端 TOP 50 AI 应用年度榜单,数据来源:Xsignal(奇异因子)
但即便是在 Web 端,此时的 DeepSeek 也还无人问津,远远没有进入 TOP50 的榜单。
Xsignal 向虎嗅指出,V3 版本是 12 月 26 日上线,R1 版本是 1 月 20 号上线。1 月 20 号之前,DeepSeek R1 和 APP 都还没有发布,其在 Web 端 12 月的 DAU 数据只有 34.7 万。
DeepSeek Web 端 12 月 DAU 数据,数据来源:Xsignal(奇异因子)
接下来的故事大家都很熟悉了,DeepSeek 的出现打破了原有的平衡,半个月内国内大模型排名发生了显著变化:
2025/01/10-2025/02/08,AI 应用全端 DAU 数据,数据来源:Xsignal(奇异因子)
自 1 月 10 日至 2 月 8 日,根据 Xsignal 监控到的平均 DAU,DeepSeek 以近 1.2 亿的日活数几乎追平 ChatGPT,并一举超越豆包、Kimi 和文小言。位居第二的豆包,DAU 数据大约是 2500 万,差额也相当大。
这是一个用户数从 35 万到一亿的过程,堪称 " 奇迹发生 "。
DeepSeek 的 " 奇迹发生 ",也引起了外界的一些质疑和担忧。
DeepSeek 给行业哪些新启发
一方面关注它的能力到底如何。
刘震向虎嗅分析认为,DeepSeek 在开源领網域表现出色,其技术能力和应用场景都处于行业领先水平。" 然而,其技术模式也存在一些局限性。如何从 " 智能跟随 " 到 " 智能领先 ",是 DeepSeek 接下来需要攻克的难题。"
此外,DeepSeek 利用较低的成本训练高水平的模型,本身也存在一些特质。
精确度:为了降低训练时间和成本,DeepSeek 在一定程度上牺牲了精确度和推理时间。未来需要在精确度和推理效率之间找到更好的平衡。
稳定性:随着用户规模的扩大,DeepSeek 的稳定性面临挑战,社交媒体平台上也爆出了出错、宕机等问题,未来需要进一步优化模型架构以提高系统的稳定性。
维护成本和算力成本:大模型的维护成本和算力成本较高,DeepSeek 需要通过技术创新和资源优化来降低成本,并找到自身的商业模式。
安全伦理风险:回顾前文数据,我们了解到,DeepSeek 的海外用户量近于国内用户量的 2 倍,在国际背景下,面对文化差异、道德伦理多元的世界,如何避免 TikTok 的前车之鉴,找到适合自身的发展模式,在实现内部投入 / 产出闭环的同时,真正为 AI 的普惠平权作出贡献,也是 DeepSeek 亟需解决的问题。
另一方面,外界关注的,不单单是 DeepSeek,还有整个 AI 行业大模型未来的商业化路径在哪里。
DeepSeek 在全媒介的数据显示,其互动量逐渐下降,热度逐渐下降,媒介关注度的停留毕竟是有限的,归于常态后,DeepSeek 又该如何找到属于自己的商业模式?
DeepSeek 全媒介声量总互动量,数据来源:Xsignal(奇异因子)
DeepSeek 的出现极大地推动了 AI 的普及,使 C 端用户能够免费使用高质量的 AI 服务,打破了 " 开源模型 = 低质量低水平 " 的成见,突破了闭源模型的垄断局面,这种技术平权的理念不仅推动了 AI 技术的广泛应用,也为全球 AI 市场带来了新的机遇和挑战。
刘震向虎嗅表示,2024 年是 AI 应用的元年。2025 年,将是一个 AI Agent 元年,智能化完成任务将成为重要趋势。推理型大模型的出现、情感识别技术的发展和自主进化系统的成熟为 AI Agent 的应用提供了契机。在这个过程中,AI Agent 将逐步可以独立完成一系列任务,而不是单个任务。
数据显示,全球 AI Agent 市场规模预计将突破 500 亿美元,年复合增长率达 147%。目前我们对智能体的理解还比较狭义,未来需要进一步拓展其应用场景和功能,比如医疗诊断(准确率提升至 92%)和金融投研(决策效率提升 3 倍)等领網域。
对全球 AI 市场来说,DeepSeek 的崛起首先推动了全球 AI 市场的竞争,促使谷歌和 OpenAI 相继推出新模型,并降低了 AI 模型的收费标准。DeepSeek 的开源模式在为开发者提供了更多选择的同时,推动了 AI 技术的广泛应用和创新,拓宽了市场的边界,相应地也给投资者带来了信心。
但是,也有一些东西没有变,比如,芯片产业的发展。DeepSeek 的火爆将 AI 带进更多人的视线,随着使用 AI 的人越来越多,AI 的需求不断攀升,英伟达等芯片企业形势向好。这也宣告了中国发展芯片等硬體的急迫性,芯片的能力亟需发展,以逐步走向独立,乃至达到世界领先水平。
对中国 AI 圈来说,DeepSeek 为中国 AI 大模型提供了新的技术思路,有利于国内企业加快技术研发和产品迭代。与此同时,随着 DeepSeek 的火爆,整个 AI 市场热起来了。在这个过程中,Xsignal 立足于数据分析,中国 AI 圈需要客观冷静地看待 DeepSeek 现象,持续性审视自身的发展策略。在此基础之上,有几个增长点值得关注。
第一,关注生态。AI 应用作为一个商品,需要生态来推动其发展,比如豆包的 " 火爆 ",依赖于字节跳动的流量生态。此外,硬體的生态也非常重要,拥有硬體终端生态的公司,比如苹果,华为在 AI 应用的发展中会更有优势。
第二,关注垂直赛道。以虚拟社交为例,AI 的技术发展到情感识别后,AI 虚拟角色星野 APP 的 MAU 已近 700 万,年度入榜次数达到 12 次,无论是用户粘性还是付费愿望的调查数据都相当好,这显示,国内情感陪伴 AI 应用仍有很大的市场,深耕垂直赛道也很有价值。
2024 年度中国 APP 端 TOP 50 AI 应用年度榜单,数据来源:Xsignal(奇异因子)
第三,关注 AI 应用的发展。互联网时代,中国的 APP 应用水平全球领先,或许我们也可以借鉴互联网时代的经验,推动 AI 技术的场景化应用,让 AI 真正的进入人类生活。
这进而也可以回答刚刚的问题:DeepSeek 的成功是可以 " 复制 " 的吗?换句话说,DeepSeek 级别的成功可能会再发生吗?
" 我的回答是:可能。",刘震向虎嗅表示," 中国在 APP 应用层面的发展有着震惊世界的成果。人工智能时代,中国在 AI 应用层面也会有领先的创新和普及。在中美长期 AI 竞争的大背景下,可能还会出现越来越多的‘ DeepSeek 现象。就像互联网时代,有人就有需求,有需求就有市场,中国的人口基数在这里,有市场就会有创新,这一点,我很有信心。"