今天小编分享的科技经验:DeepSeek活成了豆包想要的样子,欢迎阅读。
" 豆包 " 和 "DeepSeek"(文中均指代应用)演绎了两个充满戏剧性的故事。
豆包是含着 " 金汤匙 " 出生的贵族,被家族上下寄予厚望。背靠字节雄厚的人力、资源和流量,成长为了 "2024 年国内用户量最大的 AI 应用 "。
按照豆包的 " 养成计划表 ",7000 多万的月活还只是开始,今年 MAU 的目标是 2-3 亿,冲刺去年底 ChatGPT 的水平。
美好的计划被跑出来的 " 黑马 " 所打破,伴随着高涨的科技情绪,DeepSeek 短暂地成为了春节期间的 " 国民 App"。
" 超越 " 以肉眼可见的速度具象化。据 QuestMobile 数据显示,1 月 28 日,DeepSeek 日活跃用户数首次超过豆包。随后 7 天狂揽 1 亿用户,甚至超过 ChatGPT 的用户增长速度,成为史上用户数增长最快的互联网产品。
另据央视财经,近期 DeepSeek 访问使用量急速上升,已经成为目前最快突破 3000 万日活跃用户量的应用程式。
需要特别强调的是,DeepSeek 应用爆发完全属于自然增长,官方没有进行任何投流或营销动作。而豆包依靠垄断式投流,已经在市场跑了将近半年。如今,本来在 C 端 AI 应用市场上稳操胜券的豆包,有了新的对手,一切发生得始料未及。
DeepSeek 成为了搅动市场的 " 鲶鱼 ",给去年即将固化的格局带来了些许松动。
"All in"" 不计投入 " 和 " 重视人才密度 ",从某种程度上看,字节和深度求索公司在 AI 上有着相似的执念和追求。但结果是,字节仍困在绩效主义漩涡中,而深度求索则真正做到了 " 跳出大厂射程 "。
正如《为什么伟大不能被计划》一书中所提到,若想实现更多所谓的丰功伟业,目标往往会成为绊脚石,比如与探索发现、创造力、发明或创新有关的目标。
" 当最伟大的成就被设定为目标时,其实现的可能性就近乎渺茫了。"
无心插柳柳成荫
在很多公开采访中,深度求索都在向外界传递一个观念:专注探索研究,目标指向 AGI。
国内标榜自己为 AGI 布道士不在少数,这也一度叩开了投资者的大门。
大厂为了防御,把鸡蛋放在了不同的篮子里。其他入场玩家迫于生存和融资压力,也不得不把精力留在了应用、To B 等方向上。而深度求索在其中是一个另类,从最初的 DeepSeek Coder 代码大模型到 R1 推理模型,其方向一直在底层通用大模型能力上做突破。
光子星球了解到,在 DeepSeek -R1 诞生前,除了部分大厂外,绝大部分 AI 创业公司已经完全放弃了模型训练。
基础的模型训练犹如无底洞,真金白银砸进去也看不到质的提升。" 套壳 " 和 " 粉饰 " 或许才是国内大模型的真相。据某知情人士表示,某 AI 六小虎在去年年初才开始自己训练大模型,但这丝毫不影响追赶 GPT-o1 的热潮。
在基础大模型之外,大致可以分为两派,即 To B 和 To C。去年,C 端 AI 应用打得火热,以字节豆包和月之暗面 Kimi 为首展开了几波线上、线下获客营销大战。初期,大厂和创业公司纷纷下场互不相让。但到后期,以用户量、日活为参考指标拉开了梯队,彼时强劲的选手只剩下了豆包、Kimi 和文小言。
尽管投流营销备受诟病,但在功能和产品体验未能拉开明显差距的前提下,豆包和 Kimi 还是选择了用真金白银换用户增长。
于无形中诞生了一种潜规则:投流力度与日、月活呈正比。AI 产品榜数据显示,截至去年 12 月份,豆包月活 7116 万,Kimi 月活 1669 万。
DeepSeek 的横空出世打破了上述逻辑,用一次智能更新驱动产品更新。在推理模型的加持下,DeepSeek 的生成效果与同期竞品有了明显的提升,脱离了爬虫和网页检索逻辑,真正完成了 " 拆解 - 思考 - 推理 - 生成 " 的闭环。这就是 DeepSeek 连续 " 伺服器繁忙 ",但依然有大批用户愿意等待的原因,此外亦提供了市场上用户稀缺的价值。
在没有投流的前提下,DeepSeek 仅上线一个月日活就超过 3000 万,这是豆包疯狂推广一年都未曾达到的成绩。
没有过多的优化、UI 设计和功能聚合,仅仅是更新新模型能力后顺便上线的一款应用,却达成了意想不到的效果。
不排除有其他的因素放大了对 DeepSeek 的关注,但至少在 AI 时代证明了,投流获客逻辑不是万能的。一款能满足用户需求的 AI 产品,依然能够实现逆袭。
必选题和可选题
AI 应用这道考题,深度求索和字节从一开始就出现了分歧。对前者而言是可选题,后者则是必选题。
面对泼天的流量,深度求索有两种选择。
一种是借着这股东风,顺势向 C 端方向转型,后期持续在该方向上投入资源。另一种是保持最小投入,像通义诞生初期一样,把应用产品作为大模型突破的副产品和展示視窗,主线仍保持不变。
从现在来看,深度求索对流量更多表现为谨慎和放弃。
在流量巅峰时期,其主动进行了锁区,禁止海外非中国用户注册和使用。此外,面对伺服器资源紧张的情况,也没有选择扩容,而是暂停了 API 服务充值。现在打开应用,深度推理功能使用次数超过三次以上,显示伺服器繁忙已是家常便饭。
接近 DeepSeek 的相关人士也告诉我们,深度求索的目标感一直很强,对做一款应用没有太大兴趣,未来的方向可能还是在大模型和开源上。
回到豆包,情况则大相径庭。字节本身就是 C 端属性很强的公司,豆包作为 Flow 部门主推的应用产品,前期投入已经消耗巨大,再加上投流和拉指标,沉没成本可见一斑。和 DeepSeek 角色不同,字节有火山引擎云和 Agent 平台,无需靠豆包来证明模型能力。
传统的搜索引擎正在被抛弃,AI 搜索和 Agent 未来将一步步取而代之。字节等大厂都在试图创造新的流量入口,豆包现在更像是各类 AI 功能的集合体。一方面梳理了各类零散的 AI 应用,另一方面也在为打通软硬體、内外部体系做准备。未来的理想状态是,用户只需要一个对话框就能唤起功能,实现需求。上个时代,搜索引擎,如百度、谷歌掌握了话语权,而现在一切尚未可知。
流量就像潮汐一般,涨落是常态,DeepSeek 这波亦是如此。
坦白来讲,DeepSeek 现在的用户体验并不是很好,跟成熟的豆包仍有一定距离。DeepSeek 赋予的推理能力优势是暂时,开源和公开技术报告的背景下,字节产品化能力依旧能发挥作用,追平只是时间问题。
DeepSeek 爆火或许是新的思考时机,比如投流与用户之间的关系,模型能力与用户之间的关系以及产品体验与模型能力优化的平衡等等。
在字节刚结束的全员会上,反思已经开始。
据晚点报道,字节 CEO 梁汝波提出,2025 年将不再把豆包 DAU 作为具体目标,转而将重点放在追求 " 智能 " 上限上。
" 不忽略关键技术节点,把智能本身作为最重要的目标,可以激发更多尝试。"
" 大力出奇迹 " 的 AB 面
" 用于判断我们是否朝着正确方向前进的衡量标准,往往具有欺骗性,因为它阻碍了发掘必不可少的踏脚石。"
当站在企业文化维度审视字节和 DeepSeek,他们就如同一枚硬币的正反两面,像又不像,在两套标准体系中奔向了不同方向。
拥抱 AGI,探索未来世界,两家公司都抱有同样的决心。面对着充满不确定性的 AI 道路,抱持了不计成本、完全投入的心态,成为了行业中少有的 " 大力出奇迹 " 的范本。
但有意思的是,Scaling Law 出现了 A、B 面。
在媒体报道中有一个细节,梁文锋和张一鸣在招聘时,会主动去接触尚在高校的研究生和博士生,并和其一起探讨论文研究中的细节。
落在候选人标准上,梁文锋和幻方一以贯之," 看能力,而不是看经验 ",核心技术岗,基本以应届和毕业一两年的人为主。被问及大模型找人的必要条件时,梁文锋给出的回答是 " 热爱和扎实的基础能力 "。
据说,DeepSeek 内部有一个不成文的用人规则:工作经验超过 8 年,直接 pass;超过 5 年,需要特别出色才能入选。
字节则心口不一,热衷于花大价钱挖掘行业中的高 P。去年,字节连续出手,将 Google 原 VideoPoet 项目负责人蒋路,零一万物黄文灏,和阿里通义大模型原技术负责人周畅收入麾下。
一位曾在大厂体系内任职的人员告诉我们,大厂的机制最终阻碍了创新。
字节等大模型团队身负 OKR,评判大模型效果的指标不是达到何种性能或在推理效果,而是能为多少个内部产品赋能,以及产生多少用户量。AGI 的远大梦想在实际落地中显得不堪一击,这就导致很多时候越努力,越偏离航向。
深度求索通过顶会论文数量、获奖级别、竞赛级别等近乎苛刻的标准来筛选人才,虽然团队规模不大,但保证了人才质量。
高 P 华丽的履历却成为了漂浮在大厂上方的光环。上述人员表示," 大厂在大模型上的投入可能比不上创业团队 "。
大厂动辄上百号人,看上去数量十分庞大,但比较分散,落实到具体产品和业务条线错综复杂。由于业务分支过多,聚焦到某个核心环节可能只有十几号人,在这个维度,大厂的投入反而是不足的。
而所谓的大牛和高 P,承担的角色更接近 " 指挥家 "。" 他们并不会实际参与到训练过程,亲自上手调参,仅在训练思路上给一些指导性意见 "。
DeepSeek 和豆包只撕开了创新困境的冰山一角。
从去年到现在,AI 公司在努力跳出大厂射程,而大厂在试图打碎自身的禁锢,最终或许在深度求索身上看到了希望的影子。