今天小编分享的财经经验:“我本以为AI六小虎为大厂探路,没想到连大厂都给DeepSeek探路”,欢迎阅读。
(图片来源:钛媒体 AGI 编辑林志佳拍摄)
" 我原以为 AI 六小虎是为大厂探路,没想到如今,其实连大厂都在给 DeepSeek 探路。" 梅花创投创始合伙人吴世春近期在清华大学举行的一场演讲中表示,不只是 AI 六小虎公司,很多 " 独角兽 " 中的独角 " 猪 " 融了很多钱,但没有造血能力。
回顾 2024 年的 3 月,月之暗面(Moonshot AI)、智谱、百川智能、MiniMax、零一万物、阶跃星辰这 "AI 六小虎 " 发展如火如荼,当时月之暗面的 kimi 智能助手迎来了一波好评热潮,智谱大喊全面对标 OpenAI,王小川还在讨论要做 Super App 杀手级超级应用。
但仅仅过了 360 多天后的今天,开源 AI 模型 DeepSeek 热潮席卷全球,用 7 天完成了 1 亿用户的增长。随后,百度、腾讯等多家互联网大厂和中小企业、政府机关开始接入和适配 DeepSeek。
如今,"AI 六小虎 " 被视作受这一轮热潮冲击最为显著的代表,已然踏上 " 分化 " 之路,各自在收缩业务战线、探索盈利途径:百川多名联合创始人离职,并选择深耕医疗 To B 领網域;零一万物则不在研发万亿规模超大参数模型,转而拥抱 DeepSeek;MiniMax 削减 B 端投入,将发展重心转移至模型和 C 端应用;智谱则在短短 93 天内公布 48 亿元融资,为自身发展 " 冬储 " 能量。
管理咨询机构 Roland Berger 指出,中国 AI 应用中,字节豆包、DeepSeek 已成为超级入口。今年 2 月数据显示,豆包和 DeepSeek 与第三名 Kimi 的月活规模差距扩大至 3600 万,而部分新晋者如腾讯元宝凭借接入 DeepSeek 模型的流畅体验,积极投流,在短时间内也实现了显著增长。然而,文小言、智谱清言等 " 老牌 "AI 助手因增速不及,面临不进则退的挑战。
零一万物创始人兼 CEO 李开复 3 月 21 日表示,DeepSeek 掀起的行业变革彻底颠覆了 AI 行业发展模式,可能让 OpenAI 创始人辗转难眠。他预测,中国市场最终可能只剩下 DeepSeek、阿里巴巴和字节跳动三家主要的 AI 模型公司,其中 DeepSeek 目前势头最强。
李开复强调,中美两地的投资人几乎不再下注更多更贵的底层模型公司,他们更愿意投资 AI 应用、消费者应用、AI 基础设施类型的创新企业。
中国 "AI 六小虎 " 融资信息统计(数据仅供参考)
进入 AI 大模型下半场,形势已然明朗。
尽管 DeepSeek 讨论热度渐趋下降,但阿里、腾讯、字节等大厂凭借自身全方位的资源投入,向 "AI 六小虎 " 彰显出一个残酷现实:百度 CEO 李彦宏所预判的"99% 的 AI 公司会在泡沫破裂时面临倒闭风险,仅有 1% 的公司能够存活 "正逐步成为现实。
DeepSeek 之后,六小虎从追基模转向 " 求生存 "
" 虽然对 AI 来说是重要的进步,但还算不上革命,"TrueAGI 和人工智能超级联盟 ASI Alliance 首席执行官 Ben Goertzel 博士指出,DeepSeek 带来了 AI 技术的 " 寒武纪爆炸 ",表明更少的计算能力就能实现 AGI(通用人工智能)。
DeepSeek 于 2024 年 12 月发布了处理语言、运行对话应用的基础模型 V3,并于 2025 年 1 月开始提供具有强大推理功能的 R1 模型。DeepSeek 之所以爆火,原因在于 R1 模型在更低成本与开源生态的基础上,多个关键任务层面展现出与美国 OpenAI o1 等顶尖闭源模型相匹敌,甚至更优的性能。
美国风险投资家 Marc Andreessen 表示,DeepSeek 模型是 AI 的 " 斯普特尼克时刻 ",即是 20 世纪 50 年代末苏联卫星发射,开启太空竞赛的时刻。
DeepSeek 披露过几个关键数据:V3 训练成本仅花费 560 万美元,V3/R1 模型理论一天的总收入达到 56.2 万美元(约合 407.41 万元)、成本利润率高达 545%。
然而,大众对 DeepSeek 的成本估算存在分歧。其中,Meta 前工程师表示,560 万元不包括算力运营、数据中心服务等费用,这些算力服务成本更加高昂,至少需要花费数亿美元。
PPIO 派欧云联合创始人兼 CEO 姚欣近期独家对钛媒体 AGI 表示,545% 只是理论数据,不代表行业趋势。" 如果全行业 545%,大家都别干了 "。他强调,这份没有收入起伏的数据,证明了 DeepSeek 全天近 16 个小时都是在峰值期,没有办法完整地满足用户的请求和服务,这样的服务质量是 " 不及格 " 的。
不过,这些都无法阻挡拥抱 DeepSeek 热潮。
当下,微软、英伟达、亚马逊、英特尔、AMD 等全球科技巨头相继宣布上线了 DeepSeek 开源模型推理服务,国内厂商诸如腾讯云、阿里云均支持 DeepSeek 的一键部署和调用,腾讯微信、浏览器、元宝、小红书等多款国民级产品接入 DeepSeek,涵盖社交、云服务、办公、地图等领網域。
据钛媒体 AGI 统计,目前已有超过 300 家企业接入了 DeepSeek。
但 DeepSeek 并没有让算力需求消失。今年 GTC 大会上,英伟达创始人兼 CEO 黄仁勋表示,Meta、亚马逊、谷歌和微软前四大云服务商去年购买了 130 万颗的 H 系列芯片,今年则是要购买 360 万颗 BlackWell 芯片——但芯片行业人士指出,最终出货的系统数量其实并没有增加多少,这是黄仁勋的 " 部門换算 " 文字游戏。
黄仁勋认为,从两年前的 ChatGPT 到如今 DeepSeek 引发的推理能力,Scaling Law(规模定律)并没有消失,而是从一个变成了三个——预训练扩展、在代理人工智能(Agentic AI)阶段的后训练扩展,如今的算力需求已比去年预估的规模高出 100 倍。
然而,大会当日英伟达收跌 3.4%。华泰证券最新研报称,R1 等推理模型和传统的大语言模型相比,所需要生成的 token 量接近传统大模型的 20 倍。此次 GTC 上,虽然英伟达也提出了后训练 Scaling 和测试时间 Scaling 的叙事,但从英伟达当天股价表现上来看,此次 GTC 或未能打消投资人在算力需求增长方面的担忧,同时英伟达的 GPU 方案能够胜出目前还不确定。
如今,"AI 六小虎 " 面临着复杂严峻的局面。DeepSeek 开源模型正处于如日中天的发展态势,影响力持续扩张。与此同时,行业内训练成本与算力成本不断攀升," 烧钱 " 规模远低于大厂,这让 "AI 六小虎 " 收入微薄却深陷高额亏损的困境。
也正因如此,今年,"AI 六小虎 " 不得不陆续放弃对基座模型的追逐,转而将重心调整为 " 求生存 ",努力在艰难的市场环境中探寻可持续发展之路。
百川智能:缩减对预训练大模型的投入,今年将逐渐加大对医疗增强大模型的倾斜。3 月 20 日,百川智能与北京儿童医院、小儿方健康共同发布全球首个儿科大模型 " 福棠 · 百川 " 儿科大模型。此外,仅 3 月,百川就从裁金融组团队,到百川联合创始人焦可、联合创始人陈炜鹏陆续离职,此前百川智能联合创始人、商业化负责人洪涛已于去年离职。 零一万物:推出万智企业大模型一站式平台,为企业级 DeepSeek 部署定制解决方案,内置 DeepSeek V3/R1 等平台。李开复回应钛媒体 AGI 等:公司未来不再做单一大模型,而是采取模型开放策略,研发能够兼容适配国内主流模型的产品,转型之后,零一万物从基座大模型重投入调整为软硬體解决方案提供商,不再训练万亿参数规模的超大基模,但仍会继续做轻量化模型。 智谱:一面融资、一面转 Agent 和大模型落地。仅在 3 月内,智谱便先后宣布获得杭州国资、珠海华发集团、四川成都高新区 18 亿元融资,合作搭建首个城市级 GLM 大模型空间 " 智谱 + 珠海华发空间 "、联合打造四川省基座大模型 " 智谱诸葛大模型 " 以及 AI 基础设施等。 MiniMax:在收缩 B 端业务后,持续投入视频生成、视觉多模态与海外产品,包括万卷等多款 App 停止更新、海螺整合成 MiniMax,统一力量发力 AI 应用落地。此外,有消息称 MiniMax 还在讨论收购深圳 AI 视频生成创企鹿影科技 ( Avolution.ai ) ,后者对外发声想要尽快被高价收购。 月之暗面:大幅收缩产品投放预算,逐渐披露在长文本与开源技术方面的进展,并且与 " 豆包 " 一样的界面加速迭代 kimi 智能助手,满足市场对 AI 应用的需求。 阶跃星辰:开源图生视频模型—— Step-Video-TI2V,基于 30B(300 亿)参数 Step-Video-T2V 训练的图生视频模型,支持生成 102 帧、5 秒、540P 分辨率的视频,具备运动幅度可控和镜头运动可控两大核心特点,同时天生具备一定的特效生成能力。同时,跃问 AI 拥抱 DeepSeek,并重点推进智能车、手机终端、金融、机器人等领網域的 AI 大模型技术落地。
总的来看,除了 MiniMax、月之暗面之外,剩下四家大模型公司都希望在 To B 企业端实现更大的收入增长,并且希望用 API 接入方式,代替传统 AI 軟體的 " 定制化 " 需求。
李开复对钛媒体 AGI 表示,公司已经全面转向应用阶段,2025 是 Al-First 应用爆发年,也是大模型商业化的大考年,而 AI 需要市场,市场也需要 Al,行业亟需 " 性能 x 性价比 " 最优解。
" 今天,大模型我们走(发展)了两年多,2025 年最重要的事件是开源力量 + 中国实力,DeepSeek 的横空出世,不但是中国的骄傲,而且也带来了更加清晰的终局,也就是开源必将胜出,大模型的格局将从拼比底模的技术指标,走向拥抱开源模型的商业赋能,那么中国就有超大市场、超多场景。"李开复称,未来的大模型的行业竞争将不再单指模型性能的比拼,更关乎从中台到应用的能力,即模型能否快速响应场景需求、基于中台构建行业应用。
然而,企业借助 To B 端服务实现扩张后,能否持续生存,目前仍存疑。依图科技联合创始人林晨曦对钛媒体 AGI 表示,如果在 To B 端,医疗 AI 对于大模型六虎并不一定是正确的方向,医疗 AI 行业订单的客单价很薄,收入和投入不成正比,几乎还是死路一条,医疗 AI 行业的商业环境本质上没有什么变化。
钛媒体 AGI 从行业人士处获悉这样一个案例。北京一家公立医院计划借助 AI 大模型,结合 CT / 核磁共振等现有技术,直接精准观察肿瘤病灶位置,该医院要求颇高,却将成本压得极低。字节、百川等企业参与了此次竞标。
最终,字节经评估认定,以当前技术水平,无法达到医院所期望的要求,况且订单价格过低,连成本都难以覆盖。但出人意料的是,百川却选择与医院展开合作。一位参与竞标的人士向钛媒体 AGI 透露," 连我们这些大厂都觉得难以实现的方案,百川就算拼尽全力、耗尽资源去做,最终也很难获得可观的收入 。"
此外,这些 AI 公司内部管理存在严重问题。比如北京的一家 AI 公司办公区,有一层颇为特殊。与其他楼层不同,这一层全是实习生,却能享受诸如午餐、零食等优渥待遇,而其他楼层的员工则无此福利,不仅如此,公司内部的采购部门和商务销售部门矛盾频发,冲突不断,同时公司不断调整商业化方向,导致收入低于预期。
另一家北京的 AI 公司,其内部情况错综复杂,该公司的一位创始人行事风格独断,将 CEO 管理的诸多人员全部辞退,唯独留下自己人,致使公司 CEO 被 " 架空 ",沦为有名无实的 " 吉祥物 "。同时,在技术与产品层面,该公司状况堪忧,其自研基座模型被舍弃,小模型和产品服务在市场上毫无竞争力可言,然而公司仍硬着头皮大力开展推广销售工作,究其背后原因,创始人的最终目标是自身影响力变大,并且能将公司高价 " 变卖 " 给大厂。
显然,国内 AI 公司的扩张和 " 派系 " 背后,仍有很多隐忧无法消弭。
" 这些‘大模型六虎’正在以三倍速,走当年我们‘ AI 四小龙’(依图、旷视、云从、商汤)2017-2019 年的老路。" 林晨曦对钛媒体 AGI 表示,如果 AI 创业公司想在国内 C 端产品中获得商业化,能力和最终结果远不及字节等互联网大厂,后者有大量的投入、人力资源、流量与用户规模,这是创业公司无法做到的。
追逐 OpenAI,奥尔特曼暗示 GPT-5 将免费提供
如今,阿里、腾讯两家互联网大厂都已经决定向 AI 技术领網域加大研发投入。
其中,阿里巴巴集团 CEO 吴泳铭已经宣布,未来三年,阿里将投入超过 3800 亿元,用于建设云和 AI 硬體基础设施,总额超过去十年总和。这也创下中国民营企业在云和 AI 硬體基础设施建设领網域有史以来最大规模投资纪录。
而腾讯 2024 年研发投入达 706.86 亿元,年度资本开支更突破 767 亿元,同比增长 221%,创历史新高。其中,AI 项目发展所涉及的资本开支就达 390 亿元。腾讯总裁刘炽平表示,腾讯计划 2025 年进一步加大资本开支,预计会占 2025 年总收入的 " 低两位数百分比 "。这意味着,2025 年腾讯的资本开支可能接近 1000 亿元的水平。
据钛媒体 AGI 统计,过去十年,阿里、腾讯的研发支出各不相同,腾讯稳步提升,阿里的研发投入则随着业绩而变化,并在 2024 年达到最高的 934 亿元。
"AI 爆发远超预期,国内科技产业方兴未艾,潜力巨大。阿里巴巴将不遗余力加速云和 AI 硬體基础设施建设,助推全行业生态发展。" 吴泳铭表示。
事实上,DeepSeek 热潮让国内投资界人士、政府机构都变得异常活跃,转向了 " 中国 AI 能力赶超美国 " 的叙事逻辑中,而中国是否已经在 AI 领網域 " 弯道超车 ",也引发热议。
对此,清华大学计算机系副教授刘知远表示,"AGI 新技术还在加速演进,未来发展路径尚不明确。我们仍在追赶阶段,已经不是望尘莫及,但也只能说是望其项背。在别人已经探索出来的路上跟随快跑是相对容易的,接下来我们要面对一团未来迷雾。"
事实上,DeepSeek 的创新,很好地说明了什么叫 " 需求是创造之母 "。
这轮热潮带有一些无奈的色彩,DeepSeek 在算法、架构、工程方案的创新方案,核心因为算力被卡住,所以这样的方案几乎只有可能在中国公司出现,因为只有中国公司才会同时面临 " 巨大需求和巨大限制 " 这两个问题。因此,DeepSeek 的创新在中国以外也是很难复制的。
DeepSeek 这家中国本土的团队,因为其意外争气的表现,拉动了市场对于 " 中国 AI" 想象,相应地中国科技公司也都是 " 与有荣焉 ",努力以各种各样的方式赶上这波流量。
腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生认为,AI 行业还处于早期阶段。大家都在跑马圈地,尝试着不同的商业模式。有的在追 Scaling Law,有的在打造 To C 市场新入口,有的在做产业落地,非常热闹。
"AI 正在跨过产业化落地的门槛,站在普及应用的全新节点上。行业由之前的模型训练主导,发展到今天更多是应用与 Agent 驱动;我们看到,云上 DeepSeek API 调用量激增,语音互動的需求也带动了 ASR(自动语音识别)与 TTS(文本转语音)模型的 API 调用;模型推理的算力消耗正在高速增长,规模化推理的成本优化,成为云厂商的核心竞争力。" 汤道生说。
无论是从 "AI 六小虎 " 离职的高管,还是大厂出身及科学家转型的 AI 创业者,在创业早期,都在思考如何兼顾收入与 AGI 发展这 " 双重目标 "。这情形就像,火锅店大师傅刚调好秘制底料,后厨的二把手、三把手便带着徒弟另起炉灶,分别去开串串香店和冒菜馆。商业江湖从不缺新风口,AI 大模型赛道才刚起步,那些本应专注于此的 " 掌勺人 ",却已被隔壁 " 烧烤摊 " 的香味吸引,蠢蠢欲动。
在金沙江创投主管合伙人朱啸虎看来,目前市场已经没必要去关注 "AI 六小龙 " 了,创业公司打底层模型已经毫无意义。未来基础模型的竞争格局内,大厂中只会留下阿里、腾讯、字节这三家。至于创业公司,朱啸虎认为必须找到自己的根据地,才有机会异军突起,但从现状来看,他认为还没有看到能够颠覆阿里、腾讯、字节的万亿美元机会。
李开复认为,中美市场中的超大模型预训练正在逐渐寡头化,并且寡头化的程度在不断加大,其中开源圈展现出压倒性的优势。美国市场中,OpenAI 和 Anthropic 都相信自己还能训练出远超其他玩家的闭源模型。但从结果来看,OpenAI 在 2024 年的运营成本为 70 亿美元,而 DeepSeek 的运营成本可能只有 OpenAI 的 2%。
" 有了这样一个强大的竞争对手,我认为 OpenAI CEO 奥尔特曼(Sam Altman)可能夜里辗转难眠。" 李开复表示。
从技术角度,各家模型优势各异,但 DeepSeek 将成本低数倍的开源模型免费推向市场,已经有效地将计算成本降低了五到十倍。而开发最尖端 AI 的过程中,丰富的计算资源仍然是强有力的武器。
其中,由马斯克领导的美国 xAI 于 2 月 17 日开始提供的新 AI 模型 Grok 3 系列,其在数学、科学和编程能力方面超过了竞争对手,主要因为大幅扩建数据中心,拥有 30 万英伟达显卡进行训练,比此前模型计算能力大 10 倍以上。
如今,OpenAI 的战略方向发生转变,不再一味执着于大模型本身的研发推进,而是将工作重点转移到了 ChatGPT 应用的用户增长层面,全力拓展用户规模。
奥尔特曼表示,未来五年,拥有十亿活跃用户的网站更有价值,同时,AI 战略优势将体现在软硬體的完整生态、实现最经济和最充足的推理能力,以及持续进行前沿研究保持开发出最优秀模型。
随着今年 2 月底训练数据量高达 120 万亿 tokens 的规模最大、知识储备最丰富模型 GPT-4.5 发布,AI 模型竞争进入 " 白热化状态 "。OpenAI 计划在数个月内公开的基础模型 "GPT-5" 不仅具备知识能力,还具备高度的推理能力。合并后的 AI 预计变得庞大,因此需要大量的最高性能 GPU。
奥尔特曼认为,AI 是能够实现真正创造力的基础。他暗示,OpenAI 正在重新考虑其封闭战略,GPT-5 有可能免费提供,而同时也会发布开源的技术。
《创新者的窘境》一书中曾提到," 为什么成功的大企业会倒掉?因为他们按照既定技术轨道发展自己,能力结构逐渐固化,成为无法变革成功的死穴 "。
外部市场环境瞬息万变,企业的战略规划与组织架构必须与时俱进、实现自主进化,否则必将被市场无情淘汰。大模型行业同样遵循这一规律。"AI 六小虎 " 的发展进程仍在持续,百川和智谱手握大量资金积极 " 冬储 ",为未来布局。鉴于此,大模型行业未来的格局充满变数,当下实难作出精准预测。
但唯一可以确定的是,DeepSeek 已经成为了美国企业的 " 眼中钉肉中刺 "。
3 月 13 日,OpenAI 向白宫提交了一份 15 页的信函,称要求美国政府禁用 DeepSeek,并向特朗普政府建议实施 "AI 技术出口管制 ",限制 AI 技术流向中国等国家。
正如 OpenAI 全球事务副主管勒汉在信中称:" 虽然美国目前在 AI 领網域仍保持领先,但 DeepSeek 的出现显示我们的领先优势正在缩小。"
这场大模型之战仍将持续,短时间内难见分晓。各方在技术研发、市场拓展、应用创新等维度的较量正酣,未来的竞争态势愈发复杂,鹿死谁手尚未可知。
(作者|林志佳)