今天小编分享的互联网经验:落选“果链”,别再捧杀DeepSeek了,欢迎阅读。
文 | 锌刻度,作者 | 陈邓新,编辑 | 李觐麟
DeepSeek,持续正反馈 AI 赛道。
2025 年 2 月 13 日,文心一言宣布将于 4 月 1 日 0 时起全面免费,所有 PC 端和 APP 端用户均可体验文心系列最新模型,而此前只有免费使用 3.5 版。
随之而来的,则是舆论此起彼伏。
在苹果不选择 DeepSeek 作为 "AI 搭子 " 时,The Information 报道,苹果考虑了多个国内的对象,与阿里巴巴的合作已取得重大进展,并明确拒绝了 DeepSeek。
这意味着,DeepSeek 落选了苹果供应链,令人唏嘘不已。
其实,BAT 们与 DeepSeek 并非 " 针尖对麦芒 "。
文小言、腾讯元宝等接入 DeepSeek 大模型,为用户提供更多的 AI 选择;阿里云、腾讯云、华为云、京东云、火山引擎、百度智能云等主流云服务平台纷纷上线 DeepSeek 大模型,鼓励用户尝鲜 DeepSeek-R1、DeepSeek-V3 ……
BAT 们与 DeepSeek,是对手也是队友?
没有拔刀相向,反而雪中送炭
DeepSeek 的初衷,是印证 " 条条大路通罗马 "。
生成式 AI 革命爆发之后,大模型站上了 " 风口 ",而算力成为衡量大模型能力的核心指标之一,在力大飞砖的简单思维之下,硅谷将算力塑造为 " 皇冠上的明珠 ",被视为难以企及的力量。
于是乎,算力紧张成为行业的关键词,令 AI 成本长期居高不下。
此背景下,DeepSeek 通过算法优化等手段降低了 AI 成本,用最少的资源达到最大的效果,为行业花小钱办大事提供了新的思路和方向。
图源:DeepSeek 官网
这意味着,扩大算力并非 AI 进化的唯一途径。
斯坦福大学人工智能实验室主任吴恩达:" 近年来,围绕‘扩大模型规模能够推动 AI 进步’的观点备受追捧。事实上,我曾是这一理念的早期支持者。"
不难看出,消解算力壁垒才是 DeepSeek 的真正影响。
巧的是,这也是全球互联网巨头共同的夙愿:唯有不断降低成本,AI 普惠才可以从梦想照进现实,从而颠覆传统的产业格局与商业模式。
更为重要的是,可以错位竞争。
DeepSeek 创始人梁文锋表示:" 长远来说,我们希望形成一种生态,就是业界直接使用我们的技术和产出,我们只负责基础模型和前沿的创新,然后其他公司在 DeepSeek 的基础上构建 To B、To C 的业务。"
关于此,从 BAT 们的态度就可见一斑。
QuestMobile 的数据显示,DeepSeek 的日活跃用户数已突破 3000 万大关,创造了史上最快达成这一成就的新纪录。
随之而来的则是," 伺服器繁忙,请稍后再试 " 屡屡被用户诟病。
屡屡被用户诟病
腾讯云、阿里云、京东云、华为云、火山引擎、百度智能云等纷纷伸出援手,满足外界对 DeepSeek 不断增长的推理需求。
譬如,京东云上线 DeepSeek-R1 和 DeepSeek-V3 模型,支持公有云在线部署、专混私有化实例部署两种模式。
再譬如,腾讯云支持开发者将 " 满血版 "DeepSeek 接入微信小程式,可实现智能对话、文本生成等功能。
天使投资人、资深人工智能专家郭涛认为 DeepSeek 不会冲击行业原有的竞争格局:" 文心一言、通义千问等 AI 大模型都已建立起完善的生态体系,且背后有百度、阿里巴巴等强大企业的支持,技术实力雄厚,能够持续投入研发进行技术迭代更新。"
AI 创新是一场马拉松而非短跑
以上可见,BAT 们对 DeepSeek 的态度颇为友好,这背后的缘由有三。
首先,降本一直进行中。
DeepSeek 之前,BAT 们就在不断推动 AI 降低成本,也取得非常不错的成就,共同推动大模型定价进入 " 厘时代 "。
事实上,BAT 们的创新也可圈可点。
譬如,字节跳动设计了一个全新的稀疏模型架构 UltraMem,有效解决了传统主流 MoE 架构存在的推理时高额访存问题,从而提升推理速度 2 倍至 6 倍,推理成本最高可降低 83%。
上述架构创新,与 DeepSeek 有异曲同工之妙。
再譬如,百度点亮国内首个自研万卡集群,有效解决了过去算力价格高以及无法稳定应用的问题,通过集群效能最大化达到降低部門算力成本的目的。
" 今天,创新速度比以往都快得多。摩尔定律中,每 18 个月,性能就会翻倍,价格减半;如今,大模型推理成本每年能降低 90% 以上。" 李彦宏称。
图源:AI 产品榜
其次,模型蒸馏成为竞争新高地。
模型蒸馏成为获取低成本 AI 的重要路径,进一步降低了大模型的门槛,为 AI 落地走进千家万户提供了更多的可能。
李飞飞团队训练出的 s1 人工智能推理模型,就是其中的代表。
s1 人工智能推理模型以阿里巴巴通义千问为基座模型进行微调,蒸馏了谷歌推理模型 Gemini 2.0 Flash Thinking Experimental 的 1000 个样本,在数学和编码能力测试中的表现与 OpenAI 的 o1 和 DeepSeek 的 R1 等尖端推理模型类似,耗费不到 50 美元。
换而言之,模型蒸馏为行业指明一个新的前进方向。
德邦证券的研究表明,2025 年将是模型蒸馏技术的爆发年,AI 应用的成本有望大幅下降,模型能力也将全面提升;通过引导和支持,AI 模型不仅能够在云端获取巨大的优势,也能在边缘计算等端侧应用中发挥重要作用。
如此一来,BAT 们有了更大的发力空间,没有与 DeepSeek 较劲的必要。
中国首席经济学家论坛理事刘煜辉表示:" 现实世界可以用来训练 AI 模型的数据资料已经耗尽,现在大家都是相互借鉴数据相互蒸馏,大家的模型水平根本拉不开差距,拼的就是谁能够找到新的应用场景、谁能率先把价格打下来。"
再次,不排除结下善缘的可能。
种种迹象表明,DeepSeek 虽然初期拒绝了融资,但随着规模不断扩大,资源瓶颈问题肉眼可见,成为一个棘手的问题。
一名私募人士告诉锌刻度:"DeepSeek 背靠的幻方量化虽然是千亿元体量,但客户的钱不等于幻方的钱,更不等于可以投入的钱,迟早需要寻找外援。"
实际上,量化并不能长时间 " 躺赢 "。
幻方量化 CEO 陆政哲曾坦言:" 迅速崛起、规模快速放大、又飞快衰落消失,这仿佛是量化行业的死循环,像悬在我们头上的达摩克利斯之剑。"
从这个角度来看,BAT 们可以在算力、数据、场景等全方位助力 DeepSeek,大家各取所需实现双赢。
实际上,BAT 们一直青睐富有特色的 AI 初创企业,被誉为 "AI 六小龙 " 的智谱 AI、月之暗面、百川智能、零一万物、阶跃星辰、MiniMax,背后不乏腾讯、小米、美团、阿里巴巴等身影。
总而言之,AI 创新是一场马拉松而非短跑,比拼的是耐力与毅力,无论 BAT 们这样的头部选手,还是 DeepSeek 这样的初创企业,都有弯道超车的机会,相互借力与借鉴才可以共同提高,大家都有美好的未来。
那么,神话 DeepSeek 大可不必。