今天小编分享的科技经验:DeepSeek倒逼,大模型资源再分配,欢迎阅读。
模型的技术能力就是产品力,由于算力消耗预期的下降,将彻底倒逼基础大模型公司在模型技术上创新。
编者按:DeepSeek 的爆火不仅掀起技术狂欢,更将中国大模型创业圈推入价值重估的十字路口。当行业开始追问 " 为什么大模型六小虎没有成为 DeepSeek" 时,更深层的行业洗牌暗流已然涌动。
近日,月之暗面被爆大幅收缩产品投放预算的消息,再次引发市场关注,"AI ‘六小虎’何去何从 " 的话题也被深思。
最新消息显示,另一 AI 大模型独角兽 MiniMax(稀宇科技)合伙人、公司副总裁、开放平台负责人魏伟,已经于近期离职。
一位 AI 产业链人士对创投日报记者表示,DeepSeek 的横空出世,让基础大模型赛道的竞争变得更加白热化。原本包括百度、阿里、字节、三大运营商,以及 AI" 六小虎 " 等在内的企业积极布局,但随着 DeepSeek 的出现,市场的天平开始倾斜。
其判断:" 未来基础大模型赛道将进一步整合,最终可能只剩下不到‘ 10 家基础大模型’公司。"
在该位产业链人士看来," 模型的技术能力就是产品力 "。以前,许多基础大模型公司都存在资源分配不合理的现象。" 一家融资规模达 10 亿元的基础大模型公司,其中 6-7 亿元都可能投在算力上,而用于语料的资金仅有 1-2 亿元,最后剩下的资金才用于公司运营。"
" 但 DeepSeek 打破了这种传统的资源分配模式,由于算力消耗预期的下降,将彻底倒逼基础大模型公司在模型技术上创新。" 该产业链人士继续说道,这也再次证明了 " 产品力是模型的技术能力 " 的核心逻辑,不是投流,也不是算力的堆砌。
01
创投日报记者注意到,过去一年,B 站上曾出现过一波基础大模型的 " 投流潮 ",多个 UP 主均表示接到过来自 Kimi、智谱、MiniMax 等在内大模型玩家的投流。此外,字节的豆包也加入营销大战,在抖音、B 站上投流。
一份数据显示,去年 10 月,Kimi 的广告投放金额达到 2.2 亿元。彼时,Kimi 还曾因 "20 天烧钱 1 个亿 " 登上热搜。对此,上述 AI 产业链人士表示," 只能说,企业和投资人再一次被市场教育。"
另一位算法工程师则对创投日报记者表示,尽管 DeepSeek 强大,但技术还没有在多模态上走通,仅仅是基于大语言模型,因此 " 差异化 " 一定是未来大模型要走的路。
在这一点上,创投日报记者注意到,大模型 " 六小虎 " 中的智谱、百川智能坚持走 TO B 路线,MiniMax 和阶跃星辰虽然定位 C 端,但除了大语言模型,还有视频生成和视觉多模态等技术应用。
比如,近日阶跃星辰发布了两款多模态大模型 Step-Video-T2V 视频生成模型和 Step-Audio 语音模型;MiniMax 也有视觉多模态大模型 MiniMax-VL-01 等,这与 DeepSeek 目前聚焦的深度思考和逻辑推导,形成差异。
月之暗面方面,其在定位 C 端之余,旗下产品 Kimi 也涉及多模态,但与 DeepSeek 一样都关注长上下文处理,且都是开源代码,以及免费的试用策略。" 其中,Kimi 是开放免费长文本处理,DeepSeek 是提供 API 免费额度,以此降低使用门槛,促进社交传播裂变。" 上述一位算法工程师表示。
这意味着在很大程度上,Kimi 面临的来自 DeepSeek 的直接竞争强度更大。由此,月之暗面表示,公司近期受到 " 外部因素和内部战略调整影响 "。
02
截至目前,创投日报记者注意到,除了零一万物放弃训练超大模型外,智谱、百川智能、MiniMax 和阶跃星辰等似乎都没有战略上的调整,而是聚焦在战术上的调整,比如选择开源。
近日,阶跃星辰与吉利汽车集团联合宣布,将双方合作的阶跃两款 Step 系列多模态大模型向全球开发者开源。
1 月 15 日,MiniMax 发布的新一代 01 系列模型同样采用开源模式,并且 MiniMax 方面表示,未来也会继续开源。
" 小虎 " 之外,昆仑万维近日表示,开源国内首个面向 AI 短剧创作的视频生成模型 SkyReels-V1。
更早前,字节发布的视频生成实验模型 VideoWorld,也选择了开源。
接受创投日报记者采访的多位业内人士认为,今年是 AI 应用大爆发的一年,大模型们在各个细分领網域找到各自的生态位才是最关键所在,而金融、医疗、零售、制造等领網域都有非常多的应用机会。" 此外,DeepSeek 的强化学习、算力调配,也是大模型公司们值得学习的地方。"