今天小编分享的互联网经验:AI长文本之战:Kimi快跑,大厂围剿,欢迎阅读。
文 | 周鑫雨
编辑 | 苏建勋
一条名为 "Kimi" 的鲶鱼,将大模型公司卷到了长文本的新战场。
这款来自 AI 独角兽月之暗面的大模型对话产品,最大的标签就在于 " 长 "。上下文視窗的大小,代表着一个模型的记忆力。視窗越长,模型单次可处理的文本就越长。对用户而言,模型能读懂的文字越多,在学习、工作等场景下就越有用。
深谙营销之道的月之暗面,是国内乃至全球范围内,第一家将 " 长文本 " 作为标签的大模型公司。2023 年 10 月 30 日,打着 " 全球首个支持输入 20 万汉字 " 名号的 Kimi Chat 就快速在一堆卷榜单、卷参数的模型中,拥有了辨识度。
Kimi 有多火?国信证券的调研显示,从 2023 年 10 月到 2024 年 3 月,Kimi 的 DAU 从 10 万攀升到了 300 多万,翻了 30 倍。自春节起大规模投放广告后,SimilarWeb 数据显示,Kimi 的访问量在 2 月增长了 107.6%,仅次于百度的文心一言和阿里的通义千问。3 月 21 日,无法承接过多用户的 Kimi App 和小程式一度宕机,用户需要排队才能正常使用。
Kimi 的爆火,还直接牵动了股市——一些与月之暗面有合作传闻的上市公司,被冠以 "Kimi 概念股 " 之名,股价飙升。后续纷纷出来辟谣的海天瑞声、中广天择,已经先吃上了 Kimi 的红利,在 3 月 20 日应声涨停。这段时间,沪深互动平台最多的问题是 " 公司是否与 Kimi 助手有合作 ",又或是 " 公司有接入 Kimi 吗 "。
网上流传的 "Kimi 概念股 " 名单。
在 2024 年 3 月 24 日的一场用户活动上,月之暗面的几位产品负责人直言:" 我们不敢说太多,还是希望大家关注产品本身。"
而一场对 Kimi 的长文本围剿战,也已经在大厂中打响。3 月 23 日,360 AI 浏览器宣布内测 500 万字长文本处理功能。百度的文心一言也被曝将在 4 月开放长文本功能,长度在 200 万 -500 万。阿里的通义千问则一口气免费开放了 1000 万字的长文档处理功能,坐上了 " 全球第一长 " 的宝座。
可炮制的技术,被验证的需求
Kimi 带起的长文本之火,无外乎两个原因:技术门槛不高,市场需求已经被月之暗面初步验证。
2023 年 10 月 9 日,Kimi 带着 " 全球首个支持输入 20 万汉字 " 的标签走进大众视野。彼时,这一上下文視窗长度达到了 Claude-100K(约 8 万字)的 2.5 倍,GPT-4-32K(约 2.5 万字)的 8 倍。
不过,多名从业者对 36 氪表示,长文本处理的技术壁垒并不高。长文本建模的方案,主要有外部召回(借助外部工具处理长文本或者利用外部记忆存储上下文向量)、模型优化、注意力计算优化三种,而每一种都有公开的研究论文和技术方案。
很快,Kimi"20 万字 " 的记录就被他人打破。2023 年 10 月 30 日,Kimi 首发仅过了 21 天,王小川的百川智能就推出了上下文視窗达 192K 的大模型 Baichuan2-192K,单次能处理 35 万个汉字。11 月,王座再次易位,李开复成立的零一万物,又发布了能够处理约 40 万字的大模型 Yi-34B,是 Kimi 的约 2 倍。
长文本带来的模型竞速,最根本的原因,还是在于看到了庞大的消费群体。
"C 端用户对大模型的需求无外乎两种,一是提效工具,二是娱乐工具。" 一名 AI 从业者告诉 36 氪。他认为,目前 AI 对短文本的理解和生成能力,还没完全超过人类,比如看咨询、写短文案," 人用在修改 AI 生成的文案的时间,其实不比自己从头想来的少。"
但大模型相较于人的竞争力,恰恰在于理解长文本的效率。"10 万字的论文,一般人读完起码要 30 小时,还是在不休息的情况下,但大模型只要几分钟。"
一名法律行业 AI 产品经理向 36 氪提及,问答机器人、模拟法庭等 AI 产品在专业度高、实践性强的法律行业都跑不通,唯一能跑通的只有对判决文书等长文本的总结,而 "Kimi 是目前律师等法律专业用户认可度最高的一款 AI 产品 ",不少律师用 Kimi 来总结资料,输出法律文书。
Kimi 的火爆,是苦于 C 端变现途径的大厂所垂涎的。在大模型落地的打法上,体系庞大的大厂们,采用的基本是模型 + 云服务、AI 功能 + 原有产品的保守打法。在 B 端,这样的打法初见成效。百度在 2023 年的财报中,强调了大模型对云等 B 端业务的推动。
但大模型对 App、搜索等 C 端产品营收的助推,依然是个谜。百度财报显示,2023 年 12 月,百度 App 的月活达 6.67 亿,同比增长了 3% ——然而,这个数字与 9 月的 6.63 亿基本持平,不及 6 月的 6.77 亿。
而 Kimi 证明了,不采用和其他产品的 " 打包 " 模型,大模型本身也有拉新造血的潜力。通过月之暗面这个对手,大厂们完成了对长文本的市场验证。
Kimi 的难题是商业模式,大厂的难题是获客
但要让长文本真正造血,厂商们担心的仍然是高昂的成本。
日前,Kimi 的获客成本就引发了讨论。据新浪科技获得的数据,算上广告投放和算力成本,Kimi 每个用户的获客成本达 12-13 元,按照近一个月 17804 的日均下载量计算,Kimi 每日的获客成本高达 20 万元。
Kimi 在 B 站投放的广告。
每日 20 万元的获客成本,加之随着参数规模水涨船高的大模型研发费用,对尚未商业化造血的月之暗面而言,烧钱的局面依然要维持一段时间。
初创公司的另一难题,则在于如何运营如此庞大的用户群体,并提供稳定的服务。2024 年 3 月 21 日下午,由于用户数超出负荷,Kimi 的 App 和小程式一度无法正常使用,用户需要排队等待。
但月之暗面的困境,对于作为后来者的大厂们而言并非难题。亿欧智库 2022 年 3 月的数据显示,中国互联网企业的平均获客成本在 380-580 元之间。
可以说,Kimi 人均不到 20 元的获客成本,对于大厂而言,反倒是用更低的获客成本,找到了新的流量入口。
而在服务质量上,算力资源、人力资源充足的大厂,更容易输出稳定的服务。而在技术上,一名 AI 从业者告诉 36 氪,将可以处理 1000 万字的通义千问后和 Kimi 比较,可以发现同等文本的解读,通义千问的总结完成度略高一筹。甚至于,360 的长文本功能,增加了摘要和思维导图的能力。
但后来者的劣势,也恰恰在于失去了先发优势和辨识度。
当面向庞大的 C 端用户,亮眼的营销手段显得格外重要。被当成过河搭石的 Kimi,胜在有一个别出心裁的亮相,早早就贴上了 " 长文本 " 的标签,在一众大模型模糊的面孔中打出了差异化。至少提到 " 长文本 ",用户腦海中最先跳出的,大概率是月之暗面的 Kimi。
而大厂的包袱,还在于要为用户提供更完整、更复杂的产品体系。不少体验过各家大模型产品的用户都告诉 36 氪,大厂模型产品的 UI 设计、插件生态很复杂,功能过多,导致用户的需求要经过多步操作解决。但 Kimi 的界面很简洁,对于用户而言,使用门槛反而降低了。
Kimi 首页。
Kimi 的爆火已经为商业化创造了时机。月之暗面表示,有用户反映是否可以用付费解决等待的问题,今年公司会有初步的商业化方案。
只是找到合适的商业模式,证明自身的造血能力,是月之暗面接下来面临的考题。面对异军突起长文本之战,当 Kimi 在用户前构筑了一道付费墙,能否贴牢 " 长文本第一家 " 的标签,还未可知。
欢迎交流