大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

围剿Kimi,只是大模型“新赛季”play的一环

2024-04-04 简体 HK SG TW

今天小编分享的科学经验:围剿Kimi,只是大模型“新赛季”play的一环,欢迎阅读。

大模型巨头 " 围剿 "Kimi 的战役,已经进行了一段时间了。想必读者们已经从 Kimi 带来的震撼中冷静下来,开始理性审视 2024 的大模型 " 新赛季 "。

毫无疑问," 卷 " 长文本,是基础通用大模型在新赛季的首个赛点。3 月 18 日,月之暗面宣布 Kimi 智能助手支持 200 万字超长无损上下文,并开启内测。200 万字是什么概念呢?《红楼梦》等古典名著、企业财报等专业文献,Kimi 都能 " 手拿把掐 ",展现出了极强的理解分析能力。

打擂台容易守擂难。Kimi 这位新秀的亮相固然惊艳,但其他更早问世的 TOP 级基础大模型,也都不是吃素的,很快百度文心一言、阿里通义千问,都宣布跟进长文本能力,直接卷到 1000 万字。

Kimi 突如其来的热度、巨头的积极反扑、长文本赛事的狂飙,无不说明基础大模型已经进入了新赛段。

Kimi 不是来终结比赛的,而是来加入这个家的。而去年仓促备战、紧跟 ChatGPT 的第一梯队厂商,如今也对大模型的商业化前景、落地方向等,有了更成熟的思考。

Kimi 掀起的 " 长文本之战 ",只是大模型 " 新赛季 "paly 中的一环,接下来还会有哪些看点,我们来预测一下。

Kimi,终结不了比赛

月之暗面(Moonshot AI)是大模型赛道上,第一波获得较大规模融资的明星创业公司。而相比同时期动作不断的 AI 大厂如 BAT、明星企业如百川,月之暗面直到去年 10 月才交出了第一份成绩单 Kimi,颇有种 " 谋定而后动 " 的味道。

从参数上看,Kimi 的长文本能力超越了当时的谷歌 gemini 1.5、Claude3,处于全球领先水平。

从市场动作看,Kimi 的宣传,也不像其他基础通用大模型厂商那样谨慎,而是大规模投流,广告铺天盖地,在 B 站、抖音、小红书等平台都有信息流投放。据媒体报道,Kimi 每天获客成本都在 20 万,正在 " 烧钱换规模 "。

从实际效果看,有大量个人用户和企业开发者在使用 Kimi 后表示,其在中文上的理解、分析、问答能力,确实优于当时主流的国产大模型,上下文衔接更好,总结能力更强。

几重因素叠加,更新后的 Kimi 引爆了资本市场的新一波热情,甚至出现了 "Kimi 概念股 "。

那么,Kimi 能 " 乱拳打死老师傅 ",一举终结基础大模型的比赛吗?子弹飞了这么久,结果已经很明显了,不能。

一方面,随着用户规模的增多、应用场景和用例的增加,Kimi 的能力局限越来越多地暴露出来,比如有用户提到,Kimi 的编程能力跟 ChatGPT、GLM4、文心一言有很大的差距,ToC 场景下长文本处理的需求并不高频,新鲜感过了之后,感觉没有其他太大用处。

同时,Kimi 视为核心差异化优势的长文本能力,并不构成真正的护城河。从其他巨头很快就跟进并上线了相关能力,就可以看出,长文本处理技术的壁垒并没有很高,能做基础通用大模型的头部厂商,都有相关技术和人才积累。

而过去一年 AI 大厂在多模态大模型、智算基础设施、ToC 应用、Tob 客情关系等多个维度构筑起的壁垒,则是月之暗面很难快速追赶的。比如,目前月之暗面还没有发布多模态大模型,云服务运维跟不上,难以保证 B 端用户的体验。

目前 Kimi 面向大众免费试用,但其付费 API 的定价,有的版本几乎达到了 GPT-3.5 等领先大模型的数倍,后续付费转化也要打一个问号。

总的来说,Kimi 是月之暗面在大模型技术上的一次成功 " 秀肌肉 ",但别说直接终结比赛,要跻身 " 可规模落地大模型 " 这一赛道的 TOP 席位,恐怕为时尚早。

新赛季," 遭遇战 " 告一段落

有读者可能会问,既然大厂有做长文本处理的能力,为什么去年不卷,非要 Kimi 火了之后才卷?

所以说,Kimi 爆火是一个很好的契机,标志着中国大模型已经从仓促备战的 " 遭遇战 ",进入到了步步为营的 " 阵地战 "。

简单来说,2023 年 ChatGPT 横空出世,中国的 AI 大厂是在猝不及防的情况下,极短的时间内统筹资源、组织人马,快速跟上 OpenAI 的技术进展,一度出现了 " 大模型日抛 " 的局面。这时候最重要的是争取主动,避免中国 AI 在大模型浪潮中缺席。文心一言、讯飞星火、腾讯混元、华为盘古、百川智能、智谱 AI 等一大批基础大模型厂商和初创机构,确实让中国在 " 遭遇战 " 中拿下一城。

狂奔一年,无论海内外都对大模型有了更清晰,也更务实的认知。中国的基础大模型厂商,已经开始 " 高筑墙、广积粮 ",逐步进入到充分准备、保障严密、战略稳定的 " 阵地战 " 了。

为什么之前不卷长文本,Kimi 出现又快速集体围剿?恰恰是新赛季 " 阵地战 " 开始的信号。

信号一,不打没意义的仗。

国内基础大模型的竞争基本告一段落了。

随着 Sora、Claude3 等开源或闭源大模型都越来越强大,基础通用大模型的投入门槛也更加高昂,不能长期拿出天文数字来卷的都心生退意,转而去挖掘垂直场景和细分行业的机会,这也让头部厂商的认知度和市场认可度更加稳固。

基础大模型厂商也开始精打细算,关注如何从硬體中压榨出更多算力、降低部門推理成本、构建可持续的国产算力、挖掘商业化项目潜力等。而长文本处理要消耗大量的硬體资源,平白无故瞎卷,烧钱费力还未必讨好,确实没必要。

但 Kimi 的爆火,更多是让 ToB 场景,尤其是金融、政务客户,看到了大模型的应用价值,读财报、读合同、做客服,更长的文本确实能在这类知识密集型场景,发挥出更好的效果,减少幻觉问题。这代表了基础模型的底层能力,所以 Kimi 的长文本之战,必须打。

信号二,竞争更加立体复杂。

2023 年末,大模型热度已经开始降温。应用侧落地困难,所谓的杀手级 AI 应用似乎还是没有出现,而投入成本持续加码,基础模型一更新就会覆盖创业者的工作,导致投资市场态度也偏向谨慎。于是,很多人开始质疑这一波大模型只是自嗨,唯一赚钱的只有卖铲子的英伟达,焦虑情绪开始弥漫。

这时候,Kimi 作为一款现象级产品,确实打破了僵局。

作为一个有实际意义的应用层产品,Kimi 让大众再一次感受并认可了大模型的价值。根据产业规律,应用爆发往往会在产业基础平台条件具备之后的一两年内出现,Kimi 正处于这一时间轴的关节上,标志着 AI 应用爆发即将开始。

Kimi 对大模型价值的再度确认,也会让接下来的通用大模型竞争,从卷参数、卷 benchmark 等基础项 PK,进入到更加复杂、多元的能力角斗。

信号三,跑马圈地白热化。

这一竞争阶段," 遭遇战 " 时的灵活、机动、大干快上,就不太管用了,而需要细致部署、步步为营,跑马圈地。

对 Kimi 的围剿说明各家基础大模型厂商的底层能力,会很快趋同。除非像 OpenAI 那样,技术的飞轮效应极强,跟竞争对手的差距越拉越大,否则,技术天然会扩散,很难长期成为商业秘密与护城河。

坏消息是,国内的基础大模型,想要建立差异化优势越来越难,没有人能获得垄断地位;好消息是,政企客户更希望构建 " 模型花园 ",根据需要调用多个大模型,减少对单一供应商的依赖,所以市场仍在增长,仍然开放,大家都还有机会。

(企业希望引入的模型数量)

a16z 调研了七十多位财富 500 强企业和顶级企业领袖,发现这些公司 2024 年在 AI 上的支出预算比 2023 年增加了 2-5 倍。国内市场的智能化速度也不会逊色,更增强了对基础大模型的需求,所以接下来,会进入到白热化的跑马圈地阶段。

大模型新赛季,正式拉开帷幕。

长文本

只是 " 阵地战 " 的一环

长文本,是 " 秀肌肉 " 的必争之地,但解决政企客户的切实需求,长文本却未必那么实用。从 Kimi 的长短板,我们可以看到目前市场更需要怎样的大模型。

首先说说短板。前面提到了,Kimi 的长文本在很多场景下属于低频需求,再长的 token 只会带来更大的计算量、更高的资源成本,对用户来说性价比不高。对此,吴恩达也认为,快速生成 token,可能比使用更强的模型更重要。长文本处理导致的硬體资源需求、GPU 短缺和云服务能力,也是 Kimi 面临的现实挑战。

而 Kimi 的长板在于,在文本摘要和知识管理等任务中,发挥出了极高的生产力效能,对企业的吸引力很大。应用更友好,企业不需要从头开始训练自己的 LLM。

所以,长文本之战引发的连锁反应,会让一些能力,成为 battle 重点:

1. 与云的深度融合。Maas 服务会成为模型购买决策的首要原因之一,继续深化、细化。

2. 对 Agent 开发的支撑。基础大模型很难提供所有端到端的解决方案,长文本处理是应用层公司的舞台,通过基础大模型 +Agent 式工作流,去解决客户的专有问题。而 Agent 式推理拼的是 token 生成速度,而非文本有多长。试想一下,如果一个金融客服助手半天憋不出一段话,即使生成的效果再好,用户也不会有耐心等待。所以,长文本能力并非应用型企业选择基座模型的唯一标准,甚至不是最重要的标准。

3. 生态规模。Kimi 的爆火说明,大厂不可能垄断所有应用方向。利用新的技术能力(如长文本处理)来解决新的问题,创业公司和个人开发者更具备贴近客户、深入场景的优势,为各类行业用户的特定需求进行微调、定制。大模型的商业城池,必须由众多生态伙伴一起来守,谁能在 2024 奠定生态的规模优势,是接下来博弈的关键点。

总的来说,大模型落地,是一个复杂的系统工程。2024 进入 " 阵地战 " 的大模型市场,准备更加充分,作战更有条理,商业化战略也日益清晰。基础模型厂商,将在一次又一次的迎敌与防御中,构筑起系统性的攻防能力。

一个平台级的大模型公司,一定会是万亿级别,也一定会诞生在中国。让我们拭目以待。

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們