大模型应用，必须警惕“速成幻觉”

今天小编分享的科学经验：大模型应用，必须警惕“速成幻觉”，欢迎阅读。

我们知道，大模型会编造不正确的答案，产生 " 幻觉 "。

其实，在应用层面，还存在一个更隐蔽的 " 幻觉 "，就是创业公司忽略了大模型落地所需要的长周期、重基建和工程化难度，带来的 " 速成幻觉 "。

随着 " 百模大战 " 拉开序幕，大模型过剩带来的市场挤压，也给整个大模型生态带来了行业洗牌的风险。

越来越多的人有了共识，基础通用大模型竞争激烈，注定是少数人的游戏。创业公司随时可能倒掉，造成项目烂尾。

具备技术、产品和行业优势的 " 第一梯队 " 大厂，比如百度的文心大模型 3.5，已经跟国内其他模型拉开了差距，具有了一定的先发优势和市场打开度，更容易在这场白热化竞争中生存下来。

既然大模型很难 " 速成 "，那么创业公司的 " 幻觉 "，又是从何而来的呢？

第一种 " 幻觉 "

开源干翻闭源

创业公司纷纷入局大模型，给它们勇气的，不是梁静茹，而是开源。

以 Meta 的 Llama 2、智谱 AI 的 ChatGLM 为代表的开源大模型，陆续免费并支持授权商用，这无疑是一件好事，让创业公司不用重复造轮子，可以用开源大模型作为基座模型，快速开发出相应的商用版本大模型或大模型应用。

开源的低门槛、低成本，带来了 " 开源干翻闭源 " 的幻觉。

为什么说是幻觉？我们可以从企业视角为出发点——即使有了开源模型，想要落地应用大模型，还有哪些必要条件？

一是云基础设施。

大模型落地需要进一步微调、训练、运行，要在云平台上运行。而创业公司跟 OpenAI 、百度等闭源头部公司的一大差距，就在于缺少跟云平台的 " 紧耦合 "。

众所周知，OpenAI 有微软的大力支持，百度文心大模型背后是百度智能云，这些大厂自研大模型，都对云基础设施的计算硬體集群、资源调度等，进行针对性的协调优化，大模型 +AI 云的紧密配合，可以更高效地利用计算资源，降低大模型的边际成本。

海外大模型开源社区的 " 明星 " 如 Together 会为企业客户提供开源模型及配套的云平台，MosaicML 也提供 Mosaic Cloud 和多云混合服务，国內的开源项目如 ChatGLM，也选择与多家云厂商合作。

可以看到，开源项目跟云平台的 " 松耦合 "，会受到云平台的配合度、商业政策等的影响，一旦后期出现资源涨价、利益抽成、研发意向变化，都会给基于开源的大模型项目带来商业化风险。

其次，是二次开发。

基于开源模型的创业公司，往往是在底座模型的基础上做一些微调，灵活有余，但开源模型的分支多、变异快、创新迭代速度快，不承诺任何确定性，一般由程式员自组织来完成开发，这就导致基于开源的大模型稳定性不足，对客户技术团队二次开发能力要求很高，选型难度也很大。

目前看，第一梯队的大厂推出的基础大模型，更能满足企业对大模型稳定性、可靠性的需求。

因为闭源大模型，遵循的不是开源范式，而是工程范式，所以，会以保证开发质量为前提，对用户需求进行明确的描述，组织工程师按照规范的开发流程和周期，以确定的时间和预算，更好的控制开发质量，保证开发效率。

开源是一件好事，但开源并不是一把万能钥匙。如果不解决基础设施、二次开发等瓶颈，创业公司也无法靠开源，快速取得成功。

第二个 " 幻觉 "

三五个人干翻大厂

因为开源，创业公司和互联网企业都可以叫卖大模型，这就产生了第二个 " 幻觉 "：三五个人的创业团队，就能干翻 AI 大厂。

需要注意的是，" 百模大战 " 带来了白热化的淘汰赛，同时，大模型还在以周为部門进行迭代。

在激荡的市场竞争中，具有长期研发能力和投入意愿的大厂，更容易保持动态的生长力和持久的话语权，体现在几个方面：

一是模型本身的技术城池。

谷歌研发人员此前曾发文称，因为开源，谷歌和 OpenAI 都没有护城河。这在长期看是对的，但大厂在大模型技术上的领先性，也是现实存在的优势，这个技术代差，足以在大模型的商用周期中，为大厂带来显著的竞争优势。

而且，大模型具有数据上的 " 飞轮效应 "，更早应用、更多用户的大厂大模型，会不断拉大效果差距。比如国內最早推向大众的文心大模型，其 3.5 版本已经在一些基准测试中，超过了 GPT3.5 的表现，而宣称达到 GPT-3.5 的 Llama 2 刚开源不久，因此目前国产开源大模型最多也就达到 GPT-3 的水平。

二是持续迭代的成长能力。

大模型落地不是一蹴而就的，企业应用大模型也不能上马后很快不了了之，后续的算力成本、数据工程负担、每一次迭代的资金压力，很快就成为困扰很多大模型公司的头疼问题。

目前，已经有不少曾经想走商业闭源路线的大模型创业公司，直接宣布退出竞争。光年之外中途离场，被美团接手；Hugging Face 专注卖算力资源和咨询业务，做大模型更多是 " 面子工程 "。科大讯飞等企业的财报表现，也会直接影响到市场对其 " 是否有钱继续做大模型 " 的信心。

从成长性看，有资金实力、基础设施完整、商业表现良好的大厂，才能陪企业用户走得更远。

比如 " 文心一言 "3 月 16 日推出以来，在一个月内完成 4 次迭代，将推理成本降为原来的十分之一，离不开百度在大模型上的长期投入，以及人、钱、卡、基建等多种方面的储备，才让文心一言可以持续进化，在高速迭代的大模型竞争中保持领先。