明线与暗线：读懂云厂商鏖战大模型

今天小编分享的科学经验：明线与暗线：读懂云厂商鏖战大模型，欢迎阅读。

天气转凉，夏天即将过去。如果有人问，云计算厂商在这个火热的夏天做了什么。答案是，他们做了三件事：大模型、大模型，以及大模型。

7 月，在华为开发者大会 2023（Cloud）期间，华为云公布了盘古大模型 3.0，随后进行了生态等方面的更新。而在此前更早时候，阿里云公布了通义千问大模型，并在 8 月 3 日宣布其正式开源。

来到 9 月，云计算厂商的大模型发布更加密集。9 月 5 日，百度智能云在 2023 百度云智大会发布了千帆大模型平台 2.0，进一步集成百度的文心系列大模型，只隔两天，腾讯就在 2023 腾讯全球数字生态大会发布了混元大模型，其主要出口则是腾讯云。

至此，中国几大云计算厂商可以说是在大模型领網域重兵集结。相较于 AI 算法公司与研究机构，云计算厂商做的大模型更贴近产业与应用的一线，而且大模型与云厂商原本的业务体系、营收模块有着相对复杂的关系。因此，云厂商的大模型之争，绝不是简单的模型之间技术对比。

那么，云计算大厂做大模型究竟是为什么？云 + 大模型之战的决胜点在哪？

本文中，我们希望通过多个层次的对比与梳理，和大家一起解答这个问题。

首先要明确两个前提：一是伴随着各行业 IT 投入的降低，云计算厂商普遍面临着增速放缓，营收不利的情况。根据 IDC 报告预测，未来五年中国云计算行业的平均增长速度将下调 10% 左右，云计算厂商的正在普遍降低业务预期。因此，大模型突然爆火，对于云计算行业来说是难得的視窗，这个机会或许利益没有想象中大，但目前也不得不做。

另一个情况是，从用户界面来看云 + 大模型的需求是十分复杂的。有的用户需要直接调取模型，有的用户需要 AI 算力来自己训练模型，还有用户需要大量的模型定制化与解决方案集成。因此云厂商做大模型并不是很多人想象的短兵相接白刃战。大模型相关业务，需要面向多个市场，多种商业模式。这场赛事更像是一场阵地战，各个战略节点都不能出现缺口。

在这场大模型鏖战的各个层面，都有一条明线和一条暗线在牵引着局势的发展。

IaaS 层：明线堆卡

暗线启动国产 AI 算力

大模型带给云计算厂商最直接的变化，其实并不来自于模型本身，而是大模型火了之后，涌现出来的大模型热潮需要庞大的 AI 算力。大模型数据规模巨大，且训练模型需要专属的 AI 算力，这就给云计算服务商短期带来了用云量的更新。在云计算 IaaS 层市场整体相对低迷的情况下，大模型的出现也算是注入了一针强心剂。

这个层面上云计算厂商的竞争节点，用一个词概括就是 " 堆卡 "。谁能提供充沛少排队，且尽量价格低廉的 AI 算力，谁就算赢了。而 AI 算力的来源主要是英伟达的 GPU，于是就出现了云计算厂商买空市面上 GPU 的现象，以及 " 云厂商都是给英伟达打工 " 的说法。

但不管怎么说，云计算厂商在 IaaS 层的堆卡竞赛都不会结束，大量用户依旧会以计算成本和计算效率来作为选择公有云 AI 算力的考量依据。这个层面上，云计算厂商就需要提升在计算集群性、计算兼容性方面的能力，尽量发挥出每一张 GPU 的价值。

比如说，百度智能云就承诺在万卡集群训练大模型时，有效训练时间达到 95% 以上，从而降低用户的训练时间成本，实现更好的计算加速比。阿里云则提出了能够支持高达十万卡 GPU 的单集群规模，可让多个万亿参数大模型同时在线训练。

而在堆卡这条明线之外，云 + 大模型在基础设施层的竞赛其实还有一条暗线，就是 AI 算力的国产化。

不久之前，英伟达高端 GPU 面向中国市场供应链不稳定的消息沸沸扬扬，后来又传出了 " 中国特供版 GPU" 价格贵、性能低的问题。这些现象愈发让各界看到了 AI 算力走向自主可控的必然性。

在这轮大模型热潮中，AI 算力的国产化与云上获取从趋势变成了现实。其主要方式有两种，一种是云计算厂商兼容更多的国产芯片，提供多样化的 AI 算力。比如腾讯云、百度智能云等厂商都在强化自身的国产软硬體兼容性，并且构建 AI 计算的相关生态。

在这一点上，华为云拥有天然的优势。受到制裁后的几年里，华为逐渐将自主 AI 计算生态做大做强，已经成为国产 AI 计算中比较成熟的一支。伴随着盘古大模型的更新，华为云同时宣布将提供自主化的 AI 云服务，为大模型训练提供算力底座，这意味着华为的自主化 AI 算力正式由线下走上云端。

强调大模型、AI 框架的自主可控已经是大势所趋。接下来，有理由相信公有云 + 国产 AI 算力的模式，将在宏观趋势的推动下持续向上。最终成为左右 IaaS 市场的关键变量。

模型层：明线 MaaS 落地

暗线降低订制化成本

从产业层面上看，大模型带给云计算的最大变化是什么？就目前情况来看，MaaS 的新商业模式是云厂商最为看重的一点。所谓 MaaS，是指云厂商直接向用户输送 AI 大模型，从而实现模型即服务。

至少在目前的开局阶段，各家云厂商对 MaaS 这个全新模式寄予厚望，甚至有厂商直接用 MaaS 替换了此前的 SaaS，似乎经历了久久为功之后，SaaS 模式终于要被云产业放弃了。这也难怪。毕竟在中国市场 SaaS 的客单价较低，但需要进行的定制化工作却很多，并且异常消耗后期服务。以大厂的综合成本来看，SaaS 始终难以摆脱食之无味弃之可惜的鸡肋定位。

既然如此，还不如转头拥抱更加火热的大模型。于是可以看到各个云厂商在 2023 年集体发力 MaaS 的新商业模式，并且为此做出了系列工作。

进军 MaaS 的第一阶段，云厂商主要布局在三个方面：

1. 基础模型要多且精，能够满足用户在 NLP、CV、多模态等几个大方向的多样性需求。同时，基础模型还是云厂商的大模型门面。基础模型的体验，决定着用户与开发者对云厂商大模型能力的第一印象。比如文心一言的火爆，就给文心系列大模型与百度智能云的 MaaS 服务带来了明显的品牌加持效应。

2. 重点领網域要重点覆盖，在可能被高频次调用的行业类别与应用类别上，厂商要尽量做出成熟的大模型，以及基于大模型开发的应用，尽量实现低门槛集成与开箱即用。比如腾讯云的行业大模型精选商店，既提供混元大模型，还上架了金融、文旅、零售等 20 多个领網域的行业大模型。行业大模型，已经成为 MaaS 模式的中坚力量。

3. 要提供充沛的工具能力。除了基础模型、高频定制模型之外，还有海量的大模型需求。这要求用户和开发者具备一定的开发能力，而云厂商需要提供模型精调、应用开发方面的工具链。比如百度智能云的千帆平台，就在模型之外还提供预制数据集、应用范式，以及其他帮助企业应用大模型的工具。

但看似如火如荼的 MaaS 模式，实则也隐藏了一个暗线问题：SaaS 不赚钱，于是转头拥抱 MaaS，但谁说 MaaS 就赚钱了呢？

云厂商做 AI 也已经很多年了。但结果往往是效果很好，利润很差。这其中的关节依旧在 SaaS 失速的那个关键原因上：定制化成本。

无论是企业应用 AI 还是现在应用大模型，本质上都难逃 AI 作为軟體的不确定性。不同企业之间的不同需求天差地别，加上 AI 在算力、数据与人才上都有极高的成本，任何定制行为都会产生一连串的连锁反应。专家下工厂听上去很美，但说一千道一万，工厂最终是无法负担专家薪资的。但如果不提供定制化，又会出现绝大多数 AI 需求无法被满足的尴尬。

于是，怎么从顶层设计阶段就降低 MaaS 模式可能产生的定制化成本，已经成了大模型一战最为核心的竞争暗线。

在这个方面，各家厂商的探索幅度与实现方式各不相同。比如百度智能云更倾向用预置模型、预置应用的方式来降低定制化。除了模型平台之外，百度智能云还发布了 "AI 原生应用 Family"，通过模型 + 大模型应用的模式让企业满足自身需求。

在这方面，目前探索幅度最大的是华为云。华为云的盘古大模型 3.0，从框架设计上搭建了一个 "5+N+X" 的三层架构。这个架构把大模型分为 L0、L1、L2 三层体系。其中 L0 层包括 NLP、CV、多模态、预测、科学计算五个基础大模型；L1 则是 N 个行业大模型，比如政务、矿山、金融等；L2 是面向各行业的细化场景模型，比如先导药物筛选、传送带异物检测等。

这个框架的设计理念，是用户和伙伴、开发者可以根据自身需要，调用不同等级的模型进行组合拼装，既可以直接调用集成模型，也可以基于模型进行精调，还可以获得由不同开发者训练的具体场景模型。这一思路的设计形式，就有了工业革命中模块化、零部件化的特征，而具体效果如何，还有待在产业中检验。

整体而言，云厂商在 MaaS 上最讨厌的就是定制化高、复用度低、后续服务工作量大的需求。这会把原厂有限的资源过度分散，最终回报难以达标。这也就是云计算行业经常讨论的 " 小作坊式 AI 开发 "。

在目前阶段，云厂是可以在 MaaS 上只投入，不产出的。但长远来看，从小作坊到流水线的改变能否实现，是决定 MaaS 生死的背水一战。

生态层：明线聚合众力

暗线开源之争

我们需要接着说大模型那个问题，定制化成本太高。正因为定制成本高，单一服务商的综合资源有限，因此云厂商必须把大量工作分包出去。要由合作伙伴来完成咨询、服务、分销等工作。否则原厂会被漫长的流程与巨大的服务成本反复折磨。这也就导致，在走向 MaaS 模式的时候，云计算公司比以往更加需要伙伴生态的搭建。

另一方面，云厂商在目前不仅需要伙伴，开需要尽量聚拢应用开发者。AI 大模型是个新东西，其能诞生的新应用模式具有很大的想象力。就像 iPhone 时刻有赖于大量的 APP 开发者，大模型这个 " 新 iPhone 时刻 " 也有赖于大量具有突破能力的 AI 开发者。为此，互联网大厂一方面在自己做应用，另一方面也需要聚拢更多应用开发者。因为任何应用火了，都会为提供基础模型与算力的云厂商带来一系列连锁效应。

这些因素综合起来，让云 + 大模型之战，在最开始就变成了一场生态争夺战。各个厂商可以说是摆开阵势，尽一切可能来吸引伙伴和开发者加入自身的生态体系。其中，基础措施是提供开发者与伙伴所需的技术与能力，进阶模式则是推动基于大模型的技能培训、应用开发大赛、免费资源、联合创业计划，在商业层面赋能伙伴和开发者。也有云厂商主张与伙伴进行全網域协同，联合创新，在细分市场与细分场景中以伙伴为主进行大模型落地。

而在如何吸引开发者、伙伴的生态之争中，隐藏暗线是一个非常具有互联网思维特征的命题：能不能干脆把模型开源免费，用极端降低成本的方式来吸纳伙伴加入？

这也是最近被热烈讨论的 " 大模型开源闭源之争 " 其来源之一。

支持开源者认为，免费就是最好的生态聚合策略，且靠免费引流的策略在互联网时代屡试不爽。加上 AI 大模型作为基础軟體，走向开源恐怕是早晚之事。

而反对者认为，大模型还处在刚刚发展的阶段。厂商需要持续投入大量研发成本进行更新，盲目的免费会导致大模型发展陷入停滞，搅乱科技进步秩序。并且大模型开源不仅能降低伙伴和开发者的成本，也会导致市场最终定价降低，摊薄伙伴的利润，最终导致企业不愿意投入研发创新。

不管怎么说，大模型开源与闭源的对垒，已经从产业探讨变成了云计算市场的现实。8 月 3 日，阿里云宣布通义千问开源，成为首个宣布大模型开源的中国互联网云厂商，并且阿里云打造的 AI 模型社区魔搭 ModelScope 还以开源、免费、可商用作为主要买点，提供国内外的各种开源大模型。

此后，究竟是越来越多的云厂商在鲇鱼效应下走向开源，还是依旧会保持高技术与低成本之间的对垒？让我们拭目以待。

以我个人观点来看，大模型的发展潜力还很大，可探索空间众多。处于发展中的技术其实并不适合快步走向开源，因此相当部分的大模型保持闭源商业模式，是一个更大概率事件。

解决方案层：明线首批大客户

暗线政企上云新視窗

无论说的多么热闹，其实企业直接通过 API 接口调用大模型，这种 MaaS 服务模式的利润并不高。甚至可以说，在目前 " 百模大战 " 的背景下，简单调用大模型变成了一件颇为廉价的事情。

而持续投入的云计算行业，显然不能满足于这种商业模式，因此必然要争取一些客单价高，利润大的项目。而政企大客户选用基于大模型的数字化解决方案，就成为了云计算厂商眼中的新机会視窗。

在众多类型的政企大客户中，又有钱，又有数字化能力，且愿意尽快探索大模型可能性的只有两类：智慧城市与金融。其他更偏向实体的制造、能源、交通等行业，则相对来说更加谨慎，还处在对大模型的观望了解之中。

因此，争夺政务与金融大客户订单，就成为了云计算厂商进入大模型赛道后的一个标准动作。比如我们可以看到在 2023 百度云智大会上，百度智能云发布了基于大模型的数字政府解决方案九州。华为云则在强化和推广金融、智慧城市等领網域结合盘古大模型的解决方案。

在可见的未来，云计算厂商除了在模型能力与模型平台的竞争之外，还将在以城市、金融为代表的重点领網域进行争夺。而回答好这些领網域为什么需要大模型，大模型能带来哪些与以往不同的价值，是云厂商必须回答的第一道考题。

在为大客户构建解决方案层面，也隐藏着一条暗线。这条线索直接关乎于云计算厂商的焦虑感：大型政企客户，不那么愿意上云了。

在几年前，大型政企上云是一种大势所趋，可谓是能上尽上，多上快上，但在目前阶段，政企客户更加强调数据与数字化系统的安全可控，盲目上云被认为并不可取。尤其是否能把大量关键数据放互联网云平台上，开始逐渐变成一种疑问。目前阶段，国资云、国家云的提法不断强化，即使上云，大型政企也会优先考虑以我为主，多云采购的策略，而这在无形中就分散了云厂商的利润空间。

在这样的背景下，云厂商对大模型的一个隐性期待，是能够让其成为推动大型政企继续上云的技术契机。毕竟在云上获取大模型，有天然的成本与可操作性优势。

因此，能不能更好展现出大型政企、重点实体行业部署大模型解决方案的重要性，同时打消政企在数据安全、自主可控、持续服务、品牌信任等领網域的疑问，就成为了云厂商鏖战大模型的另一道必答题。

事实上，云计算与大模型的结合，还有很多赛点可以讨论。比如大模型与 PaaS 的结合；云厂商在办公、网盘等 toB 应用结合大模型的情况等。整体而言，算力、MaaS、生态、大型政企解决方案，构成了云计算厂商能否在大模型之战中获得竞争力的四个层面。

无论对于哪家公有云厂商来说，这场竞赛的目标都是一致的：让模型有用，让成本下降，让 AI 成为盈利的起点

大模型最终会变成又一个鸡肋，还是新时代的大门？路漫漫其修远兮，云计算还需要上下求索。