今天小编分享的科技经验:AI大模型落地,为什么是央国企先行?,欢迎阅读。
产业互联网第一媒体。 产业家
从 2024 年 1-7 月,央国企采购大模型项目数量已超过 950 个,且均匀布局在智算中心、大模型预训练、Agent 和行业应用等多个方向。而除了政策影响,央国企纷纷落地大模型的背后还有哪些推动因素?
作者 | 思杭
编辑 | 皮爷
出品 | 产业家
最高 191 亿元,最低不到 1 万元。大模型狂飙两年,国内 "AGI 阵队 " 已然形成。同步进行着的,还有央国企的大模型项目建设。
8 月 6 日,神州数码集团发布公告表示,子公司神州鲲泰得標《中国移动 2024 年至 2025 年新型智算中心采购(标包 1)》,投标报价约 191 亿元,得標份额 10.53%。2024 年 7 月,湖南省委党校湖南行政学院发布招标信息,采购数字机器人服务,报价 9000 元。
一个是智算中心采购,一个是数字机器人服务;可以看到的是,如今在央国企内部,大模型项目建设已行至中途。甚至毫不夸张地说,在大模型浪潮席卷而来的今天,央国企正在成为一股先行力量,推动着国内大部分的 AI 大模型落地项目。
据不完全统计,从 2024 年 1-7 月,央国企采购大模型项目数量已超过 950 个,且均匀布局在智算中心、大模型预训练、Agent 和行业应用等多个方向。
大模型纷纷落地国央企,阵势如此浩荡的背后,政策推动成为决定性因素。据沙丘智库,自 2023 年以来,国资委多次对中央企业发展人工智能提出要求。其中,在 2024 年 2 月的中央企业人工智能专题推进会上,提出中央企业要 " 开展 AI+ 专项行动 "。会上就有 10 家央企签署倡议书,表示将主动向社会开放人工智能应用场景。
同年 7 月,国新办举行 " 推动高质量发展 " 系列主题新闻发布会,提出未来五年,中央企业预计安排大规模设备更新改造总投资超 3 万亿元,更新部署一批高技术、高效率、高可靠性的先进设备。
政策的推动,当然是其中不可忽视的因素。但除了政策影响,站在产业数字化和数智化的潮头,央国企纷纷落地大模型的背后还有哪些推动因素?一个更值得思考的问题是,和云计算时代金融行业成为先锋官不同的是,在如今的 AI 大模型时代,为什么央国企会成为先行力量?
一
运营商、政务、能源抢先建设智算中心
AI 大模型史上最大项目,当属 " 智算中心 "。
预训练成本的疯狂上涨和推理需求的不断攀升,都在让智算中心成为必要。近日,OpenAI CEO Sam Altman 在接受采访时表示,"OpenAI 在年内不会发布 ChatGPT-5,目前公司专注于 ChatGPT-o1 的研发和运营。"
GPT-5 为什么不发了?原本预计推迟发布的 o1 又为什么提前登场?这背后的原因不由得引人深思,而训练成本就是这其中的关键因素之一。
言归正传,国内对大模型的预训练需求也愈加迫切。在加速构建国内 AGI 梯队的同时,性能不断刷新的大模型需要大规模智算集群的支撑。如今,万卡集群已然成为大模型军备赛的标配。而除了国内 AI 企业和电信运营商,正在推动落地的央国企也在加速构建智算集群,以提高 AI 大模型的训练及推理效率。
通常来讲,智算中心是由地方政府或电信运营商主导建设。据中国信通院不完全统计,截止 2024 年 7 月底,纳入监测的智算中心(含已建和在建)已达 87 个。
2023 年 10 月,沈阳智能计算中心新基建项目工程总承包(EPC)成交结果出炉,百度携手中国建筑第八工程局有限公司(中建八局)成功得標,得標金额为 9.1 亿元。具体包括机房建设、机柜设计、智算中心平台,以及百度为其提供的 AI 软硬體能力的综合性解决方案。
而像这样的智算中心采购项目,央国企已经开始了铺天盖地的建设。对此,产业家根据金额大小,列举了近两年央国企采购智算中心项目金额最高的 10 个。
对比云计算时代,传统数据中心的得標方大多都是 IDC 厂商;而在如今的 AI 时代,则多了不少 AI 企业和互联网厂商的身影。
另外,从行业分布来看,政务和运营商对智算中心的出资则更加大手笔。对此,产业家统计了运营商、能源和政务三大领網域中智算中心项目的占比:结果显示,政务行业对智算中心的投入更大,其中包括 GPU 租赁、硬體以及算力调度平台的采购。
实际上,从智算中心投入比就可以看出央国企对 AI 大模型的需求。
可以看到的是,自 2023 年三季度,央国企就已经开始紧锣密鼓地筹备智算中心建设。而智算中心只是央国企落地 AI 的一个起点。
一方面,这与上文提到的政策时间点正好吻合;另一方面,2023 年第三季度也恰好是以百度、阿里、华为和电信运营商为首的 " 国内 AGI 梯队 " 刚刚形成。
除了智算中心,央国企对 AI 大模型建设的另一个重点则是行业应用,即针对特定场景搭建大模型平台或应用。
以电信运营商为例,据不完全统计,从 2023 年至今,运营商对 AI 大模型的项目建设达到了 238 起,其中除了 75 起智算中心建设外,剩余都围绕特定的场景构建大模型,主要有智能客服、营销和数字人方面的采购。
不同行业对于 AI 大模型的需求不同,项目重点自然也不一样。对于政务和运营商行业而言,之所以智算中心占比更大,除了政策推动,更重要的原因是对于私有化部署、本地部署的需求极高,尤其是政务领網域;另一方面,相对于其他行业针对单点或各别环节的大模型应用开发,政务和运营商对大模型的需求则更为系统化,更需要从 GPU 资源到算力调度平台来发挥作用。
相比之下,在应用 AI 大模型最多的三个行业中,能源领網域对智算中心的投入较少,而更多围绕大模型训练和开发方面,尤其是针对特殊场景如何训练并优化算法,如何微调模型等等。
另外,值得注意的是,对于这些对行业 know-how 要求更高的领網域而言,他们选择得標方的时候也更为讲究;比如在挑选算力调度平台和大模型预训练、开发阶段时,得標方则围绕以百度、科大讯飞为首的 AI 企业;而在选择在大模型开发过程中,需要特定技术研究时,则会选择南方电网这类更懂 know-how 的企业。
最后,不同于云计算时代,金融行业成为头部落地试验田;在如今的 AI 大模型时代,在央国企当中,有四大行业脱颖而出,分别是教育、能源、运营商、政务;而金融行业却并没有表现出像云计算时代那么强的意愿。
二
AI 大模型:颠覆传统 IT 架构背后
时代变迁。
在过去的云计算时代,大型企业进行数字化转型需要从购买或租赁伺服器,到选址建数据中心,再到选择合适的云架构,接下来到平台开发环节及上层应用的搭建。
通常来讲,一家大型企业,如能源或工业企业来说,面对分布在各环节的数据,通常需要建底层的 PaaS 平台,从而实现灵活调用、互联互通;但尽管如此,数据孤岛、数据烟囱依然存在。
然而,这种从 IaaS 到 PaaS 再到 SaaS 的架构,在如今的 AI 大模型时代已经彻底被颠覆。企业往往需要一个行业大模型即可搞定,而不再会为了构建多个复杂应用,费时搭建 PaaS 平台。
诚然,企业在云计算时代交得学费也并没有浪费,在 AI 大模型时代,央国企在政策引导、需求迫使和环境因素等多方作用下已经开始先行落地 AI 大模型。
而在这其中,很大一部分都是基于过去云计算时代一些无法解决的顽疾,希望在 AI 大模型这里找到更好的解法。
可以观察到一个现象,目前央国企在大模型落地方面,主要围绕两点,一个是智算中心,一个是行业应用。后者包括大模型预训练,大模型开发,以及针对各别环节或特定场景构建大模型应用或解决方案。
通常来说,后者通过大模型基于特定场景的解决方案,都是在过去云计算时代无法实现的。
以运营商为例,虽然智能客服已经存在很多年,准确地说,自云计算时代以来,各类智能客服軟體和解决方案层出不穷,然而对于整个行业来讲,转人工率依旧居高不下,普遍都在 80% 以上。而当时代的列车刚刚驶入大模型时代,智能客服就成了大模型落地的第一块试验田。
再比如在能源行业,知识如何沉淀,再如何让新人用起来,一直都是一大难题。即使在云计算时代,工业互联网平台林立,很多问题依旧没有答案。而在如今的大模型时代,一个行业大模型便可以解决很多问题。这其中关键发挥作用的便是在行业大模型构建过程中的 RAG 搭建环节,它相当于一个企业知识库,任何输入的知识,都可以轻松调用。
像上述所展示的,对于某些行业来说,大模型并不是 " 鸡肋 "。相反,它能够扮演 " 超强大腦 " 的角色,将企业的全部智慧汇聚到一起,并有的放矢地发挥作用。
然而,对有些行业而言,大模型目前还并未找到用武之地。
比如在金融行业,目前落地较多的项目主要围绕知识库问答方面,很难深入到核心业务。一方面,是出于金融监管和数据隐私等顾虑;另一方面,也是更重要的,目前 AI 幻觉问题还很难彻底得到解决,任何 AI 算法可能为金融行业所带来的错误预测和建议,都可能带来重大经济损失。
而无论是智能客服还是行业大模型,无论是政务领網域,还是运营商或能源、政务、教育等行业,在央国企先行落地大模型的背后,有三点核心原因。
首先,在大模型时代,央国企多年积累的数据得以发挥作用,他们不仅仅包括像财报报表、交易记录等已经做好归纳整理的结构化数据,还包括一些重要的企业资产,如散落在各个系统内部的聊天记录、檔案、图片等等,如今这些非结构化数据都可以在 AI 大模型中,变成 " 企业知识库 ",并发挥其价值;
其次,不同于过去云计算时代从 IaaS 到 PaaS 再到 SaaS 的三层架构,大模型有着很强的协同性,只需在前期大模型开发阶段做好训练和微调,后期即可直接基于数据进行前端行为的加持。
最后,也是很重要的一点,央国企本身就有庞大的伺服器集群,其自身具备强大的算力基础,基于这些基础可以更好地推进大模型落地。
三
竞争点:预训练、安全及行业 know-how
从得標情况来看,可以毫不夸张地说,央国企撑起了国内大模型商业化的半壁江山。
然而,大模型落地进程行至中途,仍然有很多问题亟待解决。
据中信建设证券数据显示,2024 年 -2027 年全球大模型推理的峰值算力需求量的年复合增长率为 113%,远高于训练的 78%。而预训练成本和推理成本的叠加,也推升了整个 AI 基础设施的市场份额。
据艾瑞咨询推算,2023 年中国 AI 基础数据服务市场规模为 45 亿元,预计到 2028 年,其市场规模将达 170 亿元,且未来五年的复合增长率为 30.4%。
这同时也解释了近两年央国企抢建智算中心的原因。然而,阻挡大模型落地进程的还不仅仅是算力资源短缺。
虽然大模型时代已经颠覆了过去从 IaaS 到 PaaS 再到 SaaS 的传统三层架构,但在新时代下,新的架构也迎来了一些新的挑战,比如从 AI Infra 到 MaaS,再到上层的 AI 应用,中间涉及很多模型搭建的环节,这些都需要大模型服务商与企业一同探索落地路径。
对于央国企来说,用 AI 大模型赋能虽然已成为共识,但怎么用大模型,具体把大模型加在哪个环节,大模型如何发挥作用,以及如何开发和训练大模型,面对这些问题,企业并没有太多头绪。因此,这就给 AI 大模型供应商提出了更高的要求。
在这过程中,供应商是否掌握行业 know-how,在有些时候甚至可以成为能否拿下标的的关键因素。对此,以百度、华为、科大讯飞为首的 AI 大模型企业,都不约而同地在 2024 年扛起 " 行业大模型 " 的大旗。
据统计,在能源领網域,2024 年上半年就出现了不少预训练过程中某项技术研究的投标项目。
另外,值得注意的是,随着 AI 应用走向深水区,数据安全、数据共享和数据溯源等问题则开始被一一搬到台面上。据悉,10 月 9 日,中办、国办正式发布《关于加快公共数据资源开发利用的意见》,提出到 2025 年,公共数据资源开发利用制度规则初步建立;到 2030 年,公共数据资源开发利用制度规则更加成熟,资源开发利用体系全面建成。
虽然如今的 AI 大模型已经可以让数据溯源成为现实,但其中的责任划分和数据安全等等问题,还需要 AI 服务商和企业一同探索。
最新视频号内容推荐
产业 AI 大模型
产业数字化
产业 SaaS
产业供应链
产业硬科技
© 往期回顾
▼
产业家网全新上线
© THE END
/
欢迎爆料