“国家队”下场，大模型“卷”向新纬度

今天小编分享的科技经验：“国家队”下场，大模型“卷”向新纬度，欢迎阅读。

图片来源 @视觉中国

文 | 壹 DU 财经

大模型的风在吹了半年后，终于有了新方向。

7 月 7 日，在 2023 世界人工智能大会（WAIC 2023）上，由国家标准委指导的人工智能标准化总体组宣布，我国首个大模型标准化专题组组长由上海人工智能实验室与百度、华为、阿里等企业联合担任。

对于首批入选的 " 国家队 " 阵容，外界并不意外，毕竟大模型的发展，需要靠技术实力格外雄厚的玩家引领。而在国家明确他们的地位及任务后，国内大模型市场的风向，开始有了新变化。

狂飙半年，行业迎来 " 国家队 "

今年以来，大模型一路狂飙，速度超过了以往任何一项技术的发展进程。如果说在今年一季度，各个玩家蜂拥至大模型的入口，还在讨论 " 要不要做 " 的问题，到了二季度时，各家已经进化到具体 " 怎么做 " 的问题上来。

而这样的热闹场景，在 WAIC 2023 上迎来了高潮。这届大会超 400 家企业参展、30 多个大模型集中亮点，展区面积达到了 5 万平方米，创下了历届之最。

这场热闹的大会，不少人因为没有提前预约而无法进入大会现场。在被行业人士称为 " 规格 " 很高的大会上，网红马斯克、图灵奖三巨头之一的杨立昆、华为轮值董事长胡厚昆、香港中文大学教授汤晓鸽，以及学界、创业界的大佬们纷纷到场。

展厅内，大模型时代、生成式 AI、通用人工智能，这些在半年前还很陌生的词汇，如今成为展厅里随处可见的标志。

当然，大会现场的 30 余家大模型的玩家们，也并没有让外界失望，纷纷给出了自己对于大模型的解答。尤其是 " 国家队 " 成员的动作，更是令外界瞩目。

比如百度，作为国内首家宣布 All in 人工智能的厂商，其在大会现场的展厅格外吸引人。当然，在这个重要的场合，百度自然会展出让更多人能体验到的 " 镇馆之宝 "，这个被称为文心一格的产品，可以让进入展厅的观众实现 P 图自由。

华为则将其 " 全球最快 AI 训练集群 "Atlas 900 PoD A2 搬到了现场。华为副董事长胡厚崑称，使用 Atlas 900，人们只需 59.8 秒就可以完成典型神经网络 ResNet-50 在 ImageNet 数据集上的训练，在同等精度下比第 2 名快 15%。" 这相当于在短跑赛场上头名撞线，然后喝完一瓶水才看到第二名跑到终点。" 无疑，华为这场硬體端基础算力的实力大秀，使得行业人士和观众将视线从大模型的繁杂移至硬體端的比拼。

在阿里云论坛，阿里云 " 通义家族 " 再添 AI 绘画模型 " 通义万相 "，据称，该模型可辅助人类进行图文创作，未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团 CTO 周靖人在现场表示，这是阿里云大模型全面掌握多模态能力的关键一步，未来这一能力还将逐步向行业客户开放。

" 有钱、有人、有技术、有场景 "，这是大厂做大模型先天具备的优势，同时也是不少初创企业很难填平的鸿沟，甚至有人在现场直接指出，中国的大模型落地，只会在五家大厂之中，即 BAT+ 华为 + 腾讯。

但巨头们要怎么做？下一步会走向何方，这是一个很大的命题。

抛弃概念与情怀，巨头纷纷专注于场景落地

今年的人工智能大会，大模型成为当之无愧的顶流。

阿里通义、百度文心、华为盘古等国家队纷纷亮出自己的硬实力，同时，讯飞星火、商汤日日新、网易伏羲等 30 多个垂类大模型也没有输掉气势，在各自的领網域里埋头苦干。

但从现场的情况来看，他们似乎已经摒弃了大而空、讲故事、讲情怀的做法，转而开始专注于讲落地场景和案例。这是大模型前进的必由之路，同时也极有可能成为下一阶段的重头戏。

在大会上，华为云盘古大模型 3.0 正式发布，引来不少行业人士围观。更令行业印象深刻的在于，华为常务董事、华为云 CEO 张平安所言——盘古大模型很忙，忙着做事，没有时间作诗。而作诗，正是此前半年发布大模型的玩家们最爱干的事。

在张平安看来，华为希望盘古大模型可以帮助各行各业，如金融、政务、矿山、气象等，而非专注在语言大模型层面。据其透露，截至目前，盘古大模型已经在气象、医药研发、电力等领網域落地，并交付了多个千亿参数大模型。

同样把场景落到实处的还有百度。百度作为较早入局的玩家，早在四年前即发布文心大模型，只是当时行业对于大模型的关注度不够，以至于没有激起太多水花。但对于百度而言，文心大模型是先行业一步的超前布局。如今，这个前瞻的产品也收获颇丰。

在 WAIC 2023 现场，百度首席技术官王海峰称，现在百度已经更新到文心大模型 3.5 版本，较之此前的版本，效果提升 50%、训练速度提升 2 倍，推理速度提升了 30 倍。在成本上，更是降到过去的 10%。

" 把促进中国大模型生态的繁荣作为首要目标，向大模型创业公司提供全方面的服务 "。阿里云 CTO 周靖人如此说道。很明显，这延续了阿里云提出的 MaaS（模型即服务）概念。

在大模型领網域最晚入局的腾讯，最近 20 天内动作不断。6 月 19 日，腾讯首次公开透露对大模型的思考；6 月 26 日，首次披露自研星脉高性能计算网络；在 7 月 7 日 WAIC 2023 上，腾讯云副总裁、腾讯云智能负责人吴运声对外公开了腾讯在大模型应用创新的成果，并称，腾讯云行业大模型能力已应用到金融风控、互動翻译、数智人客服等场景中，提升了智能应用效率。

当然，细分领網域的大模型也展现出旺盛的生命力。旷视科技联合创始人、CTO 唐文斌在接受媒体采访时说道：" 应用落地是衡量大模型价值的唯一标准，旷视科技会从视觉大模型向通用多模态大模型进军。"

专注场景落地，切实为企业用户提供降本增效的方案，成为当下大模型玩家集中发力的点。而未来，大模型早已从 " 做与不做 "，真正迈进了 " 做得怎么样 " 的问题。而这正是大模型之争的下一步。

参与未来之争，先回答这四个问题

虽然大模型很火，但从开局到推向市场，中间还有很远的一段路要走。在此过程中，很多难点已然暴露出来。

不过，在壹 DU 财经看来，大模型的未来之争，多半会在四个纬度展开。即：技术、人才、资金以及商业化落地。

首先看技术层面。毫无疑问，人工智能是当前最为先进的技术之一，在技术层面，其所需要的积淀不可能在短时间内补齐。" 大 " 算力、" 大 " 数据、" 大 " 模型是目前大模型的基本特征，同时也是大模型的产业化落地面临的挑战，目前来看，数据规模虽大，但数据质量参差不齐。其次，模型的体积大，训练难度更高，第三是算力规模大，对硬體性能要求会更高。

这也意味着，没有足够的资金作为支撑，很难组建这样一个超强的战队。一位营销云创始人与壹 DU 财经沟通时曾提到：" 从 3 月份投入做行业大模型以来，整体资金投入非常大，甚至超过了公司成立到做大模型之前的总和。" 不过，他也提到，如果做成了，对于公司的未来十年发展，绝对是定心丸。

在此之前，不少行业人士就曾提出 " 大模型是大厂烧钱的游戏 "。这种说法并非毫无道理。

虽然大模型很火，但全球范围来看，资本却未跟上技术复苏的节奏。研究公司 PitchBook 的数据称，今年前六个月，全球风险投资资金几乎减少了一半，下降 48% 至 1739 亿美元，交易数量也下降了 19%。

在中国，截至今年 6 月底，有十几家大模型初创公司获得融资，在已经公布融资额的企业中，融资规模最大的是 MiniMax，今年 6 月获得腾讯公司超过 2.5 亿美元 A 轮融资；光年之外在被美团收购前，也获得了 2.3 亿美元的天使 + 轮融资。

再来看大厂的投入情况，此前，钛媒体的统计数据颇能说明问题，2022 年，华为在研发费用上投入为 1615 亿元，成为国内研发投入最多的企业；其次是腾讯，虽然低了不少，但也保持在 614 亿元的水平，阿里排在第三，研发费用为 555 亿元。公开资料显示，百度作为较早入局人工智能的玩家，过去十年，其在 AI 领網域的投入超过 1000 亿元。这样的投入规范，显然不是一般企业可以比拟的。

有技术、有资金，大厂们对于人才的吸引力相对更强。今年年初，各家开始了疯狂的人才抢夺战。百度以 25-40K 的月薪招聘 AI 大模型算法工程师，更阔气的阿里以 40-70K 的月薪招募大模型训练及算法工程师。

在某招聘平台上搜索关键词 " 大模型 " 后，会发现，一些企业愿意给到 2023 届毕业生 15-25K 月薪的待遇。同时，一些垂直赛道的企业也参与了这轮抢人大战。比如某贸易公司招聘的医疗大模型产品经理，薪资范围为 25-50K，某游戏公司招聘语言大模型的算法工程师，也给到了最高 50K 的薪资。甚至中国电信招聘的大模型平台产品经理年薪可以达到 84 万的水平。

水涨船高的人才、技术以及资金，无不催促着大模型的玩家们尽快落地、尽快商业化，毕竟，按照商业规律，最终这些投入需要产出回报，才有价值。

但大模型的落地成本，同样是各大玩家需要跨过的槛。曾有行业人士估算，大模型训练一次的成本极高，达到了 200-12000 万美元。这也意味着，AI 大模型的商业化落地，可能还得回到成本核算这件事上。

结语

站在当下看大模型，整体很像 1998 年的互联网，初于起步阶段，泡沫很大，机会也很大。在这种情况下，真正有实力的好公司，未来的成长性会更好，价值也会越来越大。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体 App