“旧趋势”退场，大模型称王

今天小编分享的互联网经验：“旧趋势”退场，大模型称王，欢迎阅读。

撰文 | 李信马

题图 | WAIC

为期 3 天的世界人工智能大会（WAIC）落下了帷幕，据官方统计，截止到 7 月 8 日下午 3 点，大会的专业观众到场总人次达到 17.7 万，全网曝光量达到 64.1 亿次，项目投资总额达到 288 亿元。

相比去年，今年的 WAIC 到场人数大幅增长（去年线下仅有 3 万人参会），这其中也有场地增加的原因，今年 WAIC 在上海世博中心和世博展览馆之外，还新设了徐汇、张江、闵行以及上海世博酒店等分会场，有超过 400 家企业参展，几乎是去年参展企业数量的两倍。

而在生成式 AI 的热度持续近半年后，观众们的热情也被彻底引燃，会场外，排着长达百米的队伍，会场内，也是摩肩接踵。甚至连会场周边的咖啡馆，都挤满了聊天的参会者。

如果找一个词来概括这届 WAIC 大会，那一定是 " 大模型 "，本届 WAIC 的主题就是 " 智联世界生成未来 "。

走在大会的展区中，每个人都能明显感受到，人工智能发展趋势的变化。比如上一届，WAIC 的主题是 " 智联世界元生无界 "，但是当时的热点趋势 " 元宇宙 "，在本届 WAIC 上，风头已经完全被大模型抢走；另一个稍显落寞的趋势就是 " 自动驾驶 "，2021 年的 WAIC 上，图森未来、嬴彻科技和小马智行来三家自动驾驶企业，曾在 H1 馆相邻的展区上，各自摆上自家的大型卡车，而在今年的 H1 馆中，三家中却只剩下图森未来了，和自动驾驶相关的演讲和论坛，也基本转移到了张江分会场；至于机器视觉，早在 2021 年，被称为 "AI 四小龙 " 的商汤、旷视、依图和云从，就只有商汤还在参会。

相对来说还坚挺的是 " 机器人 "，开幕式上，受邀演讲的马斯克大谈特斯拉机器人的进展，会场中特斯拉展位上的机器人，也受到了观众的欢迎，参展企业中，带着人型机器人、机器狗、清洁机器人、物流机器人来参会的也不在少数。

图片来源：WAIC

除了参展企业的变化，企业所努力展示的内容，也都在明显向大模型靠拢。比如机器视觉起家的商汤，本次大会上最重要的发布，是宣布 " 日日新 " 大模型全面更新；在多个人工智能领網域都有所建树的百度，在其参会的全体论坛和五个分论坛中，五个与大模型内容强相关，只有最后一个是智能驾驶分论坛；专注于 AI 决策领網域的第四范式，也在 WAIC 上带来了他们的 " 式说 " 大模型，并首次公开展示。

此外，本次 WAIC 还出现了为数不少的芯片和算力展区，比如华为云、燧原科技、还有百度的昆仑芯，同样是和大模型紧密相连。

据统计，本届 WAIC，企业带来的大模型总数已经超过了 30 个，不久前发布的《中国人工智能大模型地图研究报告》曾统计中国参数在 10 亿规模以上的大模型已发布了 79 个，以这个速度推测，破百就在不久后。

如此多的大模型同台竞技，很难不让人产生 " 乱花渐欲迷人眼 " 的感觉，而且参展企业，也是不约而同地展示了与 AI 聊天对话或是 " 文生图 " 这些大模型基操，不禁让人觉得有些审美疲劳，久违地回忆起了曾经中国互联网的 " 野蛮生长 "。考虑到目前还没有规模化应用的大模型，眼下的情形，就像是几十个车厂都推出了概念车，却没有一个能量产的。

在 7 月 7 日，中国信通院发布了《2023 大模型和 AIGC 产业图谱》，将大模型和 AIGC 产业链上下游进行了梳理，抽成了行业应用、产品服务、模型与工具和基础层四个主要部分。

图片来源：中国信通院

而具体到大模型（算法模型），则抽成了两大类：通用大模型和垂类大模型。简单来理解，通用大模型是具有大规模参数体量的大模型，是基础设施，但不解决行业具体问题；而垂类大模型是在开源大模型的基础上，针对垂直行业进行大模型建设和应用。

图片来源：中国信通院

但即使在同一大类中，大模型也是有各自的路线和特点。本届 WAIC 评选出了 9 大 " 镇馆之宝 "，唯一入选的大模型就是百度的文心一言。作为国产大模型的领头羊，目前文心大模型已经更新到 3.5 版本，百度首席技术官王海峰表示，相比之前模型的效果提升了 50%，训练速度提升 2 倍，推理速度提升 30 倍，未来还将发布更多的百度官方和第三方插件，同时逐步开放插件生态。

有趣的是，百度还特意将总部的专利墙在展台复制了一面，仿佛在宣示 " 我的技术最强 "，考虑到百度已经连续五年 AI 专利申请和授予量全国第一，似乎也没什么不对。

同样受到热捧的还有阿里云的通义千问，会上，阿里云发布了 AI 绘画创作大模型通义万相，并开启定向邀测。不过，更多被提到的是 MaaS（Model as a Service，模型即服务）理念，在开发者生态层，阿里发起的大模型开源社区——魔搭，目前集聚了 180 多万 AI 开发者和 900 多个优质 AI 模型。这个社区，就像一个开源的大模型集市，据阿里云称，目前模型贡献者基本覆盖国内大模型赛道核心玩家，如百川智能、哔哩哔哩、IDEA 研究院、兰丁股份、澜舟科技等，贡献了 30 多个 10 亿以上参数规模大模型。用阿里云 CTO 周靖人的话来说：" 把促进中国大模型生态的繁荣作为首要目标。"

图片来源：阿里云

大模型领網域的另一个重要玩家——华为云，在发布盘古大模型 3.0 的同时，仿佛群嘲一般喊出了 " 盘古大模型不作诗、只做事 "。而且与其他大模型不同，盘古大模型 3.0 包括 "5+N+X" 三层架构，L0 层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型；L1 层是 N 个行业大模型，既可以提供使用行业公开数据训练的行业通用大模型，也可以基于行业客户的自有数据训练专有大模型；L2 层则提供了更多细化场景的模型，比如政务热线、网点助手、先导药物筛选、传送带异物检测等。

不难发现，盘古大模型既包涵通用大模型，也包含垂类大模型，甚至中小模型也囊括在内。而另一重要发布——昇腾 AI 云服务，单集群提供 2000P Flops 算力，明显是想做大模型的 " 卖水人 "。华为可能不想写诗，但大模型 ToB（企业级服务）的钱，却很想赚到。

同样作为国内顶级的互联网公司，腾讯的大模型却被划分到了垂类大模型中，似乎有点 " 不思进取 "。不过，腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生在演讲中明确表示，对企业来说，基于行业大模型，构建自己的专属模型，是更优的选项。

" 通用大模型可以在 100 个场景中，解决 70%-80% 的问题，但未必能 100% 满足企业某个场景的需求。" 汤道生说。和阿里云类似，腾讯云最近也公布了 MaaS 服务全景图，推出了基于腾讯云 TI 平台的行业大模型精选商店，提供 10 大行业，50 多个解决方案，还有行业大模型精调解决方案。

比起聊天、作图等应用，ToB 的钱显然更吸引大模型厂商。虽然技术还在不断迭代中，但厂商已经做好了行业化和商业化的准备。这一机会，即使体量较小的厂商也不肯放过，只是大厂有实力做通用大模型，乃至像华为一样上下游通吃，而有的厂商更倾向于直接做垂类的行业大模型。比如第四范式的 " 式说 "，同样是定位为 ToB 领網域的多模态大模型，在零售门店管理、房产中介、等细分场景已经有了初步的落地。

不过，目前还有两个问题在限制大模型的发展，其一是成本，即使是行业或专属大模型，也需要至少千万以上的预算，大模型距离普及还有较远的距离。其次，对大模型安全性的担忧，正如清华大学人工智能研究院名誉院长、中国科学院院士张钹在 WAIC 论坛上时表示的，现在的人工智能技术是不安全的，不可靠的，也是不可信的。

如何保证大模型安全、好用，成本还低廉，这是近百个大模型未来真正需要解决的问题。希望明年的 WAIC 上，我们能看到大模型发展的答案，而不是变成又一个 " 黯淡的旧趋势 "。