今天小编分享的互联网经验:“旧趋势”退场,大模型称王,欢迎阅读。
撰文 | 李信马
题图 | WAIC
为期 3 天的世界人工智能大会(WAIC)落下了帷幕,据官方统计,截止到 7 月 8 日下午 3 点,大会的专业观众到场总人次达到 17.7 万,全网曝光量达到 64.1 亿次,项目投资总额达到 288 亿元。
相比去年,今年的 WAIC 到场人数大幅增长(去年线下仅有 3 万人参会),这其中也有场地增加的原因,今年 WAIC 在上海世博中心和世博展览馆之外,还新设了徐汇、张江、闵行以及上海世博酒店等分会场,有超过 400 家企业参展,几乎是去年参展企业数量的两倍。
而在生成式 AI 的热度持续近半年后,观众们的热情也被彻底引燃,会场外,排着长达百米的队伍,会场内,也是摩肩接踵。甚至连会场周边的咖啡馆,都挤满了聊天的参会者。
如果找一个词来概括这届 WAIC 大会,那一定是 " 大模型 ",本届 WAIC 的主题就是 " 智联世界 生成未来 "。
走在大会的展区中,每个人都能明显感受到,人工智能发展趋势的变化。比如上一届,WAIC 的主题是 " 智联世界 元生无界 ",但是当时的热点趋势 " 元宇宙 ",在本届 WAIC 上,风头已经完全被大模型抢走;另一个稍显落寞的趋势就是 " 自动驾驶 ",2021 年的 WAIC 上,图森未来、嬴彻科技和小马智行来三家自动驾驶企业,曾在 H1 馆相邻的展区上,各自摆上自家的大型卡车,而在今年的 H1 馆中,三家中却只剩下图森未来了,和自动驾驶相关的演讲和论坛,也基本转移到了张江分会场;至于机器视觉,早在 2021 年,被称为 "AI 四小龙 " 的商汤、旷视、依图和云从,就只有商汤还在参会。
相对来说还坚挺的是 " 机器人 ",开幕式上,受邀演讲的马斯克大谈特斯拉机器人的进展,会场中特斯拉展位上的机器人,也受到了观众的欢迎,参展企业中,带着人型机器人、机器狗、清洁机器人、物流机器人来参会的也不在少数。
图片来源:WAIC
除了参展企业的变化,企业所努力展示的内容,也都在明显向大模型靠拢。比如机器视觉起家的商汤,本次大会上最重要的发布,是宣布 " 日日新 " 大模型全面更新;在多个人工智能领網域都有所建树的百度,在其参会的全体论坛和五个分论坛中,五个与大模型内容强相关,只有最后一个是智能驾驶分论坛;专注于 AI 决策领網域的第四范式,也在 WAIC 上带来了他们的 " 式说 " 大模型,并首次公开展示。
此外,本次 WAIC 还出现了为数不少的芯片和算力展区,比如华为云、燧原科技、还有百度的昆仑芯,同样是和大模型紧密相连。
据统计,本届 WAIC,企业带来的大模型总数已经超过了 30 个,不久前发布的《中国人工智能大模型地图研究报告》曾统计中国参数在 10 亿规模以上的大模型已发布了 79 个,以这个速度推测,破百就在不久后。
如此多的大模型同台竞技,很难不让人产生 " 乱花渐欲迷人眼 " 的感觉,而且参展企业,也是不约而同地展示了与 AI 聊天对话或是 " 文生图 " 这些大模型基操,不禁让人觉得有些审美疲劳,久违地回忆起了曾经中国互联网的 " 野蛮生长 "。考虑到目前还没有规模化应用的大模型,眼下的情形,就像是几十个车厂都推出了概念车,却没有一个能量产的。
在 7 月 7 日,中国信通院发布了《2023 大模型和 AIGC 产业图谱》,将大模型和 AIGC 产业链上下游进行了梳理,抽成了行业应用、产品服务、模型与工具和基础层四个主要部分。
图片来源:中国信通院
而具体到大模型(算法模型),则抽成了两大类:通用大模型和垂类大模型。简单来理解,通用大模型是具有大规模参数体量的大模型,是基础设施,但不解决行业具体问题;而垂类大模型是在开源大模型的基础上,针对垂直行业进行大模型建设和应用。
图片来源:中国信通院
但即使在同一大类中,大模型也是有各自的路线和特点。本届 WAIC 评选出了 9 大 " 镇馆之宝 ",唯一入选的大模型就是百度的文心一言。作为国产大模型的领头羊,目前文心大模型已经更新到 3.5 版本,百度首席技术官王海峰表示,相比之前模型的效果提升了 50%,训练速度提升 2 倍,推理速度提升 30 倍,未来还将发布更多的百度官方和第三方插件,同时逐步开放插件生态。
有趣的是,百度还特意将总部的专利墙在展台复制了一面,仿佛在宣示 " 我的技术最强 ",考虑到百度已经连续五年 AI 专利申请和授予量全国第一,似乎也没什么不对。
同样受到热捧的还有阿里云的通义千问,会上,阿里云发布了 AI 绘画创作大模型通义万相,并开启定向邀测。不过,更多被提到的是 MaaS(Model as a Service,模型即服务)理念,在开发者生态层,阿里发起的大模型开源社区——魔搭,目前集聚了 180 多万 AI 开发者和 900 多个优质 AI 模型。这个社区,就像一个开源的大模型集市,据阿里云称,目前模型贡献者基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA 研究院、兰丁股份、澜舟科技等,贡献了 30 多个 10 亿以上参数规模大模型。用阿里云 CTO 周靖人的话来说:" 把促进中国大模型生态的繁荣作为首要目标。"
图片来源:阿里云
大模型领網域的另一个重要玩家——华为云,在发布盘古大模型 3.0 的同时,仿佛群嘲一般喊出了 " 盘古大模型不作诗、只做事 "。而且与其他大模型不同,盘古大模型 3.0 包括 "5+N+X" 三层架构,L0 层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型;L1 层是 N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,也可以基于行业客户的自有数据训练专有大模型;L2 层则提供了更多细化场景的模型,比如政务热线、网点助手、先导药物筛选、传送带异物检测等。
不难发现,盘古大模型既包涵通用大模型,也包含垂类大模型,甚至中小模型也囊括在内。而另一重要发布——昇腾 AI 云服务,单集群提供 2000P Flops 算力,明显是想做大模型的 " 卖水人 "。华为可能不想写诗,但大模型 ToB(企业级服务)的钱,却很想赚到。
同样作为国内顶级的互联网公司,腾讯的大模型却被划分到了垂类大模型中,似乎有点 " 不思进取 "。不过,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生在演讲中明确表示,对企业来说,基于行业大模型,构建自己的专属模型,是更优的选项。
" 通用大模型可以在 100 个场景中,解决 70%-80% 的问题,但未必能 100% 满足企业某个场景的需求。" 汤道生说。和阿里云类似,腾讯云最近也公布了 MaaS 服务全景图,推出了基于腾讯云 TI 平台的行业大模型精选商店,提供 10 大行业,50 多个解决方案,还有行业大模型精调解决方案。
比起聊天、作图等应用,ToB 的钱显然更吸引大模型厂商。虽然技术还在不断迭代中,但厂商已经做好了行业化和商业化的准备。这一机会,即使体量较小的厂商也不肯放过,只是大厂有实力做通用大模型,乃至像华为一样上下游通吃,而有的厂商更倾向于直接做垂类的行业大模型。比如第四范式的 " 式说 ",同样是定位为 ToB 领網域的多模态大模型,在零售门店管理、房产中介、等细分场景已经有了初步的落地。
不过,目前还有两个问题在限制大模型的发展,其一是成本,即使是行业或专属大模型,也需要至少千万以上的预算,大模型距离普及还有较远的距离。其次,对大模型安全性的担忧,正如清华大学人工智能研究院名誉院长、中国科学院院士张钹在 WAIC 论坛上时表示的,现在的人工智能技术是不安全的,不可靠的,也是不可信的。
如何保证大模型安全、好用,成本还低廉,这是近百个大模型未来真正需要解决的问题。希望明年的 WAIC 上,我们能看到大模型发展的答案,而不是变成又一个 " 黯淡的旧趋势 "。
>