今天小编分享的科技经验:“国家队”下场,大模型“卷”向新纬度,欢迎阅读。
图片来源 @视觉中国
文 | 壹 DU 财经
大模型的风在吹了半年后,终于有了新方向。
7 月 7 日,在 2023 世界人工智能大会(WAIC 2023)上,由国家标准委指导的人工智能标准化总体组宣布,我国首个大模型标准化专题组组长由上海人工智能实验室与百度、华为、阿里等企业联合担任。
对于首批入选的 " 国家队 " 阵容,外界并不意外,毕竟大模型的发展,需要靠技术实力格外雄厚的玩家引领。而在国家明确他们的地位及任务后,国内大模型市场的风向,开始有了新变化。
狂飙半年,行业迎来 " 国家队 "
今年以来,大模型一路狂飙,速度超过了以往任何一项技术的发展进程。如果说在今年一季度,各个玩家蜂拥至大模型的入口,还在讨论 " 要不要做 " 的问题,到了二季度时,各家已经进化到具体 " 怎么做 " 的问题上来。
而这样的热闹场景,在 WAIC 2023 上迎来了高潮。这届大会超 400 家企业参展、30 多个大模型集中亮点,展区面积达到了 5 万平方米,创下了历届之最。
这场热闹的大会,不少人因为没有提前预约而无法进入大会现场。在被行业人士称为 " 规格 " 很高的大会上,网红马斯克、图灵奖三巨头之一的杨立昆、华为轮值董事长胡厚昆、香港中文大学教授汤晓鸽,以及学界、创业界的大佬们纷纷到场。
展厅内,大模型时代、生成式 AI、通用人工智能,这些在半年前还很陌生的词汇,如今成为展厅里随处可见的标志。
当然,大会现场的 30 余家大模型的玩家们,也并没有让外界失望,纷纷给出了自己对于大模型的解答。尤其是 " 国家队 " 成员的动作,更是令外界瞩目。
比如百度,作为国内首家宣布 All in 人工智能的厂商,其在大会现场的展厅格外吸引人。当然,在这个重要的场合,百度自然会展出让更多人能体验到的 " 镇馆之宝 ",这个被称为文心一格的产品,可以让进入展厅的观众实现 P 图自由。
华为则将其 " 全球最快 AI 训练集群 "Atlas 900 PoD A2 搬到了现场。华为副董事长胡厚崑称,使用 Atlas 900,人们只需 59.8 秒就可以完成典型神经网络 ResNet-50 在 ImageNet 数据集上的训练,在同等精度下比第 2 名快 15%。" 这相当于在短跑赛场上头名撞线,然后喝完一瓶水才看到第二名跑到终点。" 无疑,华为这场硬體端基础算力的实力大秀,使得行业人士和观众将视线从大模型的繁杂移至硬體端的比拼。
在阿里云论坛,阿里云 " 通义家族 " 再添 AI 绘画模型 " 通义万相 ",据称,该模型可辅助人类进行图文创作,未来可应用于艺术设计、电商、游戏和文创等应用场景。阿里云智能集团 CTO 周靖人在现场表示,这是阿里云大模型全面掌握多模态能力的关键一步,未来这一能力还将逐步向行业客户开放。
" 有钱、有人、有技术、有场景 ",这是大厂做大模型先天具备的优势,同时也是不少初创企业很难填平的鸿沟,甚至有人在现场直接指出,中国的大模型落地,只会在五家大厂之中,即 BAT+ 华为 + 腾讯。
但巨头们要怎么做?下一步会走向何方,这是一个很大的命题。
抛弃概念与情怀,巨头纷纷专注于场景落地
今年的人工智能大会,大模型成为当之无愧的顶流。
阿里通义、百度文心、华为盘古等国家队纷纷亮出自己的硬实力,同时,讯飞星火、商汤日日新、网易伏羲等 30 多个垂类大模型也没有输掉气势,在各自的领網域里埋头苦干。
但从现场的情况来看,他们似乎已经摒弃了大而空、讲故事、讲情怀的做法,转而开始专注于讲落地场景和案例。这是大模型前进的必由之路,同时也极有可能成为下一阶段的重头戏。
在大会上,华为云盘古大模型 3.0 正式发布,引来不少行业人士围观。更令行业印象深刻的在于,华为常务董事、华为云 CEO 张平安所言——盘古大模型很忙,忙着做事,没有时间作诗。而作诗,正是此前半年发布大模型的玩家们最爱干的事。
在张平安看来,华为希望盘古大模型可以帮助各行各业,如金融、政务、矿山、气象等,而非专注在语言大模型层面。据其透露,截至目前,盘古大模型已经在气象、医药研发、电力等领網域落地,并交付了多个千亿参数大模型。
同样把场景落到实处的还有百度。百度作为较早入局的玩家,早在四年前即发布文心大模型,只是当时行业对于大模型的关注度不够,以至于没有激起太多水花。但对于百度而言,文心大模型是先行业一步的超前布局。如今,这个前瞻的产品也收获颇丰。
在 WAIC 2023 现场,百度首席技术官王海峰称,现在百度已经更新到文心大模型 3.5 版本,较之此前的版本,效果提升 50%、训练速度提升 2 倍,推理速度提升了 30 倍。在成本上,更是降到过去的 10%。
" 把促进中国大模型生态的繁荣作为首要目标,向大模型创业公司提供全方面的服务 "。阿里云 CTO 周靖人如此说道。很明显,这延续了阿里云提出的 MaaS(模型即服务)概念。
在大模型领網域最晚入局的腾讯,最近 20 天内动作不断。6 月 19 日,腾讯首次公开透露对大模型的思考;6 月 26 日,首次披露自研星脉高性能计算网络;在 7 月 7 日 WAIC 2023 上,腾讯云副总裁、腾讯云智能负责人吴运声对外公开了腾讯在大模型应用创新的成果,并称,腾讯云行业大模型能力已应用到金融风控、互動翻译、数智人客服等场景中,提升了智能应用效率。
当然,细分领網域的大模型也展现出旺盛的生命力。旷视科技联合创始人、CTO 唐文斌在接受媒体采访时说道:" 应用落地是衡量大模型价值的唯一标准,旷视科技会从视觉大模型向通用多模态大模型进军。"
专注场景落地,切实为企业用户提供降本增效的方案,成为当下大模型玩家集中发力的点。而未来,大模型早已从 " 做与不做 ",真正迈进了 " 做得怎么样 " 的问题。而这正是大模型之争的下一步。
参与未来之争,先回答这四个问题
虽然大模型很火,但从开局到推向市场,中间还有很远的一段路要走。在此过程中,很多难点已然暴露出来。
不过,在壹 DU 财经看来,大模型的未来之争,多半会在四个纬度展开。即:技术、人才、资金以及商业化落地。
首先看技术层面。毫无疑问,人工智能是当前最为先进的技术之一,在技术层面,其所需要的积淀不可能在短时间内补齐。" 大 " 算力、" 大 " 数据、" 大 " 模型是目前大模型的基本特征,同时也是大模型的产业化落地面临的挑战,目前来看,数据规模虽大,但数据质量参差不齐。其次,模型的体积大,训练难度更高,第三是算力规模大,对硬體性能要求会更高。
这也意味着,没有足够的资金作为支撑,很难组建这样一个超强的战队。一位营销云创始人与壹 DU 财经沟通时曾提到:" 从 3 月份投入做行业大模型以来,整体资金投入非常大,甚至超过了公司成立到做大模型之前的总和。" 不过,他也提到,如果做成了,对于公司的未来十年发展,绝对是定心丸。
在此之前,不少行业人士就曾提出 " 大模型是大厂烧钱的游戏 "。这种说法并非毫无道理。
虽然大模型很火,但全球范围来看,资本却未跟上技术复苏的节奏。研究公司 PitchBook 的数据称,今年前六个月,全球风险投资资金几乎减少了一半,下降 48% 至 1739 亿美元,交易数量也下降了 19%。
在中国,截至今年 6 月底,有十几家大模型初创公司获得融资,在已经公布融资额的企业中,融资规模最大的是 MiniMax,今年 6 月获得腾讯公司超过 2.5 亿美元 A 轮融资;光年之外在被美团收购前,也获得了 2.3 亿美元的天使 + 轮融资。
再来看大厂的投入情况,此前,钛媒体的统计数据颇能说明问题,2022 年,华为在研发费用上投入为 1615 亿元,成为国内研发投入最多的企业;其次是腾讯,虽然低了不少,但也保持在 614 亿元的水平,阿里排在第三,研发费用为 555 亿元。公开资料显示,百度作为较早入局人工智能的玩家,过去十年,其在 AI 领網域的投入超过 1000 亿元。这样的投入规范,显然不是一般企业可以比拟的。
有技术、有资金,大厂们对于人才的吸引力相对更强。今年年初,各家开始了疯狂的人才抢夺战。百度以 25-40K 的月薪招聘 AI 大模型算法工程师,更阔气的阿里以 40-70K 的月薪招募大模型训练及算法工程师。
在某招聘平台上搜索关键词 " 大模型 " 后,会发现,一些企业愿意给到 2023 届毕业生 15-25K 月薪的待遇。同时,一些垂直赛道的企业也参与了这轮抢人大战。比如某贸易公司招聘的医疗大模型产品经理,薪资范围为 25-50K,某游戏公司招聘语言大模型的算法工程师,也给到了最高 50K 的薪资。甚至中国电信招聘的大模型平台产品经理年薪可以达到 84 万的水平。
水涨船高的人才、技术以及资金,无不催促着大模型的玩家们尽快落地、尽快商业化,毕竟,按照商业规律,最终这些投入需要产出回报,才有价值。
但大模型的落地成本,同样是各大玩家需要跨过的槛。曾有行业人士估算,大模型训练一次的成本极高,达到了 200-12000 万美元。这也意味着,AI 大模型的商业化落地,可能还得回到成本核算这件事上。
结语
站在当下看大模型,整体很像 1998 年的互联网,初于起步阶段,泡沫很大,机会也很大。在这种情况下,真正有实力的好公司,未来的成长性会更好,价值也会越来越大。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体 App