今天小编分享的互联网经验:大模型的新战场,欢迎阅读。
图片来源 @视觉中国
文 | 定焦,作者 | 温故,编辑 | 方展博
9 月 5 日一早,北京国贸大厦,这座北京 CBD 核心区曾经的最高楼,A 座一层入口处挤满了人。两位保安拉出隔离绳,切开两条道,才勉强维持住秩序。
进门有两个签到台,左手是媒体,右手是嘉宾。临近 9 点活动正式开始的时间点,还有人源源不断前来。他们都是来参加一场由百度公司举行的大模型会议。
五天前,百度刚宣布文心一言向全社会全面开放,所有人都能注册使用,而不用再申请内测名额。这是国内第一个通过监管备案的大模型产品。
这场会议,吸引了来自全国各地的人。因为人数实在太多,在开场前三分钟,现场关闭了通往三层主会场的通道,然后引导参会者前往旁边的嘉里大厦分会场,那里有大螢幕可以看直播。
会议签到现场 「定焦」摄
分会场的座位没多久也全部坐满了,中途还不停有人进来。一位从外地赶来的从业者盯着螢幕嘟囔着,这次不能在现场见到李彦宏了。
作为中国对 AI 投入最早的大厂之一,百度踩上了新一波 AI 浪潮,这让它在业内的关注度快速上升。
但竞争也无比激烈。就在会议开始前半小时,科大讯飞宣布,讯飞星火认知大模型面向全民开放。没多久,讯飞星火 APP 登上了苹果应用商店免费排行榜的榜首。此前,刚拿下榜首的是文心一言。
百度董事长兼 CEO 李彦宏说,模型本身是不直接产生价值的,基于基础大模型开发出来的应用才是模型存在的意义,对于创业者来说," 卷大模型没有意义,卷应用机会更大 "。
从内测走向开放,从拼参数到拼应用,中国大模型进入新战场。
等待发令枪响
对于中国的大模型厂商而言,8 月 31 日是很特殊的一天。这一天,北京、上海率先通过了大模型备案。
所谓大模型备案,是指大模型产品在向公众开放及商用之前,必须拿到监管部门的备案审批。没有经过备案,就只能小范围内测,大部分人无法注册使用。
百度早在 3 月 16 日就发布了文心一言,后来阿里发布通义千问,科大讯飞推出讯飞星火,这些大模型之前一直在内测阶段。即便用户下载了 APP,也无法注册账号。
目前,有两条跟 AI 产品备案相关的政策法规,一是 1 月 10 日开始施行的《互联网信息服务深度合成管理规定》,二是 8 月 15 日开始施行的《生成式人工智能服务管理暂行办法》。
政策规定,生成式 AI 产品上架之前,一要进行算法备案,二要通过安全评估,业内称为 " 双新评估 "。这可以被视为大模型应用进入市场的门槛。
一家 AI 创业公司的创始人对「定焦」说,几个月前,很多企业就启动了算法备案,有些企业还主动跟监管部门沟通,了解安全评估的要求,以尽早通过备案评估。
国内的 AI 大模型集中发布于四五月前后,《生成式人工智能管理办法》在 4 月 11 日发布征求意见稿,8 月 15 日开始生效。这四个月的时间里,很多企业赶在生效前申请,想要率先拿到审批。
通过备案对厂商很重要。一方面这是产品推向市场的前提条件,另外,它在某种程度上代表官方认可,是一种无形的背书。目前备案以地網域划分,因此各地监管部门都在加速审批,企业也在等待通知,随时准备对外宣布进展。
8 月 31 日凌晨,0 点刚过,百度通过公众号对外宣布,文心一言向全社会开放。在新闻稿中,百度特地用到了 " 率先 " 一词。
" 百度是提前准备好了的,相关部门允许上线的时间应该就是 8 月 31 日。" 一位 AI 大模型创业者说。
卡着点官宣,让百度成为备案政策生效半个月以来,第一个正式通过备案的企业。北京也跑在了其他城市的前面。
紧接着在凌晨 3 点,百川智能也宣布通过生成式人工智能备案,即日起开放公众服务,它也用到了 " 率先 " 一词。
清华系 AI 公司智谱华章也通过了第一批备案,但它直到 31 号下午 6 点多才对外宣布,上线了一款生成式 AI 助手 " 智谱清言 ",APP 和微信小程式都能体验。它是第一批里面唯一一个推出了小程式的公司。
另一个抢跑的城市是上海。
总部在上海的 AI 公司商汤,在 31 日中午 12 点半宣布,大语言模型应用 " 商量 SenseChat" 即日起开放服务;MiniMax 在下午 3 点多,正式宣布 "abab" 大模型全面开放服务。
24 小时之内,通过备案的企业纷纷主动官宣,刷一波存在感。
市场普遍认为,第一批通过备案的大模型公司至少有 8 家,其中北京 5 家(百度的 " 文心一言 "、抖音的 " 云雀 "、百川智能的 " 百川大模型 "、智谱华章的 " 智谱清言 "、中科院的 " 紫东太初 "),上海 3 家(商汤的 " 商量 SenseChat"、MiniMax 的 "ABAB 大模型 "、上海人工智能实验室的 " 书生通用大模型 "),另外广东的 2 家和安徽的 1 家会陆续开放。开放的时间取决于各省市的审批进度,而且各省市的名额有差别。
安徽的那家是科大讯飞,直到 9 月 5 日才宣布通过备案,比北京和上海的几家企业晚了近一周时间。而被认为会在第一批备案名单里的阿里 " 通义千问 "、360 智腦,目前尚没有更多消息。
寻找爆款应用
监管放开备案,给大模型厂商们开辟了一个新战场。
之前,由于没法开放注册,厂商们只能在圈内刷存在感,通过霸榜一些国际测评榜单,来证明自己技术实力优秀。现在,C 端用户都能使用了,竞争更加市场化,是骡子是马拉出来溜溜,优劣更容易评判了。
用户争夺战率先打响。
根据百度发布的 " 战报 ",文心一言开放首日,APP 迅速登顶手机应用商店排行榜,开放下载 19 小时内用户突破 100 万,累计回答网友 3342 万个问题。
讯飞星火 APP 开放下载当日,也登上了苹果应用商店免费排行榜的榜首。科大讯飞发布 " 战报 ",讯飞星火上线 14 小时用户突破 100 万。这个速度超过了文心一言。
不过,这其中有多大 " 含金量 " 难以判断,热度能持续多久更是存疑。
当用户涌入之后,产品体验、运营、服务的重要性上升。但不是所有厂商都准备好了。
第一批备案名单里的商汤 SenseChat,称所有用户都能注册使用。但是当你打开它的官网,会发现无法注册,页面提示 " 抱歉,当前注册人数过多 "。
算力依然制约着大模型应用的推广。
盛景嘉成董事总经理刘迪对「定焦」分析,现在算力非常稀缺。" 用来做微调和日常的 B 端业务处理都已经很紧,C 端的量一旦上来,有些公司会支撑不住。"
百度在文心一言放开后的第 12 个小时发通知称,正在调集新的算力," 请大家减少调戏,为工作和学习目的的用户让路 "。
这跟移动互联网早期的情况类似,高并发对伺服器的要求很高,可能导致网站崩溃,而大模型对算力要求更高,为之付出的成本更加高昂。
AI 生成信息的准确性也是个问题。
即便是准备最充分的百度文心一言,也还是避免不了 " 幻觉 " 现象。有人问它 "2023 年每个月的汽车出口数据 ",它一本正经地把今年剩下四个月的数据都列出来了。
多位从业者认为,短期内出现爆款应用的概率不大。
启明创投合伙人叶冠泰对「定焦」说,监管放开是个重要时点,但不会马上出现爆款应用,因为目前大模型还是通用并且不实时,需要有一点沉淀的时间。从一个尝鲜的角度,用户量会涨很快,但不会持久。
前段时间 " 妙鸭相机 " 刷屏,成为国内第一个面向 C 端的、收费的、刷屏的 AIGC 应用,让中国的大模型厂商看到了希望。但这款产品最终昙花一现,热度只持续了一周时间。
不过对于厂商们而言,这或许不是那么重要。厂商看中的是用户数据。李彦宏说,当文心一言向数以亿计互联网用户大规模开放服务后,能够获得大量真实世界中的人工反馈,这将进一步改进基础模型,并以更快速度迭代文心一言。
在赚走一波热度后,厂商们有更大的野心。
开始养家糊口
放开 C 端注册之后,大模型厂商憧憬着,通过 C 端赚钱。
ChatGPT 已经为行业打了个样。今年 2 月, ChatGPT 推出 Plus 付费项目,起价为每月 20 美元。这类似订阅制,Plus 会员能调用 GPT-4 版本,享受更快的相应速度,优先获得新功能。当时 ChatGPT 的注册用户已超过 1 亿人。
当用户规模足够大,用订阅模式赚钱,是一种很成熟的商业模式。但在中国,用户的付费意识还需培养。
"C 端的会员订阅在国内不太现实,互联网产品过去就没有培养起 C 端付费的市场。" 跃盟科技创始人王冉说。
现在讲大模型在 C 端的产品形态,包括变现方式,似乎还有点早。厂商们对产品的定义也还没有那么清楚。
事实上,大部分大模型厂商,包括 OpenAI 在内,商业化主要还是通过 to B 的方式——出售大模型 API(应用程式编程接口),按调用次数收费;输出大模型解决方案,赚开发服务的钱。
面向 B 端(开发者和企业)的 API 接口调用,一直都是 OpenAI 的重心。早在 2020 年,OpenAI 就开始进行 API 接口邀请测试,一些搜索公司、教育公司、社交媒体公司成为 OpenAI 最早的客户,它们调用 GPT 的 API,将 OpenAI 的軟體集成到他们的产品中。
8 月 28 日,OpenAI 上线企业专用版本的 ChatGPT。这个版本针对企业客户的需求,在功能上做了更深层的定制,目前没有对外公开价格。OpenAI 称,接下来还将针对小型机构推出 ChatGPT 商务版本,并提供更多定制化选项。
从 OpenAI 的布局能看出来,它一直在 B 端市场发力。ChatGPT 对 OpenAI 的意义,目前不是商业化变现,而是在于打响知名度,证明技术实力,并由此抬高公司估值。过去几个月,OpenAI 又完成了巨额融资,员工数量扩大了好几倍。
国内厂商借鉴了这一思路。百度文心一言、讯飞星火认知大模型,先后冲榜苹果应用商店,像电商平台在 " 双 11" 发战报一样做宣传,都是为了引发外界关注。
毕竟,没有什么方式比做出一个爆款应用,更能证明公司的技术和产品实力。
即便短期打造不出爆款应用,向 C 端开放也能促进 B 端生意的增长。
一家做系统集成公司的员工对「定焦」说,百度的千帆大模型刚上线时,他们就拿到了接入的名额。这是一个面向 B 端的企业级大模型平台,可以调用文心一言的服务,也可以开发、部署和调用自己的大模型。
但当时文心一言在内测,他们跟客户合作开发时,拿账号要走内测的内部流程,相对麻烦。现在放开使用后," 用的人多了,客户更了解这个产品,会有一些新需求出来,更利于我们开展业务。"
一位百度智能云生态企业的员工对「定焦」说,"C 端放开注册,会让更多人知道大模型,先有 C 端体验,然后促进 B 端使用。"
现在,国内的大模型厂商在对外秀肌肉时,不再强调大模型的参数和性能,而是更突出签约客户的数量、落地的行业和场景。它们变得更加务实。
摸着自己过河
通过了备案,中国大模型厂商们接下来面临的最大挑战,是这条路没有人走过,它们得摸着自己过河。
美国的 OpenAI 走过的路、掀起的热潮,在国内无法直接复制。
在中国放开大模型审批之前,美国以 ChatGPT、Character AI 为代表的产品,已经在全球多个国家开放使用,ChatGPT 在两个月内狂揽 1 亿用户,后来者 Character AI 的首周下载量超过了 ChatGPT。
但经历完早期几个月的流量暴涨,ChatGPT 略显疲态。根据第三方机构 SimilarWeb 的监测数据,从 4 月开始,ChatGPT 的环比增长开始放缓,5 月几乎没有增长,7 月用户数量从 6 月的 17 亿人降至 15 亿人,环比降幅达到 12%。
这说明看热闹的人少了,普通大众对 AI 大模型的关注度在下降。
之前无论投资圈还是产业界,都在说要做 " 中国的 OpenAI",现在大家开始考虑,做出什么样的应用,能够真正解决产业问题和用户需求。
一些人说要做 AI 原生应用。按照李彦宏的说法,AI 原生应用不是对移动互联网 APP 和 PC 軟體的简单重复,而要能解决过去解决不了、或解决不好的问题。
这就像当年从 PC 互联网到移动互联网过渡,那些真正爆款的应用,都是押注移动互联网,在新的技术平台开发,而不是对 PC 产品的修修补补。典型的例子是微信的崛起。
现在大家相信,依靠大模型的能力,或许能开发出完全不一样的新应用。
一位 AI 创业者说,真正的 AGI 原生应该是用 AGI 的推理能力重新组织业务的关键流程,进而重构产品形态和人机互動。如果仅仅是用 AGI 里的 AIGC 功能生成内容和文本,那只是改变内容的生产效率,新酒装老瓶。
押注新技术和新平台的风险也是巨大的。跟移动互联网刚兴起的时候相比,现在最大的变化是流量红利消失了,新应用的推广成本非常高。大厂或许可以借助现有的超级 APP 导流,创业公司突出重围的难度增加。
英诺天使基金管理合伙人王晟对「定焦」分析,在 C 端市场,现在无论是打造一款用户规模很大的应用,还是一个新的生态平台,都非常困难。" 系统性流量红利没有了。"
在商业化路径相对清晰的 B 端市场,由于 OpenAI 的产品没有进入中国,给中国厂商留下了一定的时间視窗。
一位做 AI 招聘的创业者对「定焦」说,他们的产品一开始接入了 ChatGPT 的接口,随着国内大模型放开,正考虑更换成国内大模型。" 现在有些客户尤其是有一定政府背景的,他们还是比较在意这一块 "。
王冉对「定焦」表示,接下来大模型会在垂类场景里不断优化,技术公司或产业领網域的头部企业,大概率会做自己的专用模型。一些行业会形成行业模型和大模型混用的局面,私網域模型占主导,公網域模型做协调配合。
在这个过程里,业务数据会成为稀缺资源。"AI 大模型的核心不是 AI 本身,跟业务结合是最难的事。随着一些大模型开源,越来越多的公司会自己做百亿参数规模的大模型,真正值钱的不是参数,而是业务数据和行业 knowhow,这是所有大模型公司都在抢的东西。" 王冉说。
一个新的共识是,随着大模型放开,行业会重新洗牌,有些大模型会被淘汰出局。流量逐渐向头部集中,不同梯队厂商之间的差距进一步拉大。