今天小编分享的互联网经验:大模型的应用热:最甜的蛋糕与最难的关,欢迎阅读。
图片来源 @视觉中国
文 | 硅基研究室,作者 | 白嘉嘉
" 我所见过的事物,你们人类绝对无法置信。我目睹了战船在猎户星座的端沿起火燃烧,我看着 C 射线在唐怀瑟之门附近的黑暗中闪烁。所有这些时刻,终将流逝在时光中,一如眼泪消失在雨中。"
这是电影《银翼杀手》中最后的独白,出自复制人罗伊 · 巴蒂之口。
这段台词后来被英国《观察家报》评选为电影史上十大经典时刻的第六位,经常作为科幻作品的代表被引用。
某种程度上,这段话正在成为现实。如今令全球陷入狂热的大模型,正在以难以想象的速度吸纳全球的知识,那些字元背后的人、事、物汇聚成的洪流,或许不比星河大战来得平淡。
而促成这一切的学者、工程师、商人仍在等待,或许他们也说不上来自己究竟希望等来些什么,更精巧的技术探针?更高效的生产工具?更具钱景的超级应用?
又或者是一个像罗伊 · 巴蒂一样的复制人,缓解人类仰望星河时近乎绝望的孤单。
它来了吗?
它带来什么?
它是如何来的?
它首先在哪儿萌芽?
中外之间又会有什么差别?
……
面对今天层出不穷的大模型,不论焦虑还是期待都已经来不及了,对于这个未来必将和我们长久相伴的伙伴,最好的欢迎仪式,就是注视它。
C 端卷向 B 端,开源冲击闭源
ChatGPT 的出现,就像人工智能敲了敲你家的门。
从 2022 年 11 月 30 号面向公众发布,仅用了两个月时间,ChatGPT 的月活跃用户就成功过亿,成为历史上增长最快的消费者应用程式。
3 月初 Codeway Dijital 基于 ChatGPT API 开发的对话机器人应用 Chat with Ask AI,凭借强大的问答功能,上半年收入超 1600 万美元(约 1.12 亿人名币),成为 AI+Chatbot 赛道下载量和收入最高的应用。
ChatGPT 的成功似乎预示着 AI 应用面向 C 端用户的商业逻辑成立——将产品交给用户,由他们自己来挖掘 AI 带来的无限可能,在这个过程中,一条美妙的收入曲线也会随之浮现。
可惜,事情并没有那么简单。
7 月 4 日,网络分析公司 Similarweb 发布数据称,ChatGPT6 月份的全球访问量环比降幅 9.7%,独立访客数量环比下滑了 5.7%。
除了 ChatCPT,Character.AI 的访问量也在 6 月出现了大幅下滑,环比降幅达 32%。
Character.AI 可以模仿娱乐名人、历史人物、虚构人物的人格进行对话,在所有同类 AI 工具中访问量排名第二。
对此,Similarweb 分析师 David Carr 表示," 从现在开始,聊天机器人必须证明自己的价值,而不是认为一切都是理所当然的 "。
某种程度上,ChatGPT 和 Character.AI 访问量的下滑,象征着面向 C 端用户的 AI 应用已经逐渐摸到了上限,而这一点则说明——
用户并没有那么大的兴趣自主挖掘 AI 的可能性,将 AI 与应用场景深度结合," 把锤子放在钉子旁边 ",是大模型落地的必要条件。
微软率先当起了 " 锤子的搬运工 "。
采用 ChatGPT 母公司 OpenAI 的技术,微软推出了 Microsoft 365 Copilot,并在 7 月 18 日的年度 Inspire 大会上,面向商业客户开出了每个月 30 美元的价码。
据介绍,Microsoft 365 Copilot 可以帮助企业对所有业务数据进行推理,包括从早上的会议、电子邮件和聊天记录中生成最新信息,发送给团队;帮助用户了解上周项目进展;或从内部檔案和网络数据中创建 SWOT 分析。
通过与自有场景结合,微软走出了一条更扎实的变现路径,而这也是今天许多大公司试水 AI 的模式,全程闭环,数据、模型仅在巨头间流动。
就像《银翼杀手》中最先进的机器人制造技术被泰勒公司牢牢把控。
不过现实的发展往往比电影更加戏剧,近日,同为互联网巨头的 Meta 宣布开源 Llama2 基础大模型,由微软云分发,可供企业免费商用,打响了 " 反技术垄断 " 第一枪。
就测评结果来看,Llama2 距离 GPT-4 仍有一定的差距,与 GPT-3.5 各有优劣,是目前市场上最好用的开源模型。
不过这究竟这意味什么?
以华为对大模型层级的划分为例,可以分为基础大模型(模拟人的功能,如语言、视觉),行业大模型(根据行业划分,可能统筹了多个基础大模型的功能)和场景模型(对应到行业里的具体场景,比如网点助手、供应链物流、小分子优化)。
Meta 开源的 Llama2,就是基础大模型中的大语言模型,不需要大量的数据来训练模型,只需要大量的语料库即可。通过精调,大模型创业者便可在此之上开发出适用于相应行业或场景的 AI 应用。
就像安卓系统托起了起了非苹果手机的移动互联网生态,Llama2 最大程度降低了企业研发大模型的成本,从而可以更加聚焦自身的产业场景。
最近在国内突然爆火的 " 妙鸭相机 " 就是开源的受益者。
Stable Diffusion(SD)是目前最火的 AI 绘画工具之一,它是一个免费开源的项目,可以被任何人免费部署和使用。市场预测," 妙鸭相机 " 的原理就是通过 LoRA 模型插件解决了 SD 出图具有随机性的问题。
而 LoRA,其实也是一个面向公众免费开放的模型微调技术。7 月 25 日阿里云在国内推出针对 Llama2 全系列版本的训练和部署方案中,就包括 LoRA 微调。
从 ChatGPT 直面 C 端消费者,到微软将大模型与旗下场景结合后再推向消费者或企业,再到 Meta 开源 Llama2,为企业提供基础大模型和精调服务,多条路径推动大模型落地背后,既有大模型玩家试图尽快打通商业闭环,回笼资金支持技术迭代的考量,也是构建 AI 产业生态,争夺话语权的长线投资。
值得一提的是,虽然文中以微软、OpenAI、Meta 举例,却并不代表它们仅局限于相应路径,事实上,在技术、资金的支持下,头部企业均有实力部署多条路径,而这也让战局显得更加焦灼。
譬如,据 The Information 7 月 24 日发文爆料,OpenAI 正在开发的开源大型语言模型,目前代号为 G3PO,内部尚未决定发布时间表。
有意思的是,虽然前脚扎克伯格在 facebook 上表示 " 开源推动了创新,因为它让更多的开发者能够使用新技术……我相信如果生态系统更加开放,将会释放更多的进步 ",但在几天后的电话会议上他又提出,将对微软、亚马逊、谷歌这样的大型云计算公司收取一部分转售服务带来的收益。
数据或成中国企业最牢固护城河
对于此轮的大模型创业潮,真格基金管理合伙人戴雨森有一个精妙的比喻:GPT-3 的出现等于发现新大陆,而 ChatGPT-4,好比是在新大陆上发现了黄金。
中国公司的追赶之旅则如同知道了新大陆和黄金所在,并且知道 OpenAI 是坐船去的,也知道船大概的样子,却没有详细地图。
因而,对中国的大模型玩家来说,在这段漫长航海之旅中找到靠岸补给,是生死攸关的必选项。
靠岸,就是为大模型寻找落地场景,形成可持续的商业模型。
不可否认,目前国产人工智能芯片仍与世界一流水准有一定差距,受限于芯片制裁,中国公司在扩大算力规模上难度较大。
此外,在算法端,包括自然语言处理、计算机视觉、音频、多模态等各种大模型上,中国有着一定的优势,但算法本身与算力相辅相成,因此也暂时与 OpenAI 等行业领先者有一定的距离。
在此现状下,国内企业想要在这波 AI 浪潮中不落人后,就必须要在数据下功夫。
换言之,中国大模型玩家在这轮竞争中的核心壁垒之一,就是基于中国市场形成的数据。
在大模型研发过程中, 数据是其中的决定性因素,数据质量和规模直接影响模型的研发成本和最终呈现效果。
然而,高质量数据往往包含着大量企业机密,就连上传至外部网络都不被允许,更别提交给其它公司用于大模型研发了。
今年三月,韩国媒体《economist》报道,三星内部发生了三起涉及 ChatGPT 误用与滥用案例,导致半导体设备测量资料、产品良率等内容被存入 ChatGPT 学习资料库,给企业造成了重大损失。
也正是因为存在信息泄露的风险,企业间信任成本过高,国外大模型企业往往先着手提升大模型规模,建立产业生态,随后再跟进应用。
某种程度上,近日微软、OpenAI、亚马逊等企业在白宫签订的《自愿承诺书》,既是对 AI 飞速发展所引起的社会担忧的回应,也是向市场释放信号,希望能得到更多社会机构和企业的信任。
回到国内,在国家力量的引导下,国企及地方政府对大模型的态度相对开放,应用、生态、模型建设呈同步发展态势。
比如,华为的盘古大模型落地山东省内开采储量最大、矿井服务年限最长的现代化大型跨井 " 李楼煤矿 "。
2022 年 10 月,华为与山能集团子公司云鼎科技签署合作框架,全面启动矿鸿、人工智能、ICT 基础设施、智慧园区、人才培养、智能穿戴、矿用终端、行业场景 ICT 解决方案等领網域合作。
此后,双方专家一同深入矿井一线,深度参与大模型应用工作,在实际生产中挖掘出采煤、掘进、主运、辅运、提升、安监、防冲、洗选、焦化 9 个专业 21 个应用场景,不断更新模型,并于今年 7 月 18 日正式发布矿山领網域首个 AI 大模型。
据了解,盘古大模型的功能之一是辅助防冲部门进行防冲卸压工程规范性验证,可以降低 82% 人工审核的工作量,实现防冲工程 100% 验收率。
类似的故事也发生在百度、科大讯飞等企业身上。
今年 6 月 27 日,北京发布的首批 10 个行业大模型典型应用案例中,大部分是城市治理、智慧金融、健康医疗和工业现代化等 " 硬核 " 领網域。
其中包括百度与国家电网智能电网研究元共同开发的 " 设备运检知识助手搭载电力行业 NLP 大模型 ",可分别提升电力专业分词、电力营销敏感实体识别 F1 指标 9.27%、13.28%,达到 92.376% 和 94.947%;
科大讯飞与中关村科学城城市大腦共同开发的 " 城市大腦大模型 ",解决城市治理数据资源访问和应用受限、城市治理服务模型通用泛化能力弱以及人工智能时代下的信息安全等问题。
中国企业由此走出了一条与众不同的道路——从行业大模型到通用大模型,然后再反过来看应用的规模化落地需要什么样的大模型技术。
而这一流程也符合业内对于高质量数据生产的普遍共识——通过普及 AI 降低门槛,同时将 AI 落地到产业中去,进而积累和收集更多高质量的数据,最后反推模型进行快速迭代。
国内大模型应用场景之所以与国外产生差异,本质上是算力、算法不占优势的背景下,国家与企业形成合力加速 " 数据 - 模型 - 数据 " 的发展飞轮成型。
而这一轮靠岸时刻里真正决定未来走向的,实际是国内是否能建设起一个兼具高质量、流动性和安全性的数据市场。
日前,中国通信标准化协会和中国信息通信研究院发布《数据库发展研究报告(2023 年)》,报告指出,2022 年全球数据库市场规模为 833 亿美元,中国数据库市场规模为 59.7 亿美元(约合 403.6 亿元人民币),占全球 7.2%。
预计到 2027 年,中国数据库市场总规模将达到 1286.8 亿元,市场年复合增长率(CAGR)为 26.1%。
最甜的蛋糕在哪儿?
综上所述,大模型赛道整体呈现出两个趋势。
一是头部企业从 C 端应用卷向 B 端,部分玩家选择整合自身资源,建立起从数据底座到产业应用的全链条服务体系,另一部分则选择打造大模型平台,与中小企业结合形成合力对领先玩家发起冲击。
二是海外企业首先将大模型落地在企业自有场景,国内企业与实体产业深度结合形成数据飞轮。
潮涨潮退之间,AI 产业链应用层中 " 最甜的一块蛋糕 " 逐渐浮出水面。
从目前的情况来看,语言大模型和视觉大模型是商业化路径最清晰,也是市场上大模型最集中的赛道。除了 ChatGPT 和妙鸭相机这样直面消费者的应用外,在协同办公、影像编辑、智能客服等领網域也在稳步推进。
但这类应用的同质化程度较高,除非像 OpenAI 那样断崖式技术领先,否则呈现出的效果差别不大,更何况即便是 OpenAI 也需要不断推出新功能来留住客户。
7 月 20 日和 7 月 21 日,ChatGPT 先后上调了可通过 GPT-4 发送的消息数量和推出自定义指令功能。
相比之下,同样是基于图文生成能力,多人在线游戏(MMO)则存在更高的行业壁垒。AI 的深度学习功能契合游戏多方面特性,在现阶段的游戏技术开发过程中占主导地位,将为玩家带来更加智能、丰富和个性化的游戏体验。
在游戏版号平稳发放的背景下,游戏产业有望成为短期内大模型应用中最甜的一块蛋糕。
从长远来看,大模型本质上是产业提质增效的工具,客户购买服务或产品的意愿与大模型所能撬动的收益直接相关。因此,想要找到未来最具想象力的应用场景,实际上需要考察的关键指标是产业本身的规模以及护城河的高度。
「硅基研究室」认为,新能源车是未来大模型最具想象力的领網域。
从发展前景来看,新能源车顺应全球 " 低碳环保 " 的消费趋势,有利于降低石化能源消耗,属于发展的 " 刚需 ",世界各国皆有相应的法律法规出台支持相关产业扩大规模。
比如,2022 年 6 月,欧盟 27 国环境部长就一项新的气候保护立法达成一致,2035 年起,欧盟将只允许二氧化碳排放量为 0 的汽车上路。
单从降低二氧化碳排放量这一点出发,大模型便能找到用武之地。
除了行驶,整条汽车产业链本身也是碳排大户,金属原料冶炼、跨国运输、生产制造等环节均是碳减排的重点。然而,由于产业链复杂、数据琐碎、应用场景广泛,车企很难对汽车全生命周期的碳足迹进行收集和评定。
随着汽车产业链智能化,各项数据被传至云端,从中整理出一条清晰地减碳路径也逐渐成为可能,而在这个过程中,大模型的 " 数据 " 飞轮有望成为汽车的 " 第五个轮子 ",打破各环节间的数据壁垒,在产业链条中形成一条智能通路。
另一方面,大模型与新能源车的结合,实际上也是一条共赢的道路。
大模型高昂的推理成本是许多企业对其望而却步的原因。随着技术发展,大模型从云端落地产品,汽车本身也能基于车载芯片进行一定程度的推理任务,并将结果反馈给云端。而对于车主来说,这意味着新能源车将在不联网的情况下仍保持一定的 " 智能 ",是用户体验的加分项。
但当前距离大模型真正赋能新能源车行业,还有几个难关要过。
比如数据储存问题。
早在 2017 年,中国曾兴起过一波工业大数据热,其中典型的场景是关键设备的预警维护。通俗来说,就是通过传感器反馈的数据预测设备有可能在什么时候停机,并提示应该更换什么样的设备。
但真正落实以后发现,形成完整的数据模型需要至少 2 到 3 个周期的数据,仅储存成本就高达上千万,对企业来说风险过高。
而这一点放在今天也成立,因为大模型的研发和后续迭代同样需要海量数据作为支撑,所以,今天的车企更倾向于先进行平台建设,打通数据和业务,然后再用大模型的做一些配适。
其次,相比与生成式大模型,工业领網域更注重稳定性。
举个简单的例子,我们用 ChatGPT 写诗,期待它富有创造力,每篇都不一样,但放在工业领網域里,如果每个指令都不同,那就会出大问题。
因此,大模型与产线的深度结合一定是类似于写代码般生成工业指令或针对具体环节提出优化方案,而不可能真正介入到生产中去。
俗话说,福兮祸所依,祸兮福所伏,大模型落地新能源车产业的两道难关,实际上也是未来在这一领網域做出成果的企业的护城河,随着存储技术的不断发展,以及 " 黑灯工厂 " 这类新型数字化工厂的出现,大模型与新能源产业对接的阻力也正在减少。
在一些较为前沿的领網域,二者已经开始产生化学反应。
目前,大模型在新能源车领網域的落地基本集中在自动驾驶,百度、特斯拉、华为、谷歌均有所布局,百度旗下的 " 萝卜快跑 " 自动驾驶出行服务平台已经在北京亦庄自动驾驶示范区上路。