今天小编分享的教育经验:第四范式联合创始人胡时伟:AI为什么没有达到令人满意的程度?,欢迎阅读。
关于大模型和生成式 AI 他说的话令人振聋发聩:
" 大语言模型就是一千万个猴子写莎士比亚的作品。"
" 我们不应该期待大模型拥有涌现的能力。"
" 我是不是不用努力、让大模型公司与聪明的 GPT 来解决我的问题就行了?这其实是一个伪命题。想要解决行业的问题,行业从业者必须脚踏实地、付出超常的努力。"
他就是第四范式的联合创始人、首席架构师胡时伟。
第四范式是人工智能技术与服务的供应商,也是国内人工智能领網域的先行者。作为第四范式的联合创始人与首席架构师,胡时伟在过往百度、贝壳与自己的创业经历中看到了 AI 助力企业数字化转型并真正带来质变的潜力,由此立志为下一代企业提供突破关键瓶颈、夯实竞争壁垒的解决方案。
大模型时代催生了怎么样的商业模式?面对来势汹汹的 AI,企业主与创业者需要规避怎样的认知误区?企业应该如何架构自身的数字化能力,并最终为行业带来革命性的变化?
混沌在上海滴水湖洲际酒店举办 " 一 " 思维创新嘉年华活动。用一整座岛、打造两天两夜的共学场,2000 位混沌同学热烈参与其中!邀请 AI 全明星阵容空降授课。
此次,胡时伟做客混沌 " 一 " 思维创新嘉年华,带来的分享是《AI 为企业核心竞争力带来的变革性影响》。本文为混沌 " 一 " 思维创新嘉年华大课笔记第七篇。
授课老师丨胡时伟 第四范式联合创始人,首席架构师
编辑丨混沌商业研究团队
支持丨混沌前沿课
我关心的是 AI 让行业产生质变了吗?
首先,我想讨论技术与商业的关系问题。目前,大部分企业都在强调 " 降本增效 "。问题在于,降本增效的作用是什么?换句话说,如果 AI 技术能够帮助企业降本增效,大家会觉得是一件再自然不过的事情。但是,AI 走到今天为什么还没有达到令人满意的程度?关键在于,降本增效能否对产业形成真正的冲击力?有多少企业发生了质的变化?其中的标杆性企业又发生了多大的变化?
以移动互联网为例,最开始它只起到生产力直接替代的作用。最早,电腦能做什么,手机就能做什么,比如手机上的浏览器、音乐播放器、小游戏等各种应用,用户可以在移动端做着 PC 端的事情到处跑。
而互联网的真正爆发是在滴滴打车、美团外卖、抖音短视频的应用出现后,因为它们是在新的生产力之上叠加了生产关系的进化,实现了产业模式替代。
大模型时代也是同样的道理。目前,我们仍然处于初期阶段,原先由人做的事情,现在大模型也能做了,原先只有人能聊天,现在大模型也能聊天了,这就是早期的生产力替代。
但是,大模型时代究竟有怎样的新模式?其中会不会产生像滴滴打车之于出租车的变化?想必这也是各位创业者与从业者十分关心的问题。
实际上,大部分大模型项目目前仍处于混沌期,它具有一定的使用价值,但从根本的角度到底解决什么样的模式问题,其实还没有得到解答。在大模型时代的某一阶段,商业模式会变得特别重要。在我看来,这个问题至少可以沿着以下五条思路展开:
第一,新技术能够在什么场景下解决哪些客户的何种需求。任何一项新技术在走向生活与生产的过程中都必须变成一个产品或者以何种方式满足客户的需求,难以做到这一点的大模型可以被淘汰出局。
第二,新技术到底抢了谁的蛋糕,或者是否真正创造了新的蛋糕、是否对产业形成结构性的影响。
第三,如何确定成本结构与ROI。有时候,尽管新技术带来了效率提升,但我们同时需要回答一个问题:为了获得这些好处,我们付出了多少成本代价。比如有企业做营销模型,花费四五百万买伺服器、招团队,最后只盈利了三十万,这样的情况比比皆是。
第四,企业是否具备足够的资源能力,来以产业协作的模式落地。
第五,企业能否建立起足够的竞争壁垒。首先,面对新技术企业需要主动出击,否则将会面临被淘汰的风险。然而,主动出击仅仅能够保证我们不会输在起跑线上,究竟谁用新的技术产生了革命性的变化,还是要看模式的竞争壁垒够不够深。
就我个人的过往经历而言,百度与贝壳找房的共同特点,无不是回答了上面的五个问题,叠加数字化或者人工智能、机器学习的技术,最终为行业带来了质的变化。
百度为广告行业带来的最大变化,是打破了广告的搜索与分发规则。从原先广告卖的是关键词与一整个版面,到开拓了单人单次刷新的单独售卖模式。这具有颠覆性的创新,AI 在其中发挥了重要作用,它可以帮助广告做关键词推荐、为每一次刷新进行动态计算。
而对于产业互联网而言,运营模式十分重要。以贝壳找房为例,大家对贝壳找房的普遍印象,是它的 ACN 与行业运作标准化。
我想从另一个角度描述这个问题。在贝壳找房之前,中国中介行业的规模不超过四万,而贝壳的平台可以达五十万人。实际上,这不完全是由行业标准化 ACN 导致的。贝壳旗下经纪人的平均年龄、平均从业时间、平均培养周期,与其他中介公司之间存在数量级的差距。同时,为了把行业的集中度提升十倍,我们致力于降低从业者的方差,让系统与人配合,使得更多员工在平台上进行有序的工作。
就此而言,下一代企业如果想要拥有碾压竞争对手的核心竞争力、以远超行业水平的扩张能力与利润水平在市场竞争中获胜,必须要具备无法轻易复制的竞争壁垒、量变到质变的运营水平,以及在某些产业关键要素上比别人好十倍,由此带来一个关键资源瓶颈解锁后的指数级扩张能力。
关于大模型和生成式 AI 的 5 个认知误区
第二部分我想讨论 AI 和技术的原理。AI 这件事起起伏伏,而我们正处于 " 起 " 的阶段。但是,比起 " 起 " 的阶段,我们更应该关注中间的沉寂周期。一项技术之所以在爆火之后引起质疑或销声匿迹,是因为它无法满足大众对于 "技术应该为生产生活带来巨大的改变" 的预期,而往往在沉寂期之内是技术冷静下来真正带来价值产生沉淀的部分。
在这种起伏的浪潮之中,我们同样可以看到两种趋势。第一,是 "一浪高过一浪", 我认为 AI 总体上在产业的价值一定会越来越大,按照 VC 维的理论,随着数据越来越多,规则数越来越多,机器创造的价值一定会越来越大。第二,是每个波峰之间的距离在逐渐缩短,原来是二三十年,现在是十年、几年、甚至几个月,AI 就会迎来重大的技术突破。
技术圈看 AI 发展,真正有突破性成功的有 4 个阶段。第一个阶段是人类专家写少量的规则,再输入给计算机;第二是机器利用数据写少量的规则,出现一些简单的模型;第三是机器用海量的数据写大量的规则,这其实就是深度学习,或者叫专用大模型;第四次就是我们现在讲的通用大模型,用海量的数据,在一个大的计算代价下能解决若干个问题,比如问答、总结、扩写。
前两次突破应用的场景非常有限,后两次突破在生产生活中有非常大的作用。比如在专用大模型的时代,我们可以享受到高维、实时、闭环技术带来的代际优势,前面提到的百度与贝壳颠覆了业态,也有推荐算法、人脸识别这类嵌入生活的技术应用。当然也会有比较失败的案例,比如企业盲目做数据中台、AI 中台,大部分都是失败的。最后留下来的都是技术、商业模式和产业发展的结合。
而在通用大模型的时代,我想首先抛出几个有关通用大模型和生成式 AI 的认知误区:
第一个误区,是模型具备一定的推理能力。情况并非如此,至少GPT 类的模型只会续写,没有任何的意识或认知成分。我们可以以推理为目标来做一个专用大模型,或者通过通用大模型在迁移学习上增加新的任务。但是,从实质上讲,大语言模型是通过随机生成预测多个序列,通俗地说,大语言模型就是一千万个猴子写莎士比亚的作品。
第二个误区,是模型具备涌现能力。随着参数的增大,AI 确实可以解决很多问题。但是,所有的涌现都是因为 AI 具备了相应的数据与信息,或者是有对应的任务来对 AI 进行方向性的引导。我们需要用任务的方式,把 GPT 模型的续写能力从语料中引导出来,实质上这仍然是机器学习的架构。我们不应该期待大模型拥有涌现的能力。
第三个误区,是模型可以自动学习、自主进步。至少从目前我们所拥有的工程化能力来讲,有多少 " 人工 " 就有多少 " 智能 ",AI 仍然是一个 " 高级复读机 "。就算我们把行业中所有的培训资料都喂给大模型,它也不一定能够正确回答我们的某些问题。反而我们需要付出很大的力气,对所有的信息加以人工标注和处理,如此 AI 体现出来的智能能力也就越好。
第四个误区,是模型可以通过调优达到不犯错误的状态。由于 GPT 是随机性的生成,有时它会 " 一本正经地胡说八道 ",这是由技术底层原理决定的,通过调优也难以解决。因此,面对生成式 AI 在可靠性、可解释性上的问题,我们要尊重这种不确定性,并通过系统化的工程建设,比如人的运营与反馈,来完成大模型落地的最后一公里。
第五个误区,是模型可以替代人类的工作,从而造成大量的失业。对于这件事,我们其实不必过分焦虑。如果想让一个模型去替代一个岗位,需要付出的努力与代价肯定会比这个岗位本身大得多。另一方面,AI 本身也意味着全新的商业机遇,局部的失业与部分企业的被淘汰是可能发生的,但与其杞人忧天,我们不如积极推动这件事。推动之后,机会就能够掌握在我们自己手上。
大模型不是捷径。从企业的角度来讲,以上五个误区会导向一种错误的认知,原先一个企业花费了很多年的时间来解决行业上的问题,如今有了大模型公司之后,这个企业反而会自问:我是不是不用努力、让大模型公司与聪明的 GPT 来解决我的问题就行了?这其实是一个伪命题。想要解决行业的问题,行业自身的从业者必须付出超常的努力。否则,就算能够让大模型去改造别人,我们也享受不了 AI 的红利。
5 步提升企业的数字化能力
最后,我想讨论企业的数字化能力架构。如果企业有志于为行业带来革命性的变化,应该如何落实行动?
企业经营者在新技术面前,有时会担忧自己跟不上,为了追求快速落地、从追求价值的质变变成场景的生搬硬套,有时会太过依赖解决方案的公司,寄希望找到最佳实践走捷径。当前国内大部分企业已经走到了行业的深水区,需要有原创式的创新能力。我通常会建议企业从战略、策略、执行、技术、安全这五大层面进行思考,全面架构自身的数字化能力。
战 略
战略的问题是行业的问题,即如何找到行业最核心的竞争要素、如何突破限制行业的关键瓶颈、如何找到突破关键瓶颈的竞争优势。
中国的企业当下往往面临几种困境。首先是产业链定位的困境,在微笑曲线当中,高价值链集中在曲线的两端:一端是定义,另一端是真正的服务。而大量的中国企业尚处在中间比较低级的原材料和组装生产制造的价值链上,未具备定义产业链的能力,只是去卷初级价值链。
其次,互联网、物流的发展让企业也受到了更全網域竞争的威胁。以往区網域间文化属性与市场洞察的差别导致难以形成全国性的单一市场,像是以前的链家难以走出北京。这方面正在被新技术所改变,不同城市的细节策略可以通过 AI 服务规模化来覆盖,全網域竞争的企业开始大量出现。
最后,受到企业路径依赖的限制,中国的企业也面临着组织僵化的困境。以企业的人才培养为例,大量的企业通过实践来培养人才。当这些人才成为领导,他们就会按照过去的方式去指挥未来的战斗,这就是僵化为企业带来的问题。
那么,数字化如何才能打破多重困境?从战略的角度,我们要重新审视企业的核心要素以及要素替代的可能性。
第一,我们应该关注当前和未来一段时间内企业的核心资产和关键要素是什么。
第二,解构关键要素所遇到的瓶颈与限制是什么。我们经常提到 " 不可能三角形 ",它指的是成本、质量与规模之间的关系。企业经营者要找到这个 " 不可能三角形 " 的关键瓶颈点。
第三,在关键瓶颈上用数字化形成革命性的变化,将使我们获得巨大竞争优势。各行各业的关键要素,比如连锁行业的店长,房产经纪行业的经纪人,在发展扩张的过程中就会面临优质资源缺失的问题。如何能够解构这种稀缺?用数字化替代和赋能。原来口腔门诊的核心资源瓶颈是院长,现在我们把院长的客户经营、财务经营、治疗等三个关键能力解构成不同的要素,并且进行了不同程度上的要素替代。
第四,为了知道数字化替代是否合理,对战略是否产生正向影响,我们还要进入数字化实验的阶段。
我们并不一定要在每个地方都做到数字化,去寻求降本增效的提升,但是在你的关键资源上,数字化形成革命性的变化,由此就能降低关键资源的稀缺度,带来更高效的集约扩张,让你赢得竞争的关键。
策 略
战略指导企业数字化朝哪走了,策略的重要性在于,要在哪些地方做出正确的决策、怎么让策略的成功率尽可能变高、以及如何让决策不停地迭代更新。
想要在更细颗粒度的层面做好决策,我们必须提升模型的维度与策略的复杂性。从一刀切到形成充分的个性化,包括商品匹配的个性化与服务策略的个性化。
怎么做到个性化?关键在于把不同的事情进行分类,分类之后再匹配不同的策略。类别越细、在关键业务环节的效率就越高。百度、字节千人千面的成功证明维度的指数级提升,的确能够带来极致的业务效果,策略复杂度的重要性即在于此。
在这一过程中,我们必须借助决策类 AI,把人的决策与机器决策结合起来。我们还要关注决策的执行是否有效,构建一个实时迭代的闭环反馈的系统。实际上,四年前我在混沌课上就讨论过这个问题,但是在四年之后,用 AI 驱动的企业仍然寥寥无几。
为什么没有出现大量的用 AI 驱动的企业,这是因为我们没有数据。为什么我们没有数据,因为我们大部分企业再做再多的信息化、数字化,最多只能解决企业 5% 的问题,剩余 95% 的过程类数据仍然难以获得。现实世界与虚拟数字世界之间的鸿沟是巨大的。
执 行
从执行层面来讲,主要是通过生成式 AI 解决策略被高效执行的问题。AIGC 时代,企业的所有軟體都可以重做一遍,把軟體构建在多模态对话框的基础上。AIGC 时代的机会,它为企业的軟體和数字化所带来的提升,主要体现在两个方面:
第一,从使用者的体验来讲,AIGC 可以带来体验跨越式的提升。比如在医疗健康的 2B 领網域,AI 可以帮助老医生操作电腦,从而大大提升医生的工作效率。
第二,AIGC 可以带来軟體开发效率的巨幅提升。数字化最令人头疼的问题是业务与程式员之间、业务思维与实践之间的鸿沟,两者之间还隔着产品经理与界面设计师,由此导致了 " 买家秀 " 与 " 卖家秀 " 之间的差距。AIGC 出现一段时间后将没有反人性的互動,简单来说,我们可以跨越鸿沟、直接给 AI 下达指令,我们怎么说,它就怎么做。
生成式 AI 在企业系统领網域的发展将会经历三个阶段。在 1.0 阶段,AI 能够听从我们的指挥做事。在 2.0 阶段,我们可以让 AI 的 agent 互相协作,或者由人和 AI 通过自然语言的形式进行协作。3.0 阶段解决的是关键要素的解构问题:AI 的 agent 如何替代一部分人力要素,人和 AI 的 agent 怎么通过迭代的方式生成策略。因此,我们就形成了执行过程与企业大腦策略制定过程的闭环。在这个过程中,企业避免了僵化与局網域竞争,前者得益于机器决策,后者得益于数据驱动下的千店千策,由此导向产业链的重新定义与产业的重塑。
还是以牙科创业为例,如果要让一个院长既懂牙科治疗、又懂客户经营、还愿意创业和管理,这无疑是非常困难的。我们可以把牙科诊所的行为解构为众多 agent 和人之间的整套系统,依托这种思维,牙科创业会变得相对简单。
技 术
技术上我们怎么构建企业的数字化团队?首先,大的原则是从建设很多系统变成构建很多 agent。同时,评价系统的方式也要从评价功能变成评价 agent 在业务当中的价值。培训一个系统的过程,也要从原先的业务功能需求变成培训 agent。总体来讲,整个軟體行业会发生变化:从构建系统变成构建 agent 的网络。这些agent从一开始的被动调取,进而进化到辅助人的决策,再到主动参与协作,甚至变成一个协调者。
其次,企业不能止步于把系统构建起来,而是要向着核心战略目标不停提升。企业要建立分工有序、向优迭代的人机协同的管理体系。
安 全
在大模型时代,尤其要关注安全能力。具体而言,首先需要关注数据安全,例如我们需要关注公有云产品的安全认证,避免数据的无意泄漏。
其次是应用安全。大模型时代也有注入,我们甚至可能在 ChatBI 中问出经理的工资。
另外是业务安全。如今,越来越多 AI 在进行闭环的自动反馈和自动学习,如果有人进行模型投毒、恶意喂给它偏向性的样本,我们将很难剔除劣质数据的影响。
最后是生产要素安全。以前,就算代码被偷走也很难引起什么风波,因为别人不知道企业内部是怎么运转的。如今,一旦系统连带着大模型数据被偷走,由系统管理的 agent 与业务也会一并泄露,这将会造成非常大的影响。
Q&A
张晓楠:您刚才提到,结果数据只能解决企业 5% 的问题,剩余的 95% 要依靠过程数据,未来 AI 能够在过程中很好地赋能。能否请您详细论述这一观点。
胡时伟:举个简单的例子,假设每一个讲师都有自己的 agent,听众首先不是向讲师本人、而是向 agent 提问。在这个过程中,我们就知晓了听众的关注重点、他们在什么地方产生了什么联想。这其实就是一个收集过程数据的方式。按照我们以前的想法,我们得请四百个助教来回答问题,如今这四百个助教可以变成 AIGC。其中有很多种建构方式。
张晓楠:目前第四范式在部署什么产品以更好地服务客户,有哪些代表性的场景或案例?
胡时伟:首先,我们会跟产业进行深入的交流。假设我们用到钉钉、企业微信,基本上我们能够得到一个形态、一个员工与企业系统进行互動的接口,这个接口里面可能有一些基础的大模型能力。
但是,这些能力究竟能够在企业的业务中发挥什么具体作用、能够应用到什么场景当中?企业的核心竞争要素应该怎么拆解、应该怎么去构建对应的应用?针对这些问题,第四范式致力于为企业提供从标准化产品到上层战略的解决方案。
另外,不同的 agent 其实对应着不同的能力,每个行业也存在各自的问题。因此,除了商用的通用大模型之外,企业还得构建自己的大模型。第四范式也为此提供对应的解决方案。