今天小编分享的科技经验:为何说AI原生应用是最大机会?李彦宏这场对谈说得很清楚,欢迎阅读。
12 月中旬的周末,北京处在一场持续的寒潮里。每天的最高温度在 -5 度以下,积雪变成冰层结在路面上,车辆很少。我出门前问了问文心一言今天该如何出门,它说尽量选地铁,因为我大概率打不到车。
打车有点晚了。12 月 16 日在 751 的大烟筒旁边,有一场大模型的创业大会。大模型仍然很热,聚集了上千名创业者,还有几十位企业 CEO 来了现场,台下是更多的想找一个跨向 AI 时代的正确姿势的开发者。李彦宏也去了。
在 ChatGPT 发布一年之后,文心一言更新到了 4.0 版本,它现在在网站和 APP 上叫做文心一言专业版,比起最初的版本,现在它能够完成一些多模态的任务,在逻辑和推理能力上已然不可同日而语。而这一年时间里,整个中国大模型的业态也发生了巨大变化,ChatGPT 的惊艳变成一场场躬身入局。到了 12 月的这场降温里,我们似乎正在经历一场大模型过热。
截止今年 10 月,Hugging Face 上已经有接近 3 万个文本生成模型可供下载,国内发布的大模型数量已经达到 238 个。6 月份的时候这个数字是 79 个,相当于 4 个月就翻了 3 倍。但人们到现在仍然只记得那不超过 10 个大模型的名字。
一个围绕大模型的新产业正在形成,但李彦宏发现这个新产业里大部分人都用错了力,这让大模型进入一场资源盲目浪费的怪圈。
更直观明了的创新路径,原本应是在模型上开发 AI 原生应用,或者是用模型改造自己的现有产品,这却在疯狂烧钱、跑分的大模型热中被忽视了。应用才是大模型的价值所在,就像我们最初是从 ChatGPT 的惊艳故事里认识了 OpenAI 和它的大模型,而不是相反,或者从任何榜单跑分上。
李彦宏有些 " 着急 ",关于大家仍然在卷基础模型,而还没有开始卷 AI 原生应用这件事。
现在不是大力出奇迹的阶段了
这也不是李彦宏所经历的第一次 AI 浪潮。AlphaGo 在 2016 年左右引发了全世界的关注,随后计算机视觉的火热又孵化出了一大批新的创业公司。但此前的百度一直保持着定力,飞桨的框架在形成,文心大模型在 2019 年拿出了第一个版本,但百度过去这十几年从来没有做过任何和用人工智能来下围棋有关的事,而对于计算机视觉带来的人脸识别或者智能巡检的想象空间,李彦宏又有所保留。
" 即便你能够下得过全人类的围棋冠军,但这件事能产生的价值是很小的。而人脸识别或者智能巡检这样的场景又很分散,各种各样的场景你都要单独去做一套,一旦场景分散了,就意味着很难有标准化的产品出现。"
图源:百度
李彦宏从未像这次生成式 AI 的出现一样兴奋。
" 这次大模型技术浪潮,我觉得不一样之处就在于它的通用性。我们讲叫 " 智能涌现 ",没有教过的它也学会了。有了这个特点之后,当你有一套基础技术能够做得非常好、非常领先的时候,它在各种各样的场景都能够迅速做出有价值的应用来。这是 AI 过去 70 年从来没有过的事情,所以它是完全不一样的机会。"
技术终究是为应用服务的,而花费大量资源来打榜,甚至过分聚焦模型的基础能力都在某种程度上偏离了这样的原则。
" 模型技术的先进性与否,更多的要看这个模型在什么应用场景下,能干什么。把这个东西想清楚了之后,才能够去评判模型的好坏。有时候我觉得模型好坏的评估能力是一个大模型公司的核心竞争力。你知道什么叫好,什么叫不好,你才能够做出好的来,如果你都不知道,你要靠第三方给你做评价,给你打个分,这个事儿是不靠谱的,你自己都不知道你在干啥?"
一篇论文做过统计,美国所有大学的 GPU 数量集结起来,都训练不出一个 GPT-3.5。OpenAI 用巨大的资源成本完成了生成式 AI 从 0 到 1 的探索,而在一年之后,李彦宏认为对于大部分大模型产业的参与者来说,现在已经过了 " 大力出奇迹 " 的阶段了,甚至更多走向它的反面。
" 大模型到最后价值会落在应用上。这跟所有商业竞争规律都是一样的,谁的效率高谁胜出。你可以融资,我也可以融资,最后我用 10 块钱做出来 100 分的效果,你用 10 块钱做出来 120 分的效果,久而久之你就赢了。"
这也是百度内部在大模型应用研发时所坚持的一条效率路线,李彦宏拿百度文库的 PPT 生成能力举了个例子。
需求从具体场景中出现之后开始向下传递,然后文心大模型必须为这个需求去做优化,优化的时候遇到文心大模型调用成本的问题,再倒逼深度学习框架飞桨去配合模型层做调优,甚至需要调整芯片层去适配框架层的调优。这样一层一层端到端优化下来,现在百度文库 PPT 生成的推理成本基本上降低到 3 月份文心一言发布时的 1%。
" 从原来一天只敢调用一万次,到现在敢一天调用 100 万次,这是完全不一样的感觉。而我觉得这是未来竞争的主线。"
以应用为导向的,都有机会
" 我们需要 100 万量级的 AI 原生应用,但是不需要 100 个大模型。" 李彦宏在 11 月提出过这样一个判断,一个月后这种感觉更强烈了。
PC 时代,基本上只有 Windows 一个作業系統,但是基于 Windows 系统开发的軟體有很多;移动互联网时代,主流作業系統也只有安卓和 iOS 两家,而移动应用有 800 万之多。如果把大模型看作类似作業系統的基础底座,那这个故事的终局可能只有一两个名字,以及无数在中途折戟的玩家。
李彦宏认为大模型时代将会延续这样的特征。人类进入 AI 时代的标志,不是产生很多的大模型,而是 AI 以各种应用为载体自然的进入人类生活。
李彦宏认为发展出好的应用有三个关键因素:
相关产业政策来鼓励基于大模型的 AI 原生应用开发。
现有企业利用大模型来对它的业务核心关键指标产生正向作用。
第三是超级应用的出现,但在什么时候、哪个领網域出现,需要更多创业公司多努力,做各种各样的尝试。
就像移动时代诞生了像微信、抖音、Uber 这样的 "mobile-native" 的应用一样,AI 原生时代一定会有优秀的 AI 原生应用是基于这些大模型开发出来的。在 ChatGPT 出现一年之后,无论是中国也好,美国也好,最好的 AI 原生应用还没出现。
而新的杀手级 AI 原生应用可能是一个全新的场景或创意,也可能先从对现有产品的 AI 原生化改造开始,这方面 Adobe 和微软已经有了值得借鉴的成果。
Midjourney、Stability AI 这样带着生成式 AI 的设计工具并没有让老牌的 Adobe 式微。后者在今年 10 月拿出了世界上第一个专注于生成矢量图形的生成式 AI 模型,并且一口气宣布了 Creative Cloud 的 100 多项重大 AI 创新和更新,从今年 3 月推出 Firefly 影像模型的第一个测试版本到现在,Adobe 的股价在不到一年时间里从 300 美元的水平起跳,几乎翻了一倍。
微软是一个不做大模型的公司,但却做出了现阶段最成功的 AI 原生应用 Copilot,并且已经开始向用户收费,定价 30 美元一月,比整个 OpenAI 全年的收入要大很多倍。目前微软的市值已经到了 2.8 万亿,五倍于 OpenAI。
图源:澎湃新闻
" 大厂会拿走大多数的红利。" 对于现在仍然无法完全把握的 AI 变革和新的 AI 原生应用的机会,李彦宏有这样一个判断。
" 这里所说的大厂不是单指互联网大厂,而是现有几乎所有成型行业自己的大厂,这些当下生产力落后的公司一旦转过弯来,能够很好利用大模型能力的话,他们获得价值增益的总和一定是最大的。"
但这并不代表创业公司没有机会," 创业公司做出三五个 Super APP 是非常有可能的,做出几百个几千个非常有价值垂类的应用也是非常有可能的。"
而在这场尚未被定义的竞争中,从前做产品的成功经验,大厂的光鲜背景或是深厚的技术背景,可能都不是通向那个成功的 AI 原生应用的决定性因素。
" 学习能力是最重要的 ",李彦宏表示。
" 我认为未来真正成功的 AI 原生应用产品经理,很可能不是某一类人,而是各类人的综合。我见到过的一些比较优秀的人,他学习的专业可能不是计算机科学,但他学习能力往往很强,有产品的感觉,有市场的感觉,同时又不怵技术。这种类型的人是最有可能成为成功的产品经理的。
李彦宏分享了一个他在百度内部对产品经理的看法细节:
" 我有时候会听到百度的产品经理说,我们现在技术很厉害,我们的技术发展也很快,我一定要把百度最优秀的技术及时用到我的产品当中去。
我说,不行啊,大模型能力迭代太快了,我们现在最优秀的技术也是很不成熟的技术,一个月之后它就已经落后了。
所以产品经理自己要先明确业务需求是什么,然后去逼着技术团队把这个需求给我满足了——一定要给我做出来,你现在没做出来,OK,但是你要多长时间之内把它做出来,能提这样要求的 PM 才是合格的 PM。"
用具体的需求去引领看起来 " 全知全能 " 的大模型往更有价值的方向进化,AI 原生应用所有的机会和颠覆性都在这里。