今天小编分享的互联网经验:李彦宏:没有应用,AI模型一文不值,欢迎阅读。
7 月 4 日周四,2024 年世界人工智能大会(WAIC 2024)在上海正式开幕。本届大会以 " 以共商促共享,以善治促善智 " 为主题,将聚焦全球人工智能领網域的前沿技术和创新应用,致力于展示人工智能如何改变世界、塑造未来。
下午 13:30 开始的产业发展主论坛上,百度创始人、董事长兼 CEO 李彦宏出席发表主题演讲。本文整理出核心观点如下:
1、同样参数规模之下,闭源模型的能力比开源模型要更好。当你处在一个激烈竞争的市场环境当中的时候,你需要使让自己的业务的效率比你的同行更高、成本比你的同行更低,这个时候,商业化的闭源模型是最能打的。
2、没有应用,光有一个基础模型,不管是开源还是闭源,一文不值。所以我从去年下半年开始讲,大家不要卷模型了,要去卷应用。
3、文心大模型的日调用量最近超过了 5 亿,代表了真实的需求,说明有人在用、是有人真的从大模型当中获益了,并得到了价值。
4、超级能干的应用比只看 DAU 的超级应用恐怕要更重要,只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。
5、随着基础模型的日益强大,开发应用也越来越简单了,最简单的就是智能体,这也是我们最看好的 AI 应用的发展方向。
6、AI 不是人类的竞争对手,更多的是在扮演副驾的角色,还要人来把关。目前,AI 已经创造了一些全新的工作机会。
以下是李彦宏演讲的主要内容:
各位下午好,非常高兴再次来到上海参加世界人工智能大会。我是这个会议的常客,但是去年因为出国没有来,所以我上一次来参加 WAIC 是 2022 年,我记得当时大会的主题是元宇宙,我当时讲的主题是 AIGC, 就是 AI Generated Content(生成式人工智能),我认为 AI 的技术发展路线发生了方向性的改变,就是从过去的辨别式人工智能转向了未来的生成式人工智能。
这番话当时发表于 2022 年的夏天,五个月之后,大家都知道,ChatGPT 发布了。
后来的事情大家就更清楚,所以两年的时间其实恍若隔世,就是感觉整个世界都变了,人工智能可以说颠覆了绝大多数人的认知。
商业化的闭源模型 " 最能打 "
2023 年国内出现了百魔大战,造成了社会资源的巨大浪费,尤其是算力的浪费,但是也使得我们追赶世界上最先进的基础模型的能力得到了建立。去年 10 月我宣布文心 4.0 发布的时候,我说文心 4.0 的能力跟 GPT-4 相比毫不逊色,好多的同行还不以为然。
今天大家可以看到,国内已经有多款闭源模型声称他们已经追平或者是超越了 GPT-4 的水平。注意,我这里说的是闭源大模型,不是开源大模型。
这也是今年以来就是争议比较多的一个话题,有些个外行甚至混淆了模型开源和代码开源这两个概念。模型开源你拿到的是一大堆的参数,你还是要去做 SFT,还是要去做安全对齐,你不知道这些参数是怎么来的,你是无法做到 " 众人拾柴火焰高 " 的,即使你拿到对应的源代码,你也不知道他用了多少数据,用了什么比例的数据去训练这些个参数,所以拿到这些东西并不能够让你站在巨人的肩膀上去迭代和开发。
所以同样参数规模之下,闭源模型的能力就比开源模型要更好。而如果开源想要能力追平闭源,那么它就需要有更大的参数,这就意味着推理成本会更高,反应速度会更慢。
很多人拿开源模型来改款,以为这样可以更好地服务自己的个性化的应用,殊不知这样你就创造了一个孤本的模型,既无法从基础模型的持续更新当中获益,也没办法跟别人去共享算力。
当然我也承认开源模型在某些场景下是有它的价值的,比如说一些学术研究,或者说在教学领網域,大家想要研究大模型的工作机制形成理论,这个时候可能是有价值的。
因为大家可能也经常听到,就是我们觉得大模型能力很强,但是不知道为什么能力强,因为背后没有理论来支持他,所以研究领網域用开源的我觉得没问题,但是大多数的应用场景开源模型并不合适。
当你处在一个激烈竞争的市场环境当中的时候,你需要使让自己的业务的效率比你的同行更高、成本比你的同行更低,这个时候,商业化的闭源模型那是最能打的。
没有应用,AI 模型一文不值
当然这些都不是最重要的,没有应用,光有一个基础模型,不管是开源还是闭源,一文不值。所以我从去年下半年开始讲,大家不要卷模型了,要去卷应用。
但是我看到我们的媒体仍然是把主要的关注点放在了基础模型身上,一天到晚到处去关注跑分、刷榜,谁又超越 GPT-4 了?OpenAI 又出来 GPT-4o 了等等,今天这个震撼发布,明天那个史诗级更新,但是我要问:应用在哪里?谁从中获益了?
应用其实离我们并不遥远,基于基础模型的应用在各行各业各个领網域都已经开始了逐步的渗透。
两个多月前,我们宣布文心大模型的日调用量超过了 2 亿,最近又超过了 5 亿。其实仅仅是两个多月的时间,调用量发生了这么大的变化,它背后是代表了真实的需求,是有人在用、是有人真的从大模型当中获益了,得到了价值。
比如在快递领網域,让大模型帮助处理订单,做到了一张图、一句话,寄快递不再需要其他的繁琐流程,时间从 3 分多钟缩短到 19 秒,而且 90% 以上的售后问题也都是由大模型来解决,效率提升非常的明显。
再比如在小说的创作领網域,一开始我们用开源模型做出过一些效果,后来改用文心的轻量级模型,经过 10 轮上万组数据的 SFT 和 Post-pretraining(后期预训练),结果有了明显的提升。
最近,我们又转到文心 4.0 的版本,那么仅用了数百条的数据,生成的内容无论是可用率还是优质率,都大大超过了文心的轻量级模型。网文作者们如虎添翼。
超级能干的应用比只看 DAU 的超级应用更重要
其实更通用的领網域,比如说代码生成功能,文心、快马这样的軟體在各个领網域也在逐步地渗透。
百度内部的话,我们有 30% 左右的代码已经是用 AI 生成的,代码的采用率超过了 44%。
不过我们要避免掉入超级应用陷阱,觉得一定要出一个日活用户 10 亿的 APP 才叫成功。我认为这是移动时代的思维,AI 时代的规律很可能不是这样。超级能干的应用比只看 DAU 的超级应用恐怕要更重要,只要对产业、对应用场景能产生大的增益,整体的价值就比移动互联网要大多了。
看好智能体的应用发展方向
随着基础模型的日益强大,开发应用也越来越简单了,最简单的就是智能体,这也是我们最看好的 AI 应用的发展方向。
制作一个好的智能体通常并不需要编码,只要用人话,把这个智能体的工作流说清楚,再配上专有的知识库,一般就是一个很有价值的智能体了,这比互联网时代制作一个网页还要简单。
未来,在医疗、金融、教育、制造、交通、农业等等领網域,都会依据自己的场景,自己特有的经验、规则、数据等等做出各种各样的智能体,将来会有数以百万量级的智能体出现,形成庞大的智能体生态。
而搜索是智能体分发的最大的入口。刚刚过去的高考季,很多大模型公司热衷于去写高考作文:我用 AI 写一个作文能得多少分儿?其实这个实用价值是不大的,人家不会允许你带一个大模型进去参加高考。
真正的需求是大量的考生在考完之后要报志愿,要选择学校、选择专业。他们对一所大学一个专业会有各种各样的问题,而每一个考生的情况又是不一样的。这个时候就是需要有一个智能体来回答每一个考生专有的问题。
在高峰时期,百度的高考智能体每天要回答超过 200 万个考生的问题,而我们总共只有 1000 万的考生。在一天当中,有这么大比例的人在利用这个智能体,说明 AI 正在以前所未有的速度向各行各业渗透。
AI 只是辅助,相关工作机会正大量诞生
很多人担心,如果我们日常的工作都让 AI 去做了,人是不是就没有工作机会了?
这种担心不是没有道理,但是过去这段时间,我听到的担心、听到的抱怨很多,听到的建设性的意见比较少,很少有人去致力于发掘生成式 AI 带来的新的工作机会,我在这儿算是抛砖引玉吧。
我觉得,一方面 AI 更多的是在扮演副驾的角色,还要人来把关,AI 只是辅助人工作,而不是替代人工作,它让人的工作效率更高,质量更好。另外一方面,我们也看到有一些全新的工作机会开始冒出来了。
比如数据标注师,过去几年我们帮助全国 20 多个城市落地了数据标注中心,提供了大量的新的就业岗位;再比如提示词工程师,以后不用编程了,但是做好一个智能体还需要把工作流说清楚,这里头要有很强的逻辑性,要用提示词对模型进行调校。
随着智能体的大量涌现,这种工作需求也会飙升。这些个工作机会通常门槛并不高,你做的一般也能够养家活口,做得好的话,那上限可以年薪百万。
自人类文明诞生以来,永不停止的创新,就是刻在我们 DNA 当中的,从石器时代的手斧,到移动时代的手机,再到 AI 时代的大模型,人类不断创造各种工具来改善生活、提高生产力,但是它们永远只是工具,只有在被人类所使用的时候才有价值。
我们坚定地相信,AI 不是人类的竞争对手,构建和应用人工智能技术是为了满足人的需求,增强人的能力,让人类的生活更美好。谢谢。