今天小编分享的互联网经验:百度电话会:文心大模型日调用量已超5000万次,欢迎阅读。
2 月 28 日港股盘后美股盘前,百度公布 2023 年第四季度及全年财报,当季除爱奇艺外的百度核心收入为 274.9 亿元,超出市场预期的 273.1 亿元,同比增长 7%。集团全年营收达 1345.98 亿元,较上年增长 9%;归属百度的净利润(non-GAAP)287 亿元,同比增速达 39%。
在随后进行的电话会上,百度创始人、董事长兼首席执行官李彦宏透露,百度智能云四季度总营收 84 亿元,其中大模型为云业务带来约 6.6 亿元增量收入。文心大模型的日调用量已超过 5000 万次,季度环比增长 190%;12 月,约有 2.6 万家企业调用文心大模型,季度环比增长 150%。目前,三星、荣耀、汽车之家等知名企业均与百度达成合作。
并且,近期上线的千帆 AppBuilder 和千帆 ModelBuilder 两款 MaaS 产品都已取得亮眼的成绩,截至目前,千帆 ModelBuilder 累计精调了 10000 个模型。
以下为电话会分析师 Q&A 环节纪要:
Q1: 展望未来,管理层如何看待 2024 年中国的宏观经济形势?对于整个百度 2024 年的增长前景,管理层有什么看法?在 2024 年,百度总收入中 AI 相关收入的比例是多少?
去年我们的宏观经济环境非常具有挑战性,但我们的业务表现非常稳健。我们非常积极地投资生成式 AI,但我们的非美国 GAAP 营业利润率同比增长,收入经验和资金增长。更重要的是,我们开始从 AI 和基础模型中产生增量收入。
今年,我们注意到中央和地方政府都在努力发展经济,农历新年假期我们看到了消费增长,特别是在旅游领網域,但我们仍然在一个充满不确定性的宏观环境中运营。
我们的核心业务保持稳健,生成式 AI 和基础模型的增量收入将在 2024 年增加到数十亿,为我们总收入的增长做出贡献。我认为百度能够维持长期增长,速度将比中国的 GDP 增长更快。
Q2: 还有多少降本增效的空间?如何看待与 AI 相关的投资?
百度将继续专注于我们的核心业务,大幅减少对非战略业务的资源分配。此外,我们通过层级扁平化,优化了企业组织架构,不断提高我们的整体组织效率。今年我们会持续优化运营效率,确保每个人都更有生产力。
虽然 AI 领網域的投资有所增加,但这些投资预计不会对利润率产生重大影响,我们的长期 GAAP 营业利润率仍然比去年同期增长了两个百分点。
Q3: AI 相关的收入贡献有没有侵蚀搜索业务的份额?
我们是中国最大的搜索引擎。我们拥有近 7 亿月活跃用户,并在中国互联网和移动用户中建立了非常强大的品牌形象。他们依赖我们提供全面可靠的信息,因此我们拥有强大而稳定的收入和利润。
但我们也对宏观非常敏感,因为我们的广告业务覆盖了不同的垂直领網域。而且,我之前提到宏观经济仍然存在不确定性,但生成式 AI 和 LLM 正在货币化和用户参与方面释放新的机会。
得益于文心一言,我们如今能够提高定位能力。生成和呈现更具相关性的广告。第四季度由此揽下数亿美元的收入,今年的增量收入将增长到数十亿美元。
生成式 AI 是改善用户体验的东西。我们将继续推出新功能,激发 AI 业务更大的潜力,所以我认为 AI 是纯粹的增量收入。
Q4:AI 与云的产品组合是什么?如何预期今年 AI 业务的整体增长?
第四季度 AI 大模型为云业务带来的增量收入已经达到 6.56 亿人民币,2024 全年应该增长至数十亿元人民币。我们已经看到企业越来越有兴趣使用 GenAI 和大语言模型开发新的应用程式和功能,因此我们正在积极构建模型,为他们的产品和解决方案赋能。
同时,我们看到来自外部客户的模型推理相关收入显著增加,虽然目前模型推理这部分收入仍然较小,但我们相信长期下来,这将成为收入增长的重要推动力。我们认为内部客户产生的收入也非常重要,因为这种收入的很大一部分是来自于模型推理。
百度在中国拥有最强大的模型训练和推理 AI 基础设施。因此,这种基础设施可以帮助我们的客户经济高效地构建和运行模型。我们还开发了自己的人工智能原生解决方案,例如 GenAI。因此,这些应用程式正在帮助企业提高生产力和效率,除了与 AI 相关的增量机会,GenAI 和基础模型也为我们的传统云业务带来了新的机遇。因此,我们正继续赢得 CPU 端的云客户和项目。
总体而言,我们会看到云业务收入在 2024 年比去年加速增长,我们对保持云业务的盈利能力非常有信心,企业云业务的毛利率也能够不断提高。而对于 GenAI 和 LLM 业务,市场发展仍处于非常早期的阶段。因此我们应该采取非常动态的定价策略,以快速教育市场并扩大客户渗透。我们相信,从长期来看,新业务应该比传统云业务有更高的利润率。
Q5: AI 产品开发计划是怎样的?新的生成式搜索的利润增长关键指标如何?
我们正在重建包括生成式 AI 的所有产品,我认为 GenAI 和基础模型正在使我们的所有产品更加强大,过去几个月里这方面取得重大进展,初期客户对搜索的反馈不错。GenAI 能让百度回答更广泛的问题,包括更复杂的、开放的和比较性的问题。只有这样,我们才能以更互动的方式提供直接和清晰的答案。
在过去的几个月里,百度搜索结果的生成不再仅仅是简单地混合一些内容和提供一些链接,越来越多的搜索结果是由文心生成的。因此,用户更频繁地与我的产品互动,并提出新问题。例如,在春节假期期间,越来越多的用户来到百度进行内容创作,无论是文本还是图片,百度帮助用户创建新年祝福信息并为他们的亲人生成个性化电子贺卡。这不是搜索引擎的典型用例,但我们看到大量用户依赖百度来完成这类任务。
未来,我们将越来越多地使用文心平台来为搜索查询生成答案。然后,我们使用多轮对话来搞清用户意图,以便通过自然语言解决复杂的用户问题。这一举措已经让搜索体验提升。
我们仍处于使用文心重构百度搜索的早期阶段。我们将继续测试并加速变革,会根据用户反馈启用功能,寻找新体验,直到准备好推出下次大规模更新。总的来说,我们相信通用智能将补充传统搜索,最终增加用户留存、参与度和在平台上的时间。
除了搜索引擎外,文心还充当了 Copilot,它已经从一个帮助用户查找专利和文档的应用转变为一个一站式平台,让用户能够以多种格式创建内容。迄今为止,我认为一些新的付费用户是被这些真正的新功能所吸引。我想强调的是,我们处于使用文心重构我们的应用并构建新体验的早期阶段。同时,我们也在吸引和帮助企业建设。我们相信文心的成功依赖于广泛和积极的应用,无论是对内部开发还是对第三方广告。
Q6: 可否谈一下有关多模态功能、Sora、开设 AI 商店或启动 AI 代理的话题?这些发展是否有关键指标?AI 的运行成本如何?如何进行优化提高效能?
我们手头有的芯片应该能够帮助我们将文心 4.0 提升到更高一个水平。我们将采取应用驱动的方式自我加强,让我们的用户和客户告诉我们在哪里应该进行改进和调整。对于我们的模型来说,可能是构建多模态代理,提高可靠性等。
价格是一个非常重要的问题。制作高性能的基础模型,经济实惠对大规模运营至关重要。我们一直在持续减少模型推理成本。现在文心 3.5 的推理成本大约是 2020 年 3 月版本的 1%。通过这样做,越来越多的企业愿意测试、开发和迭代他们的应用程式。我们理解对许多客户来说,他们倾向于平衡效率、成本和速度,因此我们还提供了较小的语言模型,并帮助我们的客户利用 Moe(专家混合模型)来获得最佳性能。通过我们端到端的方法,我们相信还有充足的空间来降低我们最强大模型的成本,并使我们的客户越来越可负担。
我们正在密切监控由文心平台上开发的应用程式数量,目前文心大模型日调用量超过 5000 万次。目前,来自内部应用程式的学习 API 成本仍然高于外部广告成本。因为来自外部应用程式的学习,不同大小的应用程式需求正在迅速增加。现在只是个开始,随着越来越多的终端用户使用它,文心将变得更加强大、更智能、更有用。
无论是通过我们自己的应用程式还是通过第三方,这将使我们能够培养一个以我们为中心的生态系统。当这些应用程式和模型被终端用户积极使用时,它们还将为我们带来可观的大模型推理收入。
Q7: 文心的企业采用率和其他产品相比如何?目前有多少企业正在使用文心构建模型和应用程式?上个季度相比增长情况如何?增长推动力有哪些?是否能够假设使用文心 API 集成的企业不太可能转向其他大语言模型?
不同规模与不同行业的企业在 12 月通过我们的云服务调用文心 API 的次数,环比增长了 150%。文心 API 的成本已经超过了每天 1500 万美元,我们相信在中国没有其他公司能够吸引这么多客户,并接收到这么高数量的 API 调用请求。
企业选择我们主要是出于以下几个原因。首先,我们在建模和推理方面拥有中国最具成本效益的 AI 基础设施,这主要因为我们具有强大的端到端优化能力,包括 GenAI 和大语言模型,重塑中国公共云入口的竞争格局并增强我们的竞争优势。因此,我们在管理以 GPU 为中心的云方面具有强大的能力,帮助企业在云端构建和运行他们的模型。
其次,文心系列模型已经在过去几个月里吸引了许多客户,我们一直在提升文心的性能,收到了客户的正面反馈。我们还提供不同大小的文心模型,以更好地满足客户关于成本结构的需求。当然,我们是中国第一家推出模型即服务(MaaS)的公司,这是一个一站式的大型语言模型(LLM)和 AI 应用开发平台,使企业易于使用。我们还提供了工具包,帮助企业轻松训练或微调他们的模型,在我们的云端开发应用程式。
有了这两大原因,客户可以通过整合他们自己的专有数据,有目的地进行训练,从而降低成本,也可以直接使用文心 API 来支持他们自己的应用程式。因此,企业可以专注于识别用户,这些举措帮助让 GenAI 和 LLM 上取得了先发优势。
随着越来越多的客户使用我们的 MaaS 平台来开发旨在吸引用户的 AI 原生应用,将在我们这里生成并积累大量的用户和客户想法,这些想法也将允许我们进一步完善工具包。随着我们的工具变得越来越对客户友好,并帮助企业轻松地应用模型和自由开发应用程式,他们将更倾向于继续使用我们的服务。
此外,值得注意的是,在当前使用大型语言模型的阶段,对客户来说,为他们选择的模型创建合适的平台是至关重要的。因此,由于他们需要投入相当的努力来构建和积累使用大型语言模型的最佳提示(prompts),如果要切换到另一个模型,他们将不得不重新建立他们的提示库,这对他们来说是一个挑战。因此,随着我们平台的不断采用和活跃使用,客户满意度和切换成本将帮助我们提高客户留存率。
Q8: 美国的 AI 芯片制裁对百度的 AI 发展有何影响?是否有替代产品的最新消息?百度开发 AI 产品的方式与海外同行有何不同?可能出现哪些成就和挑战?未来几年如何才能跟上海外同行的发展脚步?
短期内,美国制裁对我们的模型开发或产品重塑、变现的影响微乎其微。正如上个季度提到的,我们已经拥有中国最强大的基础模型,我们的 AI 芯片储备使我们能够在接下来的几年里继续增强文心一言的性能。对于模型推理,它需要的芯片不那么强大,我们的储备以及市场上可用的芯片足以支持我们为终端用户开发许多 AI 原生应用。
从长远来看,我们可能无法获得最尖端的 GPU,但是有了最高效的原创軟體栈,用户体验将不会受到影响。在应用层、模型层和框架层都有大量的优化空间。我们的端到端早期 AI 架构,加上我们强大的研发团队,将允许我们使用较不先进的芯片进行高效的模型训练和基础设施建设。这为百度提供了与国内同行相比的独特竞争优势,对于企业和开发者来说,构建文心应用将是采用 AI 的最佳和最高效的方式。
Q9:近来文本生成视频的 AI 技术发展迅速,如何看待这项技术对中国 AI 产业发展以及对文心的影响?可否详细说明文心未来的战略路线图?目前文心在文本生成、文本转图片以及转视频方面表现如何?还需要哪些改进?
这是一个宽泛的话题,首先,多模态或者说文本、音频和视频等多模态的整合是未来基础模型发展的一个重要方向。这对于通用人工智能(AGI)来说是必不可少的,而百度已经在这一领網域进行了投资,并将在未来继续这样做。
其次,如果我们观察基础模型的发展,特别是大型语言模型的市场,会发现这个市场巨大且仍处于非常早期的阶段。即使是世界上最强大的语言模型对于许多应用来说仍然不够好。对于创新的需求很大,小型模型、专家混合模型(MoE)和代理都在非常快速地演进。我们努力使这一产品更加易于所有类型的企业接入,并解决各种领網域的问题。
第三,在视觉基础模型领網域,值得注意的是一个具有巨大市场潜力的重要应用是自动驾驶。在这一领網域,百度是先驱者和全球业务领导者。我们一直在使用扩散和变换器来训练我们的视频生成模型,以服务于自动驾驶的目的。我们还在对象分类、检测和分割方面不断取得进展,从而更好地理解物理世界和物理世界的规则。这使我们能够将道路上捕获的影像和视频转换为特定的标签,从而使自动驾驶技术更加智能、适应性强和安全。总的来说,我们的策略是开发最强大的基础模型来解决现实世界的问题,我们将继续在这一领網域投资,以确保我们的领导地位。