今天小编分享的教育经验:划重点:2024年AI智能体调查报告与未来展望,欢迎阅读。
以下文章来源于 AI 大模型应用实践 ,作者秋山墨客
AI 技术正以前所未有的速度改变着我们的工作与生活。2024 年,作为大模型驱动的重要应用形式之一的 AI 智能体(AI Agents)已经不再只是科技圈的热门话题,而是成为了各行各业关注的焦点。从自动化简单任务到协助数据分析,甚至编写代码,AI 智能体的应用范围正在不断扩大。那么,这些 AI 智能体是否真的如预期般发挥了作用?企业又是如何将它们融入日常工作流程中的?本次为大家简单解析LangChain 公司发布的最新调查报告《State of AI Agents》中的核心观点,了解 AI 智能体的现状与未来。
整体应用现状
AI 智能体被定义为使用大型语言模型(LLM)来决定应用程式控制流的系统。它们的能力范围广泛,从简单的自动化到复杂的决策支持。调查显示,约有 51% 的受访者已经在生产中使用 AI 智能体,而 78% 的受访者有计划不久后将 AI 智能体投入生产。这表明,尽管很多潜在用户对 AI 智能体的兴趣很高,但实际部署仍然面临挑战。
行业采用兴趣
调查发现,不仅技术行业,非技术行业的公司也对 AI 智能体表现出了浓厚的兴趣。90% 的非技术公司受访者表示已经或计划将 AI 智能体投入生产,与科技公司的 89% 几乎持平。这显示了 AI 智能体的跨行业吸引力:已经不再局限在科技型企业,未来将在更多行业与领網域得以应用。
主要应用场景
AI 智能体已经在很多领網域展示出了强大的应用潜力。调查结果显示,在三个最重要的应用场景中,58% 的受访者将 AI 代理用于研究和摘要生成,53.5% 用于提升个人生产力或提供个人助理服务,45.8% 用于客户服务。例如,AI 智能体可以帮助用户从大量数据中提炼关键信息,或者协助日常任务如日程安排和组织,从而提高个人生产力。在客户服务领網域,AI 智能体也发挥着重要作用,帮助公司处理咨询、故障排除,并加快客户响应时间。
智能体的控制与人类监督
AI 智能体是一个具有自我思考与行动能力的智能应用。随着其功能的逐渐强大,对它们的控制和安全性要求也随之提高。调查显示,大部分人认为追踪和可观察性工具是控制 AI 智能体的首要手段,很多公司还采用了护栏来防止智能体偏离预定路径。例如,一些公司通过人工专家手动检查或评估响应,增加了一层预防措施,确保 AI 代理的决策过程透明且可控。
智能体部署的主要挑战
智能体完成任务的质量是受访者最关心的问题,也是限制更多智能体部署的最重要因素,其重要性是成本和安全的两倍多。AI 智能体的不可预测性(主要来自 LLM)增加了错误的可能性,使得团队难以确保智能体始终提供准确、适当的响应。
需要注意的是,小型公司尤其关注任务的性能与质量,45.8% 的小型公司将其作为主要关注点,而成本仅为 22.4%。这一差距凸显了可靠、高质量的任务完成对于组织将智能体从开发转移到生产是决定性的因素。
当然,智能体的挑战并不限于任务质量。许多人对构建和测试智能里的最佳实践感到不确定,来自于另两个主要障碍,技术与时间。
技术知识:团队对智能体构建所需的技术知识储备不足,尚在学习中。
时间成本:构建、部署、调试、平涂智能体所需的时间投入非常大。
成功案例(海外)
在调查中,Cursor、Perplexity 和 Replit 是最受讨论的 AI 智能体应用。这里面 Cursor 是一个 AI 驱动的代码编辑器,帮助开发者编写、调试和解析代码;Perplexity 则利用 AI 革新了传统的搜索引擎的工作与呈现方式;而 Replit 则通过設定环境和配置,加速軟體开发生命周期,让用户在几分钟内构建和部署功能完备的应用。
最感兴趣的智能体能力
随着 AI 智能体的采用,组织在采用与部署时面临着不断演变的期望和挑战。调查显示,人们对智能体以下能力最感兴趣:多步骤复杂任务、自动化重复任务、多智能体任务路由与协作、智能规划与推理。
以上是 Langchain 公司在最新的 AI 智能体调查报告中展示的核心结论与观点,我们进行提炼供大家参考。
不得不说,当前 AI 智能体与 RAG 应用(某种意义上也可以把 RAG 看作一种智能体)是在大模型之上最被寄以厚望的应用形态。随着基础大模型、以及各种理论、框架与实验性项目的发展与成熟,可以预计,AI 智能体的可靠性、可控性等问题将在未来得以逐步解决,从而将得以更广阔与深入的应用。可以期待,AI 智能体将以更加深远的方式塑造我们的世界。
文中配图来自 LangChain 调查报告,原文参考:
https://www.langchain.com/stateofaiagents