今天小编分享的科技经验:「钱景无限」的Agent,究竟是谁的机会?,欢迎阅读。
近日,主打企业级 Agent 产品的 AI 创企斑头雁智能科技收获了近千万美元的 A 轮融资。
Agent 有「钱景」在业界已是共识。《产业家》的一组数据显示,截止 2023 年 11 月,Agent 赛道发生融资事件 13 起,总融资金额约 735 亿人民币,公司融资均值为 56.54 亿人民币。
而在大洋彼岸,据知名 AI 记者 Matt Schlicht 的统计,至少有 100 个项目在将 Agent 商业化,近 10 万名开发者正在构建 Agent。
AI 界迅速凝聚共识离不开大佬们的推波助澜。
从去年 6 月 OpenAI 应用研究主管 Lilian Weng 提出 Agent 是 AI 应用层的发展方向,到 11 月比尔 · 盖茨在博文中指出 " 谁能主宰个人助理 Agent,那才是大事。因为你将永远不去搜索网站,不去生产力网站,不去亚马逊 ",「大模型赋能千行百业」俨然已经更新成「Agent 赋能千行百业」。
近期由 IDC、钉钉联合发布的《2024 AIGC 应用层十大趋势》中同样强调:"AI Agent 是大模型落地业务场景的主流形式 "。
为什么 Agent 成为了科技圈的新共识?它的价值是什么?科技弄潮儿又在它身上玩出了什么花样?从蓝图到现实,Agent 距离我们的生活还有多远?
1、Agent,为何成了 AI 界的新顶流?
将大模型应用于生产和生活的过程中,许多人都会碰到的一个问题是,不知道如何与这颗硅基大腦沟通。
对此,市面上甚至出现了许多教人使用大模型的课程。这些课程的重点,往往都围绕着那些咒语般繁琐的提示词展开。
而 Agent 与大模型及其衍生产品相比,最突出的特点就在于,它不需要用户输入精准的提示词(Prompt)。
放在和大模型互動当中,Agent 相当于替用户给出了一系列精准的提示词。从用户的视角出发,Agent 和大模型在体感上的差别在于,Agent 是掌握了一整套工作、思维方式,能主动完成信息抓取、分析和实操的老员工,而大模型只是需要人为反复强调细节信息的新人。
将视角从用户切换到企业身上。
卷了近一年大模型研发后,业界普遍认识到两点。一是价格高昂的通用大模型在各行业中所能起到的助力有限。二是通用大模型很难打出差异,眼下各大厂商的产品在功能上都差不多。
因此,为了吸引用户,尤其是更加务实的企业用户为 AI 买单,必须把高成本、高门槛、泛用的大模型向小型、专业、便捷的方向发展。
用更通俗的话来说就是,大模型企业必须打造出一款便宜、上手门槛低,且能凸显出自身差异的产品级 AI 应用,才能在市场竞争中生存下来。
而 Agent 正是这轮商业逻辑转向的抓手。
与通用大模型的大力出奇迹不同,想要打造出「小而美」的 Agent,背后的企业必须在研发之初就决定好应用的场景和领網域。往往只有对某个行业足够了解,才能觉察到其中的痛点环节。
譬如,近期发布 AI Agent 平台 AskXBOT 的澜码科技,为企业提供文档检索、AI 调用、数据查询、智能编程等基础能力。这个平台的亮点在于它将各种模型能力都集成、封装到了一款工作流设计器中,支持用户使用「拖拉拽」的方式操作,定制 AI 工作流。
在「工作流」上下功夫的灵感来源于周健此前在 PRA(机器流程自动化)厂商弘玑 Cyclone 担任 CTO 的经验。
RPA 已经初步证明了用「拖拉拽」组件构建自动化办公流程的市场需求,但周健发现,RPA 的实操过程中,由于员工缺少专家的经验,人和系统之前仍然存在操作的真空,比如业务流程到底是怎样的——这块知识的「空隙」仍需要人力去填充。
AI Agent 的出现恰好可以弥合空隙。通过一个个 AI 工作流的建立,Agent 既可获得对业务的理解能力,同时可以可自主执行任务,还能随着企业知识库的不断更新同步迭代。
某种程度上,「Knowhow、技术并重」是做好 Agent 的前提,开头提到的斑头雁智能科技的创始人张毅身上也能看到类似的特质。
张毅是原钉钉副总裁,任职期间,他曾用 8 年时间带领团队陆续打造出钉钉考勤、审批、智能人事、日志、健康打卡等产品。此外,他还在阿里无线技术委员会、ToB 产品委员会担任委员。
Agent 之所以成为创业者新的淘金地,也很好理解。一方面,在「大炼模型」阶段,AI 创企由于在算力和技术上处于劣势,往往很难和 BAT 这样的大厂进行竞争。另一方面,进入到 Agent 阶段之后,研发者对行业的理解以及专业数据库扮演起了更重要的角色,这恰恰是他们的优势所在。
2、Agent 组团出道,还是单飞?
Agent 的落地形式有两种,一种是单体 Agent,一种是群体 Agent。
单体 Agent 的特点是以组件的形式嵌入传统产业链当中去,针对颗粒度非常细的场景做优化。
比如高瓴创投投资的语音转录平台 Airgram,推出了销售场景下的会议 Agent;成立于 2021 年的魔音智能的 Agent,聚焦在私網域运营和客服场景。而百度、滴滴、蓝凌等大中型厂商,则针对企业的费控、数据分析、沟通等具体工作环节,分别推出了 Agent 方案。
这种做法的优点在于嵌入性、稳定性强,不会给企业运行带来太多的动荡。
对大型企业来说,除了要考虑未来的发展趋势,维持当下的运行稳定同样重要。因此,技术提供商给出的解决方案必须是开箱即用,能够被快速整合到原先的运行体系中的产品。
这种方式也是业内的主流意见之一,360 创始人周鸿祎就曾在公开场合中表达过,AI 产品与传统产业结合的路径应该是最初以松耦合的方式嵌入业务链条,然后再随着企业的智能化发展不断向其他环节蔓延。
然而,并不是所有业务都可以被切抽成孤立环节的,在这些业务中,直接打造一条 Agent 作业链会是更直接有效的解决方式,群体 Agent 也因此应运而生。
譬如,清华大学计算机科学与技术系副教授刘知远成立的面壁智能,就把軟體开发平台 ChatDev 做成了一家只有 Agent 员工的軟體开发公司。CEO Agent 负责接收用户需求后,并把开发和交付任务分配给 CTO、开发经理、产品经理、测试专员等 Agent 角色。
ChatDev 平台本身也是一个群体 Agent 的经典案例。
虽然从形式上看,ChatDev 只是一家开发 AI 聊天机器人的公司,但这些聊天机器人可以扮演各种专业角色并相互讨论,直至给出一份完整的解决方案,包括源代码、环境依赖和用户手册等等。
与单体 Agent 相比,群体 Agent 有望帮助企业迅速从无到有搭建起新的业务部门或直接兜售解决方案,并且,他们似乎具有一定的创造力。
火遍全球的群体 Agent 项目「斯坦福小镇」就是一个典型案例。创作者在沙盒世界中放置了 25 个 Agent,他们有自己的初始设定,彼此用自然语言对话。结果这些 Agent 之间的互動出现了人类意料之外的变化:Agent 们自己创办了派对,并且它们的人际关系变得更加复杂了。
就目前而言,除了少数几家公司实验性地推出了群体 Agent,大多数企业的选择都是从单体 Agent 出发。
对小企业而言,单体 Agent 路线的技术、算力门槛更低,从研发到形成商业闭环的速度更快。
但另一方面,单体 Agent 的竞争力高度依赖研发者对行业的理解以及背后的数据支撑,如果专业程度不够深,没有用户买单继而形成数据飞轮,就很容易成为大象脚边的蚂蚁。
去年 11 月 GPT Builder 在 OpenAI 的首次开发者大会上亮相后,许多 Agent 创企陷入了深度焦虑。究其原因就是很多企业只是套壳了 Agent 概念,没有真正找到落地场景。
对大公司来说,由于旗下场景、算力、技术储备都足够丰富,在「All in AI」理念的推动下,已经在全流程推动 AI 替代或研发,单体 Agent 或群体 Agent 的路线选择对它们来说并不重要。
有百度内部人士对「硅基研究室」透露,从 2023 年年初开始,李彦宏就已经要求内部养成 AI 思维,工作时保持思考能否将原先的业务用 AI 来做。
另一方面,群体 Agent 本身就是单体 Agent 的组合,虽然涉及到各业务串联等问题,但在场景有限 Agent 开发逻辑中,完全可以谋定而后动。
3、如何打造具备生产力的 Agent?
在介绍 Agent 时,许多人都会用《钢铁侠》里的贾维斯举例子,电影里最能体现 Agent 超越传统意义上工具一幕,是史塔克每次去冒险之前,贾维斯都会询问他要不要给波兹(史塔克的妻子)打个电话。
而在现实生活中,我们接触到 Agent 最多的场景,可能是电话那头的 AI 客服。从这个角度来说,蓝图和现实的距离就是我在电话这头,你在电话那头。
之所以会有这样的落差也不难理解。最直观的原因就是,大模型的复杂推理能力不够强、延迟过高等问题抑制了 Agent 应用的真正成熟,这也是接下来业界工程优化和技术科研突破的方向。
但对大多数企业来说,更务实的着眼处是如何在现有的技术条件下,打造出真正能发挥生产力的 Agent。
办公协同軟體几乎是国内 Agent 生长最肥沃的一片土壤,从 WPS 到钉钉、飞书、企微,都上线了相应的 AI 应用。究其原因,这些平台本身就具备良好的 API 接口和插件体系,这使得将大模型集成到现有工具中变得更加容易。
换而言之,在办公协同领網域,那些 Knowhow 已经被整理成了符合大家工作习惯的工具链,这条链条上锤子、扳手、等工具都准备好了。并且,这个行业本身的数据规模就颇可观,这是训练出高质量输出的 Agent 的基础。
文首提到的张毅在介绍斑头雁拳头产品 BetterYeah AI 时也强调了类似的逻辑。
BetterYeah AI 的一大优势就是拥有整套自研 RPA 等超级自动化工具集,及 Web Builder 低代码平台,可为 Agent 提供手和脚,在更多场景里使用,并大幅降低开发成本。
常被业内人士提及的另一个关键词是调用 Agent 的成本。
虽然与大模型相比,Agent 更贴近产业,也能让客户的每笔钱都花得更值,但不论是对客户还是对开发商,Agent 带来的收益是否迈过了成本的门槛仍是未知数。
一个具体的例子是,斯坦福和谷歌联合研究的 Agent 世界「西部世界小镇」里,每个 Agent 的成本是 20 美元 / 时,比大多数人的时薪都要高。
算力是成本构成的大头,但并非所有企业都有能力深入到算法环节进行优化,因此在交付环节下苦功可能会是更优选。譬如,可以提供一站式 AI 开发平台,或提供封装好的 Agent,帮助企业或部門以极低成本快速应用。
科大讯飞在推广校园 AI 应用时就曾展示过对应开发平台,教师只需要通过自然语言输入需求,平台便可自动生成应用。
最后,也是对买家影响最大的因素,是 Agent 的安全性和隐私性。
Agent 商业化的基础在于捕捉到了用户的痛点环节,这也意味着这些环节往往能接触到企业关键数据或信息。一旦 Agent 被攻击,导致短暂停工或信息泄漏,就有可能造成用户和社会蒙受巨大损失。
眼下 GPT Builer 面临的一个问题就是,开发者发现第三者可以通过与 GPT Builer 的对话套出 Agent 的 Prompt 和上传数据,知识产权无法得到有效保障。
立足当下,Agent 无疑是传统企业的又一次机会,得以绕过算力和技术的壁垒凭借经验再下一城。但同时也应该清晰地认识到,经验有时候也会成为束缚,仍需要对行业范式的改变保持警惕。
毕竟马车夫再怎么钻研给技术,也不可能跑得过汽车。