大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 科学

AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX

2025-03-09 简体 HK SG TW

今天小编分享的科学经验:AI玩手机越玩越6!西湖大学发布新智能体:会自我进化的AppAgentX,欢迎阅读。

人工智能正迎来前所未有的变革,其中,大语言模型(LLM)的崛起推动了智能系统从信息处理向自主互動迈进。

以 DeepSeek 为代表的 LLM,凭借强大的语言理解与推理能力,在文本创作、编程辅助、复杂任务规划等领網域展现出卓越表现。

然而,LLM 的潜力远不止于文本生成,它们正在塑造一种全新的智能体形态—— GUI 代理(GUI Agents)。这类智能体不仅能理解指令,还能像人类一样直接操作计算机和手机,摆脱对预设规则或 API 的依赖,带来更自然、高效的互動方式,使 AI 真正融入軟體生态,成为智能作業系統的一部分。

问题在于,目前的 LLM 代理虽然具备强大的推理能力,却在任务执行效率上存在明显瓶颈。

为了解决这个问题,现在,西湖大学 AGI 实验室张驰团队推出了AppAgentX——一款具备自我进化能力的 GUI 代理。它能够在不断执行任务的过程中学习并优化自身的行为模式,实现更加高效的操作。

AppAgentX 的核心创新在于:

自动归纳高效操作模式:代理能够在执行任务时,检测重复性操作模式,并自动总结成更高级别的 " 一键 " 操作。

任务执行更快,减少重复计算:传统的 LLM 代理每次执行任务都需要重新思考操作流程,而 AppAgentX 能够记住并复用执行策略,从而避免重复推理,使得任务执行更加流畅高效。

完全基于视觉操作,适用于各种軟體:传统自动化方法通常需要访问后端 API,而 AppAgentX 仅依赖螢幕视觉信息进行操作,无需后端访问,因此能够在不同軟體、不同设备上通用,真正做到 " 即插即用 "。

AppAgentX:让智能体学会 " 进化 "

过去,计算机的自动化操作主要依赖 RPA(机器人流程自动化),通过预设规则或 API 进行固定任务的执行。然而,这种方式需要大量手动配置,缺乏灵活性。

GUI 代理的出现,改变了这一局面,被誉为軟體世界中的具身智能。

GUI 代理不依赖后端 API,而是像人类一样,通过螢幕视觉、滑鼠和键盘直接操作軟體界面。这意味着,智能体可以自主学习如何操作各种应用程式,甚至能够在不同軟體之间切换,执行复杂的跨应用任务。例如:

办公场景:自动整理文档、批量发送邮件

娱乐与创作:使用 Photoshop 处理影像、生成视频内容

自动化操作:批量录入数据、自动处理订单

跨应用任务:从网页爬取信息后填入 Excel、在多个軟體之间进行联动操作

正因如此,GUI 代理被视为智能助手、数字员工、自动化测试等领網域的下一代解决方案,但现阶段的挑战也很突出:现有的智能体聪明但不够高效。

现有的 LLM 代理通常采用逐步推理(Step-by-step Reasoning)的方式,即每次执行操作前,模型都要推理下一步动作。例如,在进行网页搜索时,它可能会这样决策:

识别需要搜索的信息;

点击搜索框;

输入关键词;

点击搜索按钮。

这种方式赋予了智能体极强的泛化能力,使其能够适应新任务场景,但也带来了执行低效、重复计算严重的问题。

AppAgentX 解决这一痛点的核心思路,是让智能体学会 " 进化 "。

下面是一个 AppAgentX 执行播放音乐的一个例子示意图,当找到了 " 一键 " 操作,就不需要每一步都耗费大量时间思考下一步需要做什么,从而快速完成任务。

‍这里可以看出智能体进化出一个高级操作 " 搜索 ",它取代了一系列低效的低级操作。这种进化避免了重复耗时的逐步推理,显著提高了代理的效率。

△AppAgentX 的功能示意图方法介绍

任务轨迹的分解

在执行任务时,AppAgentX 会将整个过程分解成多个重叠的三元组(即由三个部分组成的组合)。这些三元组包含了页面内容和用户界面(UI)元素的功能描述。

具体来说,智能体会:

生成功能描述:利用大语言模型(LLM),为每个页面和界面元素生成详细的功能描述。这些描述帮助智能体理解每个部分的作用。

合并重复描述:如果某些页面的描述是重复生成的,智能体会将这些描述合并,以减少冗余信息。

记录互動历史:整个互動过程会被记录成一个节点链,形成一个完整的操作历史,便于后续调用。

进化机制与执行过程

在任务执行过程中,AppAgentX 还引入了一种进化机制,使得智能体能够更高效地执行操作。这个机制的核心在于生成 " 捷径节点 ",允许智能体在执行一系列操作时,跳过逐步推理的过程。具体步骤如下:

生成捷径节点:当智能体识别到某些操作具有固定的执行顺序时,它会创建捷径节点。这些节点将多个底层操作整合为一个更高级的动作。

高效执行:通过调用这些捷径节点,智能体可以快速执行一系列操作,而无需逐步推理每一步。这大大提高了任务执行的效率。

从实验结果来看,AppAgentX 从单步的执行效率到总体的 API token 消耗,在多个 GUI 互動任务上展现出了显著的 " 降本增效 "。

总体来说,AppAgentX 作为一项创新的移动终端互動技术,通过构建链式知识存储架构与动态匹配执行机制,在保持大型语言模型代理灵活性的同时显著提升执行效能,实现了无需后端访问的图形界面智能作業系統。

该技术突破性地解决了传统智能体在响应速度与认知能力间的平衡难题,为移动端 AI 应用开辟了新的技术路径。此项研究不仅标志着智能体技术在效率与智能动态平衡方面取得重要突破,更为人机互動领網域提供了可扩展的技术范式。

项目地址:https://appagentx.github.io/

Github 地址:https://github.com/Westlake-AGI-Lab/AppAgentX

Arxiv 地址:https://arxiv.org/abs/2503.02268

—  完  —

学术投稿请于工作日发邮件到:

[email protected]

标题注明【投稿】,告诉我们:

你是谁,从哪来,投稿内容‍

附上论文 / 项目主页链接,以及联系方式哦

我们会(尽量)及时回复你

一键关注 点亮星标

科技前沿进展每日见

一键三连「点赞」「转发」「小心心」

欢迎在评论区留下你的想法!

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他 王治郅:杨瀚森主要的问题是速度 他 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击 贸易战烧进电影院:特朗普拟重税打击 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回 手机电池突破8000mAh?硅碳技术的回 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天 贷款追高炒黄金的人后悔了!有人一天 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵 任天堂对Genki提起Switch 2商标侵 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人 哪吒汽车APP和官网恢复正常 知情人 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌 极越汽车 CEO 夏一平名下青岛/义乌 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商 全国经济第一大省明确,推动组建农商 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅 桑保利:亚马尔有配合意识&有点像梅 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花板”? 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修正案 集玲琳 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压处理器 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們