今天小编分享的财经经验:一句话发红包、远程操控电腦,AI接管人类设备真的要来了?,欢迎阅读。
图片来源:企业官方
蓝鲸新闻 11 月 29 日讯(记者 朱俊熹)" 帮我创建一个面对面群聊,在群聊里发个一万的红包,数量为一百个,名字为‘ AI 给你发的第一个红包’。" 在 11 月 29 日举办的 Agent OpenDay 现场,智谱 AI CEO 张鹏对着手机里的智能体 AutoGLM 发出以上语音指令。除了因现场同时进群的人数过多,导致 AutoGLM 一时未能马上加入群聊外,数百位群成员很快就成功领取到了微信红包。
今年 10 月,国内大模型独角兽智谱 AI 推出能够模拟人类操作手机的自主智能体 AutoGLM,并开启内测。在最新的 OpenDay 活动上,智谱 AI 除了带来更新后的 AutoGLM,还发布了基于 PC 的自主智能体 GLM-PC,主打能够像人一样操作计算机。
智谱 AI 表示,新更新的 AutoGLM 可以挑战完成更复杂的任务。据张鹏现场演示,通过 AutoGLM 在美团 App 上采购火锅食材时,该智能体能够自主执行 54 步无打断操作。在这一过程中,AutoGLM 可以理解并记住复杂指令,在速度表现上也略快于人手动操作。
更新后的 AutoGLM 不再局限于单一应用内的操作,而是支持跨 App 操作。例如,用户可直接对 AutoGLM 输入指令:" 在美团和饿了么上对比一点点的乌龙奶茶的价格哪个更便宜 ",它就会自主完成打开不同 App、比价甚至下单购买等一系列操作。
最新发布的 Auto 产品 GLM-PC 则将互動终端进一步拓展至电腦端,智谱 AI 称这是其 GLM 团队 " 面向‘无人驾驶’ PC 的一次技术探索 "。据官方介绍,目前第一阶段 GLM-PC 的内测体验场景包括发送信息、参与会议、文档处理、网页搜索与总结、远程和定时操作等。此外,还将于明年一季度推出隐形螢幕功能,让人和 GLM-PC 能够使用同一台电腦工作,在提高协作效率的同时,又不会影响人类用户使用物理螢幕。
在演示视频中,当用户下班后没带电腦,但领导要求发送电腦上的某份檔案时,用户就可以用手机给 GLM-PC 发消息来实现远程遥控。GLM-PC 能够自动进行电腦操作,帮用户找到并发送指定檔案。但若涉及到最终发送等关键步骤,GLM-PC 会弹出提醒視窗,待人工确认后才会继续执行操作。
张鹏表示,GLM-PC 使用电腦的方式几乎完全和人一样。理论上,只要是为人类设计的应用,GLM-PC 在学习之后都能够执行。它所基于的模型仅需视觉截图作为输入,而不依赖 HTML、API 等传统接口。因此,其能力上限更高,具备跨平台、跨系统的泛化能力,可以应用到任意的图形用户界面。
" 不过,由于 PC 的复杂程度,以及大家在 PC 完成的几乎都是复杂任务,坦率的说,今天大模型的能力距离真正代替大家办公还有一定距离。" 张鹏补充称,"GLM-PC 在目前的内测体验中,用户仍需要输入非常精准的指令。"
近来,Anthropic、OpenAI、谷歌等不少国外科技企业也瞄向了 AI 接管人类设备这一领網域,已推出或正在开发相关 AI 产品。据智谱 AutoGLM 技术负责人刘潇现场分享,在探索智能体的过程中,团队发现 AutoGLM 智能体和 OpenAI 的推理模型 o1 从本质上服从同一套 Scaling Law(扩展定律)。o1 模型通过推理过程中的自我反馈监督来持续提升其性能,智能体则通过和环境进行互動,获得来自环境的反馈和监督信号,满足类似 o1 的规模扩展效应。
刘潇表示,在 o1 scaling 的基础上,还观察到智能体存在的能力涌现。例如,随着进一步的训练和规模的扩展,AutoGLM 能够在一个月的时间内,从完成单应用、短距离任务进化到初步胜任跨应用、长距离任务。即使 AutoGLM 从未与微信小程式进行过任何互動式训练,当下达 " 帮我在微信的 Tims 咖啡小程式里下单柑橘美式 " 的指令,并给出一些关键步骤的建议时,AutoGLM 依然能够完成操作。
智谱 AI 称,希望通过规模扩展,未来进一步提升 AutoGLM 的泛化能力,支持更广泛的商业场景。其中一个重要的落地方向便是智能硬體,智谱希望将其智能体推广到手机、电腦、汽车、眼镜等各类终端设备上。过去半年以来,智谱已与荣耀、华硕、小鹏等众多终端厂商达成合作,相关技术负责人也纷纷亮相此次 OpenDay 活动。