今天小编分享的科技经验:ChatGPT集成于Mac軟體,正从会话助手变身“AI代理人”,欢迎阅读。
现在,所有的目光都聚焦在 OpenAI 身上,大家都翘首以待,看他们在发布会活动的最后一天将会带来怎样的惊喜。
12 月 20 日,OpenAI 为期 12 天的发布会已步入第 11 天,即倒数第二天,该公司发布了 MacOS 桌面应用程式及其与各类应用程式的互操作性功能。这将为 " 代理式人工智能 "(Agentic AI,或称智能体)的未来奠定基础,使 ChatGPT 变得更加强大,并无缝集成到用户的日常工作流程中。
在第 11 天的发布会上,OpenAI 首席产品官凯文 · 韦尔(Kevin Weil)携手两位身着圣诞主题西装的同事,共同探讨了公司最新推出的 MacOS 桌面应用程式。他们着重强调了 ChatGPT 从单纯的会话助手向更为强大的代理工具的转变,这意味着 ChatGPT 现在能够代表用户执行更多任务,为用户带来前所未有的便捷体验。
1 首推三大功能
目前,用户已能通过 MacOS 桌面应用程式来查看和自动化他们的 ChatGPT 工作。尽管 2025 年还将有更多类似版本问世,但在此之前,OpenAI 已率先推出了以下三大功能:
第一,借助 "Work with Apps" 功能,用户现在能够将 ChatGPT 接入更多编码应用程式,涵盖 BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio、AppCode、CLion、DataGrip、GoLand、IntelliJ IDEA、PHPStorm、PyCharm、RubyMine、RustRover、WebStorm、Prompt 以及 Warp 等。
在 MacOS 桌面应用的演示中,OpenAI 展示了人工智能如何深入一个应用程式,获取并理解其上下文信息。一旦用户通过 "Work with Apps" 功能选定某个应用,ChatGPT 便能立即接入,洞察应用内部,提供即时帮助。
当然,ChatGPT 不仅仅是一个简单的查看工具,它依托强大的人工智能模型,能够执行多种功能。在 Warp 的演示中,ChatGPT 不仅能捕捉用户螢幕上的内容,还能深入应用内部,浏览更多信息。例如,在处理长串代码时,ChatGPT 能够实现无滚动浏览,极大地提升了工作效率。
与 Windows Recall 功能相比,ChatGPT 更注重与应用程式的实时协同工作,而非仅仅记录和构建回忆库。在另一场演示中,OpenAI 团队将 ChatGPT 与 XCode 紧密结合,使得它可以在苹果的开发应用程式中工作。用户只需简单提出请求,ChatGPT 便能生成代码或解决编程难题。
值得注意的是,OpenAI 还展示了 ChatGPT 的一项新技能:它能够将生成的代码直接嵌入 XCode 中,这一功能有望极大地简化工作流程。尽管在实时演示中,ChatGPT 的代码尝试遭遇了两次失败,但在第三次尝试时,OpenAI 团队成功让代码运行起来。
第二,对于利用 ChatGPT 进行写作的用户,OpenAI 宣布 MacOS 桌面应用程式现已实现对 Apple Notes、Quip 和 Notion 的支持。在现场演示中,OpenAI 团队正浏览一份文档,该文档旨在为 Notion 中的徒步旅行活动制定指南。
有了这个新功能,ChatGPT 得以与 Notion 无缝协作。现场演示聚焦于文档中的特定文本段落,并设定任务为 " 补充这些对话要点 "。此外,用户还可利用 ChatGPT 的搜索功能来生成回应。例如,在演示中,它根据所选文本生成了关于 " 诺顿皇帝(诺顿一世)" 的对话要点,并附上引用及来源。
第三,除了文本选择、复制粘贴的传统操作外,MacOS 桌面应用支持高级语音模式,同时能与其他应用程式协同工作。在此模式下,用户可在 Apple Notes 中设定 " 节日派对歌单 ",并通过 ChatGPT 征询圣诞老人对候选歌曲的意见。ChatGPT 甚至能指出用户的错误,如将圣诞歌曲《Frosty the Snowman》误写为《Freezy the Snowman》。
这些功能现已正式发布,用户只需确保拥有最新版本的 MacOS 应用程式,并订阅了 ChatGPT Plus、ChatGPT Pro、ChatGPT Team、ChatGPT Enterprise 或 ChatGPT Edu 中的任一服务,即可立即体验。
在隐私保护方面,OpenAI 特别强调,ChatGPT 仅会在用户手动触发的情况下与应用程式进行互動。一旦该功能被激活,用户将明确知晓哪些内容将被附加到消息中,从而有效缓解隐私方面的担忧。
2 又曝 AGI 彩蛋
自美国当地时间 12 月 5 日起,OpenAI 开启了一个密集的新功能发布周期,计划在接下来的 12 天内通过 12 场直播活动陆续推出新产品和功能。在此之前,OpenAI 已经陆续发布了多项创新,包括 ChatGPT Pro 计划、强化微调技术、Sora、互動界面 Canvas,高级语音视觉功能、Projects 功能、ChatGPT 搜索、满血版 o1 模型、通过 API 向第三方开发者开放大模型 o1 系列以及通过电话和 WhatsApp 与 ChatGPT 互动等。
随着发布会接近尾声,人们对于 AGI(通用人工智能)的关注也愈发高涨。OpenAI 在第 11 天发布会最后表示:" 在第 12 天,我们准备了极其特别的内容,千万不要错过哦!"
在演示螢幕的一角,可以看到名为 "AGI_Interface.swift" 的檔案夹。这已经不是过去 12 天里首次出现此类惊喜了。几天前,OpenAI 还揭晓了一个名为 " 超级秘密 AGI" 的日历活动彩蛋,这无疑进一步提升了人们对这 12 天系列公告的期待,大家纷纷猜测这些公告是否在共同描绘一幅通往通用智能的宏伟蓝图。
OpenAI 还透露,ChatGPT 的 Windows 应用程式也将很快发布。但更令人震惊的消息是,他们确认了一个新智能体的存在,并预计将于 2025 年发布。OpenAI 表示:" 随着我们的模型变得越来越强大,ChatGPT 将展现出越来越强的自主性。"
几周前,有传闻称 OpenAI 正在研发一款名为 "Operator" 的代理式人工智能,而该公司在第 11 天的发布活动上仅对这一计划进行了确认。或许,这一举动背后有着来自竞争对手的压力影响。
近期,谷歌宣布了 Project Mariner 项目,该智能体能够代表用户在网页浏览器选项卡上进行导航并执行操作。同样,微软也推出了 Copilot Vision 功能,它能在用户的网络浏览器中查看内容并提供相关信息。当然,Anthropic 更早之前发布了 Computer Use 功能,它在时间上领先于其他同类工具。
现在,OpenAI 的 12 天系列活动仅剩最后一天,而他们似乎将最精彩的部分留到了最后——一个全新且强大的前沿模型即将亮相。我们将拭目以待,看看 OpenAI 究竟带来了什么新产品,以及这个新模型与之前的 o1 模型有何不同。
值得一提的是,一些基准测试已经表明,o1 模型是迄今为止最强大的人工智能模型之一,甚至在编码任务方面超越了 Claude 3.5。近日,X 平台的一位用户据称发现了 GPT-4.5 模型,尽管该模型目前仅提供有限的预览功能。
现在,所有的目光都聚焦在 OpenAI 身上,大家都翘首以待,看他们在发布会活动的最后一天将会带来怎样的惊喜。