大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科技

剛剛,OpenAl 發布 Agent 工具包,網友:謝謝 Manus AI

2025-03-12 简体 HK SG TW

今天小編分享的科技經驗:剛剛,OpenAl 發布 Agent 工具包,網友:謝謝 Manus AI,歡迎閲讀。

就在剛剛,OpenAI 發布了一系列專為構建 AI Agents 設計的新工具和 API,幫助開發者更容易地創建能自動完成任務的 AI Agents(智能體)。

OpenAI 認為雖然過去一年推出的高級推理、多模态互動等模型能力為 Agent 奠定了基礎,但開發者在構建生產級 Agent 時,還會遇到不少難題。

為此,這次發布的核心產品包括全新的 Responses API、三種内置工具以及以及一個開源的 Agents SDK。

省流版如下:

Responses API:結合 Chat Completions API 簡潔性與 Assistants API 工具使用能力的新型 API 接口

Web 搜索工具(Web Search Tool):讓模型訪問互聯網獲取最新信息的工具

檔案搜索工具(File Search Tool):從大量文檔中檢索相關信息的增強工具

計算機使用工具(Computer Use Tool):由 Computer-Using Agent ( CUA ) 模型提供支持的計算機操作自動化工具,讓 AI 能像人一樣操作電腦界面

Agents SDK:基于 Swarm 框架更新,簡化多 Agent 工作流程編排的開源框架

具體來説,Responses API 結合了 Chat Completions API(主要用來生成對話回復)的簡潔性和 Assistants API(能讓 AI 調用外部功能,比如查資料、操作東西)的工具使用能力,成為構建 Agent 應用的新基礎。

在内置工具方面,Web 搜索工具支持 GPT-4o 和 GPT-4o-mini 模型獲取網絡最新信息并提供清晰的引用。在 SimpleQA 基準測試中,這兩款模型的搜索預覽版分别拿下了 90% 和 88% 的亮眼準确率。

更新後的檔案搜索工具更是給力,支持多種檔案格式,還能優化查詢、過濾元數據、自定義排序,讓開發者從堆積如山的文檔中迅速找到關鍵信息。

計算機使用工具則由與 Operator 相同的 Computer-Using Agent ( CUA ) 模型提供支持,可捕獲模型生成的滑鼠和鍵盤操作,在 OSWorld、WebArena 和 WebVoyager 基準測試中分别取得 38.1%、58.1% 和 87% 的成績。

OpenAI 還推出了開源的 Agents SDK,專門用來簡化多 Agent 工作流程的編排。

相比去年發布的實驗性 Swarm 框架,這個全新 SDK 有了顯著的改進,提供易于配置的 LLM 與内置工具集成、Agent 間智能交接控制、可配置安全檢查以及可視化追蹤等功能,适用于客户支持自動化、多步研究、内容生成等多種應用場景。

一些早期測試用户已經拿這些新工具做出了實打實的成果。

在官網列舉的案例中,Hebbia 利用 Web 搜索工具幫助資產管理者和法律從業者從海量數據中提取可行見解;Navan 将檔案搜索工具應用于 AI 旅行 Agent 中,為用户提供精準的旅行政策答案。

Unify 和 Luminai 則使用計算機使用工具自動化復雜操作流程,特别是對缺乏 API 的傳統系統;Box 利用 Agents SDK 快速構建和部署了企業數據搜索應用。

產品發布後,網友也在 OpenAI 的評論區玩起了梗,甚至還有網友專門留言感謝 Manus AI。

在今天凌晨 1 點的現場直播中,演示人員也向我們展示了一個「個人造型師」 Agent 的應用案例,用來展示各種新工具的能耐。

舉個例子,他們先用檔案搜索工具翻看了用户(比如「Kevin」)的服裝喜好數據,系統輕松整理出這些人的穿衣風格。

然後結合 Web 搜索工具,系統能夠基于用户所在位置(演示中使用了「東京」作為 Kevin 的位置)搜索附近的相關商店,為 Kevin 推薦了東京的 Patagonia 店鋪。

接着,計算機使用工具(Computer Use Tool)登場,自動操作網頁界面,為 Kevin 買下一件黑色 Patagonia 夾克,整個過程行雲流水——點擊、拖拽、填信息,宛如真人在操控。

最後還演示了 Agent 間的交接功能。一個 Agent 将退貨請求無縫交接給客服 Agent,後者能夠調用獲取密碼和提交退款請求等功能,幫助用户完成 Patagonia 夾克的退貨。

可以説,憑借新工具和 API 的默契配合,這些 AI Agent 不僅能讀懂用户喜好、獲取實時資訊、執行復雜操作,還能在不同任務間靈活切換,完美覆蓋從推薦到購買再到退貨的全流程。

至于現有 API 的安排,OpenAI 表示會繼續全力支持 Chat Completions API,為不需要内置工具的開發者提供新模型和功能。

而基于 Assistants API 測試版的反饋,他們已經把關鍵改進整合到 Responses API 中,計劃在功能對齊後,于 2026 年中期正式停用 Assistants API,同時會提供詳細的遷移指南。

新工具的定價也新鮮出爐,Web 搜索每千次查詢分别為 GPT-4o 搜索 30 美元和 GPT-4o-mini 搜索 25 美元;檔案搜索每千次查詢 2.5 美元,檔案存儲 0.1 美元 /GB/ 天(首 GB 免費);計算機使用工具則按每輸入百萬 token/3 美元和每輸出百萬 token/12 美元計費。

OpenAI 表示,随着模型能力變得更加具有 Agent 屬性,他們會繼續深化 API 間的整合,并提供新工具幫助部署、評估和優化生產環境中的 Agent。

英偉達 CEO 黃仁勳曾表示,未來每個公司的 IT 部門将轉變為 AI Agent 的「HR 部門」。

從管人到管 AI,Agent 将很快成為勞動力的重要組成部分,提高各行業的生產力,而此次發布的工具集只是幫助開發者和企業構建、部署和擴展可靠高效 AI Agent 的重要一步。

此前,開發者需要自行組合不同 API 和編寫復雜的協調邏輯來構建 AI Agent,而新工具極大地簡化了這一過程。

Responses API 将多種功能整合成一個簡單接口,而内置工具為 AI 提供了「感知」和「行動」的能力,Agents SDK 則提供了協調多 Agent 的标準框架。

通過降低技術門檻,使得更多企業能夠快速構建和部署 AI Agent,這或許也是 OpenAI 所説的「Agent 元年」的真正含義——讓 AI 不再局限于聊天框,而是能融入現實工作流程,成為你的「數字助理」甚至「數字同事」。

附上 AMA 問答:

Q:哪種作業系統最适合 computer use:Linux、Mac 還是 Windows?是圖形界面(UI)、終端(terminal),還是其他方式更好?哪些應用程式在計算機上表現最佳,還是説這并不重要?

A:CUA 模型主要是針對網頁任務進行訓練的,但早期用户發現它在桌面應用程式上的表現也出乎意料地好。不過現在還處于早期階段,我們還有很多可以改進的地方!

Q:你們會提供 TypeScript SDK 嗎?

A:是的!我們很快會推出 TypeScript SDK,敬請期待!

Q:我們未來會在 API 中看到 o1 pro 嗎?

A: 是的,我們計劃很快在 responses API 中發布它!

Q:我們需要自行管理 Docker 環境來使用計算機功能嗎?

A: 如果你願意,你可以自行管理 Docker 環境,但你也可以使用雲服務,比如 @browserbasehq 或 @scrapybara。

Q:何時會有 Operator 在 API 中可用?

A:從今天開始,你可以在 API 中使用與 Operator 相同的功能!我們已經在新的 Responses API 中部署了驅動 Operator 的 CUA 模型。

Q:你們會考慮提供集成的虛拟機(VM)來支持「 computer use」,或者與合作夥伴合作,以減少搭建環境的需求嗎?

A:目前還沒有這樣的計劃,但你可以查看 CUA 示例應用,其中包含一些示例環境,包括 @scrapybara 和 @browserbasehq,用于遠程托管。

Q:在整個 agent-handoff 流程中,如何确保個人隐私?有沒有什麼方法可以增強用户與 Agent 互動時的隐私保護?

A: 我們有多種隐私保護機制。Agents SDK 支持開發者定義的安全措施(guardrails),用于輸入 / 輸出驗證。此外,你可以使用 input_filter 來限制在交接過程中傳遞的消息上下文。

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們