大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

Agent像人一樣分工協作,還能“群聊”交換信息

2024-02-05 简体 HK SG TW

今天小編分享的科學經驗:Agent像人一樣分工協作,還能“群聊”交換信息,歡迎閲讀。

智能體也要有 " 規範手冊 "!

一項名為MetaGPT的研究,通過對智能體角色進行明确分工,并要求多個智能體在協作中采用統一規範的 " 交流格式 " 等方法,讓智能體性能大增。

目前,這項研究在 GitHub 上已狂攬 33.6k 星,并在深度學習頂會 ICLR 2024 上被收錄為 Oral 論文。

總的來説,MetaGPT 是模仿人類的分工協作方式,将各種任務的标準操作流程編碼為智能體的 " 規範手冊 ",不同角色的智能體負責不同的專業任務。

比如產品經理角色可以使用網絡搜索工具,而工程師角色可以執行代碼:

由此多智能體協作完成任務。

研究人員甚至還為智能體們設定了一個 " 消息共享群 ",不同角色的智能體可以在 " 群 " 裏自由查看和自我任務相關的其他智能體發送來的消息。

經測試,使用這種方法,在代碼補全任務的公開數據集 HumanEval 和 MBPP 上,MetaGPT 分别取得了 85.9% 和 87.7% 的新 SOTA。

目前這項工作已開源,在全網受到不少網友關注:

MetaGPT 長啥樣?

這項研究由 DeepWisdom 團隊聯合 KAUST AI 中心、廈門大學、CUHK(SZ)、南京大學、UPenn 以及 UCB 等眾多高校機構的學者共同提出。

随着大模型能力的不斷提升,基于大模型的智能體來解決各種任務在學術界和工業界的興趣日益增長。

值得注意的是,對于采用多個智能體協作解決特定領網域問題的研究仍處于早期階段。現有研究主要集中在通過角色扮演機制和通信拓撲設定來增強任務理解和推理決策能力。盡管取得了一定進展,但這些方法仍然依賴于直接的對話形式,缺乏對智能體行為的标準規範和約束。

近期的一些工作也指出,基于對話形式的多智能體系統可能面臨信息不一致、歧義以及可能的無效重復和無限循環等問題。

相較之下,人類工作流程中的标準操作流程(SOPs)不僅明确定義了參與角色的分工和拓撲結構,還建立了角色產出結果的标準規範。

研究表明,明确定義的 SOPs 可以提高任務執行的一致性和準确性,确保最終結果符合規定的質量标準。因此,為解決多智能體協作中的挑戰,研究人員設計了基于大模型的智能體元編程框架 MetaGPT。

MetaGPT 要求智能體以專家形式參與協作,并按要求生成結構化的輸出,例如高質量的需求文檔、架構設計圖和流程圖等。

結構化的輸出對于單個智能體即是更高層次的思維鏈(Chain-of-Thought),對于下遊角色則是語義清晰、目标明确的上下文(Context)。

在 MetaGPT 的框架中,研究人員将 SOPs 的概念對齊至角色專業化、通信協定設計以及迭代式的可執行反饋設計。

角色專業化

通過明确定義的角色分工,復雜的工作得以分解為更小、更具體的任務。

如下圖所示,不同專業的角色,初始化為不同的目标和約束,以及不同的專業技能。如產品經理角色可以使用網絡搜索工具,而工程師角色可以執行代碼。與此同時,每個角色都默認遵循 ReAct 的行為模式。

角色專業化使得每個智能體能夠專注于其領網域内的具體任務,從而提升了大模型的輸出質量。

對于軟體開發而言,通過角色的流轉,這種分工更巧妙地完成了從自然語言到編程語言的對齊。論文中的角色消融實驗進一步證明了這一部分的效果。

通信協定設計

在實際應用中,自然語言雖然具備語義的豐富性,但由于其非結構化的特性,在消息傳遞過程中常常會導致信息的歪曲甚至重要内容的丢失。

為解決這一問題,作者約束智能體以結構化的輸出(包括文檔和圖表)參與協作,來提高信息的清晰度和完整性。為驗證這一設計,作者設計了多種軟體開發任務,通過生成代碼的可執行性以及生產力指标強調結構化輸出在協作中的關鍵性。

在多智能體協作過程中,為提高通信效率,MetaGPT 引入了基于消息共享的發布 - 訂閲機制(Publish-Subscribe Mechanism)。

如上圖所示,共享消息池允許直接交換消息,任何智能體都可以透明地訪問來自其他智能體的消息,無需詢問并等待響應。訂閲機制使智能體更傾向于接收與自我任務相關的信息,避免分心于不相關的細節。同時,每個智能體可直接從共享消息池中檢索所需信息,形成自我記憶。

可執行反饋

智能體根據環境反饋進行自我優化和主動更新,是智能體具備自主意識的表現。

在軟體開發任務上,MetaGPT 為工程師的智能體設計了可執行反饋機制,以進行代碼質量自動優化。

具體而言,工程師編寫并執行相應的單元測試用例,通過觀察到的執行結果,遞歸地進行決策和自我提示,實現自動 debug。這種設計 - 測試 - 反饋的迭代過程持續進行,直到單元測試通過或達到最大重試次數。

多個基準測試新 SOTA

在代碼生成能力上,研究人員采用了兩個公開基準數據集:HumanEval 和 MBPP,并報告 Pass@1 指标。

另外,他們還收集了涵蓋 70 個典型軟體開發任務(如迷你遊戲、數據可視化、影像處理等)的數據集 SoftwareDev,并進行了多個智能體開源框架的對比,對多個軟體開發任務的可執行性和生產效率上進行了統計分析和定性説明。

如下圖所示,MetaGPT 在 HumanEval 和 MBPP 基準測試中均優于之前的方法,分别達到了 85.9% 和 87.7%。相比于 GPT-4 的結果,MetaGPT 在 HumanEval 數據集上相對提升了 28.2%,而加入可執行反饋機制分别在 HumanEval 和 MBPP 上提升了 4.2% 和 5.4%。

在具有挑戰性的 SoftwareDev 數據集上,MetaGPT 在可執行性上的得分為 3.75,非常接近 4,而所需的運行時間較短 ( 503 秒 ) ;生成的代碼行數相對基線框架增加了 2.24 倍,而部門代碼行數所消耗的 token 數下降了 50%。

這些結果突顯了多智能體協作過程中 SOPs 帶來的效率提升。

MetaGPT 在軟體開發任務中的高可執行性和相對較短的運行時間表明了其在實際應用中的實用性和效率。

聚焦在軟體開發領網域,研究人員提供了不同智能體框架能力的定性對比。

他們發現,MetaGPT 不僅具備多種模态的檔案生成能力,也是目前眾多框架中唯一完整覆蓋了真實世界中軟體開發過程的開源框架。

總的來説,MetaGPT 是一個新穎的多智能體框架,結合元編程思想,嵌入 SOPs 來增強大模型在多智能體協作上的能力。

通過角色專業化,工作流管理和靈活的消息機制,使其成為通用性和可移植性高的多智能體框架。

結合迭代式的反饋機制,MetaGPT 在多個基準測試上取得 SOTA 性能。

結合人類社會實踐的 SOPs,啓發了未來對于多智能體社會的研究和探索,也可視為對基于大模型的多智能體框架進行調節的早期嘗試。

論文鏈接:https://arxiv.org/abs/2308.00352

代碼鏈接:https://github.com/geekan/MetaGPT

—  完  —

點這裏關注我,記得标星哦~

一鍵三連「分享」、「點贊」和「在看」

科技前沿進展日日相見 ~  

>
熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重税打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重税打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?硅碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?硅碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裏面都有啥? 曹操墓,裏面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200户連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200户連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 宋慧喬獲視後首次曬照,拿獎杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們