今天小編分享的科學經驗:5個人三小時復刻開源版Manus,邀請碼也不需要了,歡迎閱讀。
這壁壘……一夜走紅的 Manus,現在已經有了開源復刻版!
5 個人 3 個小時,一個完全免費、無需排隊等待的OpenManus就做好了。
至于復現程度,還是直接看 Manus 官方和開源團隊提供的 demo 對比。
作為全球首款通用智能體,官方提供的 case 如下:
而 OpenManus 團隊三小時復刻的成果是醬嬸兒的:
效果大家自己感受一下。
對于動手能力強的小夥伴兒,也期待大家自行體驗後留言反饋。
從開源反推 Manus 的實現路徑
與此同時,通過深扒 OpenManus,我們其實還可以看出一條實現 Manus 的合理路徑。
(當前 Manus 使用了哪家模型、Agent 框架等具體細節處于保密狀态)
概括而言,OpenManus 的背後有三大關鍵:
擁有模塊化 Agent 系統;
具備實時反饋機制;
配備了一整套強大的工具鏈;
展開來說,其核心設計就在這種模塊化 Agent 系統。開發者可以根據需要自由組合不同的功能模塊,從而創造出獨特的 AI 助手。
在 OpenManus 中,擁有不同分工的 Agent 會協作完成需求理解、規劃、行動等任務。
比如 Manus 主代理就像項目經理,負責理解用戶需求并完成分工;PlanningAgent 作為規劃員,負責将復雜任務進一步拆解成可執行的步驟;而 ToolCallAgent 則是技術專家,負責掌管各類工具使用。
以上這一套都是靠開源團隊曾經提出的 MetaGPT(一個多智能體框架)實現,開發者可以自由集成多個合适的大語言模型。
此外,OpenManus 的另一關鍵在于其思維過程是公開透明的。
正如開頭提到的例子,拿到任務後,OpenManus 如何思考問題,如何規劃執行……全都能實時反饋。
這為人類在合适時間進行幹預提供了 " 視窗 ",有助于更高質量完成任務。
最後不得不提到 Agent 對工具的使用。
為了完成復雜任務,OpenManus 也配備了一系列 " 外援 ":
浏覽器自動化:像人類一樣操作浏覽器,自動分析網絡信息并互動;
各種代碼執行器:能夠實時生成和執行代碼;
檔案處理:自動生成和管理各類文檔;
……
需要注意的是,各類工具都不是單獨的模塊,而是需要協同設計。
将以上組合在一起,這類多智能體系統的一般架構為:底層由各類大語言模型構成,中間層通過多智能體協作拆解任務,執行層調用各類 API 接口完成具體操作。
總之,按照 OpenManus 作者的總結,這一開源成果結合了 computer-use、基本的 Agents 以及融合了規劃能力。
正如 OpenManus 團隊在項目致謝中提到的,Claude 廠商 Anthropic 去年上線的computer-use,以及 YC 投資的項目browser-use,都給 OpenManus 提供了基礎支持。
顧名思義,這兩個項目分别被用來操作電腦和浏覽器,而在沙盒環境中操縱正是 Manus 工作的一大核心特征。
5 人開發團隊,3 小時完成復刻
OpenManus 團隊只用了1 個小時就完成了核心系統,整體也只用了 3 個小時。
核心作者梁新兵介紹,OpenManus 的火速上線,來源于 MetaGPT 積累下的技術沉澱。
(注:MetaGPT 是一個多智能體框架,為了處理復雜任務,将不同的角色分配給 GPT 模型,形成一個協作性 " 軟體公司 "。)
我們只是把浏覽器工具鏈嫁接到過去代碼上,配合沉澱的 Agent 工具包。
幾位研發成員,也都是來自 MetaGPT 團隊。
" 開源版 Devin" ——數據解釋器(Data Interpreter),也是出自 MetaGPT 團隊之手。
OpenManus 核心作者梁新兵,畢業于華東師大,還在讀時就參與了 Data Interpreter 的工作。
另一名核心作者向勁宇,本科就讀于西南交通大學應用物理系。
去年,讀大四的他和隊友一起使用 GPT-4 與 Claude 3 組成多智能體的方案,讓 AI 分飾多個角色、相互驗證來完成答題步驟,獲得了阿裡巴巴數學競賽 AI 賽道全球第二名。
在 MetaGPT 社區,向勁宇還和其他成員一起,讓智能體成功在 " 我的世界 " 當中采集到了鑽石。
甚至他還曾經讓智能體假扮知乎大 V,回答了 100 多個問題,獲得 3 萬餘次閱讀,還有贊同、反駁甚至私信關注,結果直到他主動停止,AI 的身份都未被發現。
張佳钇,去年本科畢業于中國人民大學高瓴人工智能學院,現在是港科大(廣州)在讀博士,被 ICLR 2025 接收的智能體框架 AFlow,他和向勁宇是共同一作。
于兆洋,張佳钇在人大的同級同學;洪思睿,MetaGPT 和 Data Interpreter 兩篇論文的共同一作,DeepWisdom 高級研究員,香港科技大學碩士,本科畢業于暨南大學。
AFlow 的作者當中,也有于兆洋和洪思睿的名字。
今年,以張佳钇和向勁宇為共同一作,五個人的名字共同出現在了一個名為 SPO 的項目當中,該項目能夠讓提示詞自我進化,讓人們擺脫研究提示詞工程的繁瑣過程。
并且綜合五名作者的經歷和署名信息可以推斷,除了 15 年取得碩士學位的洪思睿年齡稍長之外,其餘 4 位作者,幾乎都是本科畢業不久,當中有人選擇繼續深造,也有人加入了 DeepWisdom。
重新看 Manus" 套殼風波 "
除此之外,OpenManus 的出現,或許也給 Manus 的 " 套殼風波 " 提供了新的視角。
先簡單回顧一下這場風波。
Manus 被質疑 " 套殼 " 主要源于兩點:
一是有前車之鑑。Manus 背後團隊曾打造出另一款產品—— Monica,而作為一款集成各類大語言模型的插件,Monica 也曾一度陷入套殼争議。
所以對于一家公司出品的東西,大家很容易產生聯想。
在此基礎之上,由于產品被懷疑是套殼縫合而成,因此大家很容易形成 Manus 技術含量不高的印象。
然而,之所以說 OpenManus 是一個新視角,是因為從其復現路徑來看,許多模塊都是基于已有開源項目實現。
實現不同模塊的統籌、調度,形成新的功能,絕非人人都有能力實現。
而且開源社區的一大意義,本就是讓後來的開發者,能夠直接站在巨人的肩膀上。
即使不談開源,各大模型廠商提供 API 給開發者的目的,同樣是讓他們能夠開發新的應用。
說得再誇張一些,引用 Perplexity 創始人的說法,"OpenAI 就是英偉達套殼,英偉達就是台積電套殼,台積電就是沙子套殼…… "。
所以是否 " 套殼 ",不是問題的核心,關鍵是它能不能產生實質性的生產力提升。
但從我們昨天的實測感受來看,Manus 距離這一目标,還有相當長的距離。
所以,把產品的能力打磨好,可能才是比糾結套殼更要緊的事。
你對 Manus 的感受如何?歡迎評論區留言讨論。
開源地址:
https://github.com/mannaandpoem/OpenManus
參考鏈接:
[ 1 ] https://x.com/didiforx/status/1897675038972883408
[ 2 ] https://www.sohu.com/a/827134153_121798711
[ 3 ] https://modelscope.cn/studios/AI-ModelScope/SPO