今天小編分享的互聯網經驗:解密Manus:靠垂直整合,搶在了AI大廠前頭,歡迎閲讀。
本文來自微信公眾号:直面 AI,作者:麥思,題圖來自:AI 生成
AI 圈正迎接新一輪的技術爆發期,DeepSeek 以深度推理模型 R1 震撼海内外,OpenAI、Anthropic、谷歌、阿裏、字節、百度等紛紛推進自家大模型的新動态。模型層之外,應用層也開始多了些新變化。
最近的創新來自一家由中國 90 後創始團隊推出的新產品——一款号稱通用 AI Agent 的應用工具 Manus。
Manus 的官網(https://Manus.im/usecases)給出了一些例子可以供我們更加直觀的了解 Manus 的能力,可以看到它的功能在官方演示中确實特别強大,目前 Manus 的使用需要提前獲取邀請碼。
有必要簡單介紹一下 Manus。與傳統 AI 助手相比,類似豆包、Kimi、DeepSeek 這些,其局限于信息檢索與建議互動,而 Manus 首次實現 " 自主執行復雜任務→交付完整成果 " 的閉環能力,填補了當前市場空白。
另外一點是通用性定義的突破:跨領網域處理復雜任務(如股票分析、旅行規劃、代碼生成等),打破垂直賽道 AI 的局限性,這是驚豔的前兩點。第三點是 Manus 是繼中國團隊做出來 DeepSeek 之後的又一力作,定位為 " 手腦并用 " 的通用助手,強調 " 輸入需求→輸出結果 " 的無中介執行模式,命名源自拉丁語 "Mens et Manus"(意為手腦并用),技術理念主張 "Less structure, more intelligence",減少預設流程依賴,強化模型自主進化能力。
一、Manus 的優缺點
總結一下 Manus 的核心優勢:
全流程自主執行:從需求分析(如簡歷篩選)、任務拆解(如房產選購規劃)到成果交付(生成 Excel/PPT 報告)無需人工幹預。
多工具鏈整合:支持浏覽器操作、編程工具調用、跨平台數據抓取,實現復雜操作(如自動解壓簡歷包并分析)。
覆蓋教育(教學材料生成)、金融(股票關系分析)、人力資源(候選人分級)、企業服務(自動化周報)等多領網域。
跨領網域協同:可同時處理比如簡歷篩選與房產選購兩類異構任務,體現通用 Agent 特性。
多 Agent 協作系統:規劃、執行、驗證三模塊分立,雲端虛拟機并行處理任務,提升容錯率。
上面是 Manus 的優勢,同樣 Manus 也有一些劣勢:
依賴預設流程框架:部分任務需在浏覽器與作業系統間的 " 受限環境 " 執行,無法适配未預定義的應用程式。
執行穩定性問題:用户反饋存在崩潰前生成虛假結果(如偽造邀請碼)等不可控行為。
高炒作熱度導致早期用户預期與實際能力落差,部分場景仍需人工修正輸出結果。
企業端部署成本:雲端虛拟機運行模式對算力需求較高,限制中小型企業使用。
自主籤署合同的法律效力尚未明确,隐私數據跨平台調用可能引發合規争議。
職場替代焦慮:80% 中低頻白領工作(如簡歷篩選、報表生成)面臨被低成本 AI 替代的風險。
二、Manus 究竟做了哪些技術創新?
説完優缺點之後,我們再重點看一下使得 Manus 這麼強的背後技術創新,究竟是什麼。
1. 多智能體協作系統(Multi-Agent Collaboration)
三層架構設計:
規劃代理(Planning Agent):采用蒙特卡洛樹搜索(MCTS)算法動态拆解任務優先級,支持實時調整執行路徑(例如在簡歷篩選中優先處理學歷匹配度)。
執行代理(Execution Agent):整合 200+ 工具接口(浏覽器、Office 套件等),通過浏覽器自動化引擎模拟人類操作(點擊、滾動、表單填寫),但受限于未開放 API 的 CS 架構應用。
驗證代理(Validation Agent):部署對抗性測試模塊,檢測邏輯矛盾(如财務數據與行業基準偏差超 5% 時觸發復核流程)。
多重籤名系統(Multisig System):由多個獨立模型協同處理子任務,通過交叉驗證提升結果可靠性(例如股票分析中,3 個模型獨立計算行業關聯度,取置信度最高值)。
2. 動态訓練與優化機制
實時反饋迭代:用户可通過 " 動态培訓 " 功能修正輸出格式(如指定 PPT 模板)或調整執行路徑(如跳過特定網站數據抓取),模型即時更新策略。
崩潰恢復技術:任務中斷時自動生成替代方案(如簡歷解析失敗後改用關鍵詞匹配模式),并保留進度至本地緩存。
3. 工具鏈深度整合
浏覽器沙箱技術:在隔離環境中運行跨平台操作(如自動登錄招聘網站抓取簡歷),避免用户隐私數據泄露。
記憶偏好系統:持續學習用户習慣(如合同模板偏好),占用雲端存儲資源形成個性化執行策略。
4. 性能驗證體系
GAIA 基準測試 ( https://zhuanlan.zhihu.com/p/669652697 ) 突破:在三級測試中分别達 86.5%/70.1%/57.7%,超越 OpenAI 的 DeepResearch 模型,接近人類水平(90%)。
真實場景驗證:在 Upwork 平台完成設計類任務(如 Logo 生成)、Kaggle 競賽中實現數據分析自動化,驗證跨領網域執行能力。
如果上面 Manus 的技術創新讓你眼前一亮,這個時候你是不是會有一個疑問,為什麼是 Manus?其他 AI 廠商,尤其是科技大廠為什麼沒有做出這樣的成果,是其他廠商不具備這樣的能力嗎?目前來看,原因或許有以下幾種因素:
1. 技術路徑依賴。
模型規模優先策略:OpenAI 等廠商聚焦于擴大模型參數量(如追求 GPT-5),未将工具調用能力作為核心研發方向。
規則工程慣性:傳統 AI 產品依賴預設流程(如客服對話樹),難以适應 Manus 倡導的 "Less structure, more intelligence" 理念。
2. 工程化挑戰。
多工具接口适配成本:需為浏覽器、辦公軟體等開發專用驅動,大廠不願幹髒活累活,其他小廠商又缺乏生态整合能力(如 Manus 團隊耗時 2 年完成 200+ 工具接口開發)。
長周期任務管理難題:傳統模型受限于會話式互動,難以實現 " 用户離線後持續執行跨日任務 " 的異步工作機制。
3. 市場定位差異。
B 端服務壁壘:微軟 Copilot 等產品聚焦 Office 場景,缺乏跨領網域泛化能力(如同時處理簡歷篩選與股票分析)。
倫理風險規避:頭部廠商忌憚自主決策引發的法律争議(如合同籤署效力),選擇保守技術路線。
三、Manus 的後續改進和行業影響
針對目前 Manus 表現出的一些缺點,我們認為它未來的改進點如下:
增強環境适應性:突破浏覽器 / 作業系統的 " 夾層 " 限制,實現更底層的系統權限調用。
降低算力依賴:通過模型壓縮與邊緣計算結合,推動中小型企業普及。
優先落地場景:企業自動化辦公(智能客服、合同審核)、教育個性化教學(動态生成課件)。
開源生态建設:開放部分模型接口,吸引開發者構建插件生态(如第三方工具集成)。
建立 AI 執行審計機制:對自主決策過程留痕,明确錯誤結果的責任歸屬。
數據安全規範:限制敏感信息(如簡歷、财務報表)的跨平台流轉權限。
但不容忽視的是,Manus 的出現肯定會對其他廠商帶來一些影響:倒逼 OpenAI 等廠商加速從 " 對話式互動 " 轉向 " 任務執行型 " 產品開發的節奏,加速 Agent 技術迭代;推動多模态互動(文字 / 圖表 / 代碼混合輸出)、工具調用 API 集成成為 AI 產品新基準。
根據 Manus 計劃,後續官方還将開源推理模塊,有望借此催生基于其技術棧的二次開發社區。
Manus 需求爆火,還可能帶動邊緣計算設備需求激增,使得 AI 終端部署從雲端向本地延伸,一批國產硬體廠商也有望從中受益。
AI 的發展速度正推動各行各業重新洗牌,未來不是屬于資產的時代,也不是屬于權力的時代,未來将是屬于科技的時代。
本文來自微信公眾号:直面 AI,作者:麥思