今天小編分享的科技經驗:一個邀請碼賣到上萬,昨晚爆火的Manus真有這麼牛?,歡迎閱讀。
" 又一國運級 AI 產品問世 "" 中國 AI 科技再一次震撼全世界 " 。。。
" 拳打 GPT ,腳踢 DeepSeek" "AI 徹底接管了我的電腦 " 。。。
就這些恐怖如斯的标題,再加上一堆的爆火、炸裂、驚人。
不是哥們,差評君就睡了個懶覺,難道錯過了什麼世界性 AI 大突破?
麻溜趕到公司一看,各路媒體争相報道的,原來是國内廠商發布了一款 Agent :Manus ,這家夥還自稱全球首款通用型 Agent 。
而且它真在 GAIA 測試裡,吊打了一眾 OpenAI 們。
不過可惜的是,由于目前 Manus 還處于内測階段,系統容量有限,只能通過邀請碼給部分用戶進行體驗。
這也造就了一種,平時只在某些特殊場合下才能看見的整齊隊形。
由于官方給出的邀請碼實在太少,在某魚上,都出現了邀請碼出售生意。
一個 Manus 的邀請碼都标價幾千上萬。。。
甚至在抖音上,有些直播間直接把 " Manus 測試 " 當成抖加用了。。。
所以這個讓大家都有些癫狂了的 Manus ,到底是個啥?
差評君今天就從 Manus 官方給的示例帶大家雲評價一下。
至于為什麼不用實測,我怎麼會說是因為差評君第一時間沒搞到邀請碼,好不容易搞定了結果人家伺服器炸了。
所以大家先簡單了解一哈子,等後續伺服器恢復了,咱再給大家來詳細評測。
該說不說,就從目前給出的官方演示案例來看, Manus 相當不錯。
因為咱們常用的 GPT 們,基本都只能一個個解決需求,而且大多都還局限在對話,輸出個代碼已經是極限了。
而 Manus 則做到了 " 用戶提需求, AI 全自動、直至完成網頁設計、可視化數據整理等等復雜流程 " 得到的結果還能直接輸出,簡單省力。
舉個栗子:
當向 Manus 提問 " 搜索 Qwen 系列的歷史,他們看看開源了多少模型,并給我做了一份他們非常漂亮的時間線可視化方案 " 後。
Manus 會根據這個簡單的需求,從多個渠道搜索 Qwen 的開源歷史信息等數據,收集起來。
然後統一進行時間線可視化處理,并在這個過程中進行審核數據、完善時間線。
而當用戶發現輸出結果有問題時,直接告訴 Manus ,它就會進一步調整修改。
類似的, Manus 還能幫用戶篩選房產,官方的案例就是用戶希望在紐約購買房產,給出的限定條件是希望有安全的社區環境、低犯罪率、以及優質的教育資源和不要超預算等。
Manus 會将該任務分解為一個個代辦事項,然後通過網絡搜索,收集信息。
最後整合所有信息,結合用戶需求,寫出一份詳細報告,感覺比樓下的房產小哥專業多了。
是不是已經很牛了?
但你先别高興得太早,也别太擔心失業的事兒,更别說 Manus 是新一個 DeepSeek 了。
因為 DeepSeek 是做基礎大模型的,可以說整個 AI 發展都得建立在大模型本身能力的地基上;而 Manus 則是套殼產品( 注意這裡說的套殼并不是貶義詞 )。
更準确地說,哪怕是對話式的 GPT 們,也是基于現有的大模型能力做了一個 wrapper ( 包裝 ),來服務于大家夥。
做個不是很貼切的比方, DeepSeek 是 Android 或者 iOS 這樣的作業系統,那 Manus 就是 App ,兩者就不是一個賽道的,沒啥可比性。
而且,根據今天各大媒體的評測效果來看, Manus 用起來還有幾個問題:
首先,它真的很慢,雖然作為虛拟機在雲端處理任務,完全可以關在後台等它任務完成,不影響咱們同時幹其他事。
但它還是太慢了,一個簡單的任務十幾分鍾,復雜一點的幾個小時都可能,萬一需要多次修改,那等待的時間恐怕能讓人徹底瘋狂。
其次, Manus 也太費 token 了。
就這麼說吧,它拆解、解決一次復雜任務需要消耗的 token ,可能是百萬乃至更高的數量,這對于不少人甚至企業來說,都有點遭不住。
差評君和某位有碼大佬的對話
當然了,大模型的通病 AI 幻覺 Manus 也搞不定。
不少内測用戶就發現 Manus 在某些專業場景,例如金融分析時,很難稱得上出色。
例如,它對股票相關性的分析就過于依賴單一數據源,缺乏交叉驗證機制,導致結論可信度不高。
此外,所謂的 " 自主規劃 " 本質上還是套殼,還拿股票分析來說,它其實就是利用大模型理解你的意思,然後調用雅虎金融 API 檢索數據,再利用 Python 腳本生成可視化圖表。
這些任務執行高度依賴虛拟機内已經預先設定好的 " 工具庫 " 和調用邏輯,一旦你的需求在這些之外,它就 GG 了。
最後也是最重要的, " 全球首款通用型 Agent" 這個說法更是很難喊得響亮,因為它目前并不通用,更不是首款。
因為 Manus 運行在虛拟機中,沒法實現安裝新軟體或者調用本地軟硬體資源等系統級操作。
比如我的需求是把桌面的 3 · 8 婦女節放假通知檔案,通過微信發給世超,但目前的 Manus 就做不到。
所以它更像是市面上層出不窮的浏覽器插件,而非真正意義上的通用 Agent 。
而早在去年 10 月, Claude 大模型的團隊 Anthropic 就已經推出過 "computer use" 。
它和 Manus 本質上都是通過多代理虛拟機環境完成復雜任務,從而給用戶輸出結果。
随後,各大 AI 廠商陸續都推出了自家產品,例如谷歌的 Project Astra 、智譜的 AutoGLM 、 OpenAI 的 Operator 等等。
但一碼歸一碼,目前看下來,Manus 還真是目前 Agent 產品裡做得最好的。
而且它的破圈也給讓 Agent 概念成功在國内( 國外目前還真沒啥聲量 )破圈,畢竟這年頭,酒香還怕巷子深呢。
對了,我們還發現了一個有意思的事情, Manus 的開發團隊 Monica.im 的創始人叫肖弘,他此前最成功的創業項目就是壹伴微信公眾号排版工具(我們編輯部之前還用呢 ),一度有百萬用戶量。
等 2022 年大模型浪潮襲來,他又創立了 Monica ,推出了 AI 插件 Monica ,去年 Monica 用戶超過千萬,一直保持着不錯的盈利,這麼看來 Manus 也算是一種老樹發新芽了。
而 Monica.im 的首席技術官季逸超,早在 2019 年就曾開發過 Magi AI 搜索引擎。
這家夥,除了沒用上如今的大模型能力,簡直就是眼下 AI 搜索引擎的翻版。
是不是有種熟悉的感覺
所以,有這樣的技術團隊,做出一個火爆出圈的 Manus 也挺合理的。
最後差評君想說的是,其實 AI 大模型熱鬧了這麼久,大家也逐漸對對話式的 AI 有了倦怠,都在期待 AI 能夠更進一步地和現實社會發生關聯,比如真正地幫人解決某件事情,而不是簡單地替代搜索引擎,當個百科小助手。
所以,很多人和團隊紛紛下場,去做各種各樣的 Agent ,希望能夠在應用層面上搞點花活。
而從 Manus 官方給的示例,它無疑是當下各路英雄豪傑中的佼佼者。
希望咱能早點做測試,嘿嘿 @Manus 官方。
撰文:八戒