今天小編分享的互聯網經驗:Manus推着OpenAI走了一步,歡迎閲讀。
出品|虎嗅科技組
作者|孫曉晨
編輯|苗正卿
頭圖|視覺中國
OpenAI 于 3 月 12 日發布了一套新的工具,專門用于 Agent 應用程式的開發構建,而這被認為是在 Manus 壓力下的應對之舉。
據 ManusAI 在社交平台 X 發布的最新消息,目前有 200 萬用户等待使用 Manus。不可否認,盡管尚未真正投入市場,Manus 已收獲大量關注。在經歷刷屏式傳播、" 營銷炒作 " 質疑以及社交平台封号等一系列波折後,Manus 如今的熱度也不再僅限國内,其在海外的關注度亦在走高。
此前,福布斯、TechCrunch 等國外媒體就對 Manus 進行過報道,但态度不一。福布斯所載文章稱 Manus 為 " 世界上第一個完全自主的人工智能代理 ",并表示該智能體 " 可以取代人類 "。而 TechCrunch 的态度則更為謹慎,其記者 Kyle Wiggers 指出 Manus 并沒有為其完成點餐、預訂座位以及生成遊戲等任務,且這款產品也并非新開發的内部模型。在文章中,Wiggers 判斷 "Manus 似乎是一個先于技術創新進行炒作的案例 "。
媒體截然不同的态度反映了當下 Manus" 迷離 " 的定位現狀,有人将其視為 "AGI 前奏 ",也有人指出其僅為營銷之作。而 Manus 的邀請碼制度也使得這款產品 " 猶抱琵琶半遮面 ",在公眾面前一副朦胧面貌。
随着熱度積累,除了知名媒體的報道,海外大 V 也向 Manus 投去目光。海外知名博主 Rowan Cheung 在社交平台 X 上發布關于 Manus 的評測信息,而該條博文浏覽量目前已超 280 萬,創下 Rowan Cheung 個人歷史最高互動記錄。
Rowan Cheung 将 Manus 的出現形容為 " 中國的第二個 DeepSeek 時刻 ",他讓 Manus 進行了三項任務:部署特定網站、選取舊金山的理想租房地點以及創建一門 AI 課程,而 Manus 均順利完成。Rowan Cheung 還提到,在 GAIA 基準上,Manus 表現絕佳,甚至擊敗了 OpenAI 最近推出的 Deep Research。
另一位科技圈博主 Julian Goldie 也對 Manus 贊不絕口,并表示自己直接取消了每月 200 美元的 ChatGPT 訂閲。在他看來,Manus 有着諸多優勢,如可以同時控制 50 個浏覽器、實時創建和編輯檔案、部署網站、在執行研究方面迅捷、可以生成全面報告和可視化效果。
面對 DeepSeek 和 Manus 的連番 " 炸場 ",知名 AI 博主 John Rush 發表自己的看法,直稱 " 按照這個速度,中國将主導人工智能 "。
但海外測評者對 Manus 并非給出清一色好評,也有人對其質疑。
社交平台 X 博主 Alexander Doria 就發文表示自己在測試 Manus 時遇到了錯誤信息和無限循環的問題。The Jackson Laboratory 教授 Derya Unutmaz 對 OpenAI 的 Deep Research 和 Manus 進行了橫向測試比較,結果 Deep Research 在 15 分鍾内完成了任務,而 Manus 在步驟 18/20 時失敗了,且用時 50 分鍾。盡管 Manus 可能存在伺服器過載的可能,但是運行時間确實太長。
盡管有人将 Manus 看作 " 中國的第二個 DeepSeek 時刻 ",且該產品已受到海外關注,但是從谷歌趨勢來看,Manus 過去一周的全球搜索熱度仍遠低于 DeepSeek,且流量主要來自中國。
此外,還有其他博主反饋 Manus 在事實性問題上會犯錯誤、在 STEM 領網域協助和編程方面表現不佳等問題。
總體來看,針對 Manus 的正面評價集中在復雜任務執行能力、多模态工具整合以及成本優勢,而穩定性不足以及事實性缺陷則是用户們對 Manus 主要吐槽的地方。
在媒體以及廣大用户之外,諸如 JPM、GS、UBS 等海外投行也不約而同地關注到 Manus,這也證明了該產品盡管尚未真正面世,但是在市場上已有反響。
不同于 DeepSeek 由海外轉向國内的爆火路徑,Manus 在此前一直被認為 " 國内火爆,海外冷淡 ",而如今随着海外熱度提升,對該智能體的認知和評價也正日趨理性。伴随着對 Manus 的熱烈讨論,全球 AI 話語權的歸屬問題又将成為争論的重點,但是對于 Manus 這一 AI 產品而言,挑戰或許才剛剛開始。