今天小编分享的互联网经验:Manus推着OpenAI走了一步,欢迎阅读。
出品|虎嗅科技组
作者|孙晓晨
编辑|苗正卿
头图|视觉中国
OpenAI 于 3 月 12 日发布了一套新的工具,专门用于 Agent 应用程式的开发构建,而这被认为是在 Manus 压力下的应对之举。
据 ManusAI 在社交平台 X 发布的最新消息,目前有 200 万用户等待使用 Manus。不可否认,尽管尚未真正投入市场,Manus 已收获大量关注。在经历刷屏式传播、" 营销炒作 " 质疑以及社交平台封号等一系列波折后,Manus 如今的热度也不再仅限国内,其在海外的关注度亦在走高。
此前,福布斯、TechCrunch 等国外媒体就对 Manus 进行过报道,但态度不一。福布斯所载文章称 Manus 为 " 世界上第一个完全自主的人工智能代理 ",并表示该智能体 " 可以取代人类 "。而 TechCrunch 的态度则更为谨慎,其记者 Kyle Wiggers 指出 Manus 并没有为其完成点餐、预订座位以及生成游戏等任务,且这款产品也并非新开发的内部模型。在文章中,Wiggers 判断 "Manus 似乎是一个先于技术创新进行炒作的案例 "。
媒体截然不同的态度反映了当下 Manus" 迷离 " 的定位现状,有人将其视为 "AGI 前奏 ",也有人指出其仅为营销之作。而 Manus 的邀请码制度也使得这款产品 " 犹抱琵琶半遮面 ",在公众面前一副朦胧面貌。
随着热度积累,除了知名媒体的报道,海外大 V 也向 Manus 投去目光。海外知名博主 Rowan Cheung 在社交平台 X 上发布关于 Manus 的评测信息,而该条博文浏览量目前已超 280 万,创下 Rowan Cheung 个人历史最高互动记录。
Rowan Cheung 将 Manus 的出现形容为 " 中国的第二个 DeepSeek 时刻 ",他让 Manus 进行了三项任务:部署特定网站、选取旧金山的理想租房地点以及创建一门 AI 课程,而 Manus 均顺利完成。Rowan Cheung 还提到,在 GAIA 基准上,Manus 表现绝佳,甚至击败了 OpenAI 最近推出的 Deep Research。
另一位科技圈博主 Julian Goldie 也对 Manus 赞不绝口,并表示自己直接取消了每月 200 美元的 ChatGPT 订阅。在他看来,Manus 有着诸多优势,如可以同时控制 50 个浏览器、实时创建和编辑檔案、部署网站、在执行研究方面迅捷、可以生成全面报告和可视化效果。
面对 DeepSeek 和 Manus 的连番 " 炸场 ",知名 AI 博主 John Rush 发表自己的看法,直称 " 按照这个速度,中国将主导人工智能 "。
但海外测评者对 Manus 并非给出清一色好评,也有人对其质疑。
社交平台 X 博主 Alexander Doria 就发文表示自己在测试 Manus 时遇到了错误信息和无限循环的问题。The Jackson Laboratory 教授 Derya Unutmaz 对 OpenAI 的 Deep Research 和 Manus 进行了横向测试比较,结果 Deep Research 在 15 分钟内完成了任务,而 Manus 在步骤 18/20 时失败了,且用时 50 分钟。尽管 Manus 可能存在伺服器过载的可能,但是运行时间确实太长。
尽管有人将 Manus 看作 " 中国的第二个 DeepSeek 时刻 ",且该产品已受到海外关注,但是从谷歌趋势来看,Manus 过去一周的全球搜索热度仍远低于 DeepSeek,且流量主要来自中国。
此外,还有其他博主反馈 Manus 在事实性问题上会犯错误、在 STEM 领網域协助和编程方面表现不佳等问题。
总体来看,针对 Manus 的正面评价集中在复杂任务执行能力、多模态工具整合以及成本优势,而稳定性不足以及事实性缺陷则是用户们对 Manus 主要吐槽的地方。
在媒体以及广大用户之外,诸如 JPM、GS、UBS 等海外投行也不约而同地关注到 Manus,这也证明了该产品尽管尚未真正面世,但是在市场上已有反响。
不同于 DeepSeek 由海外转向国内的爆火路径,Manus 在此前一直被认为 " 国内火爆,海外冷淡 ",而如今随着海外热度提升,对该智能体的认知和评价也正日趋理性。伴随着对 Manus 的热烈讨论,全球 AI 话语权的归属问题又将成为争论的重点,但是对于 Manus 这一 AI 产品而言,挑战或许才刚刚开始。