今天小编分享的科技经验:Manus爆火启示录:套壳没有护城河,欢迎阅读。
文 | 光子星球
自昨天开始,Manus 空降 AI 圈,开始刷屏整个网络。
热度如潮水般涌来,Manus 却陷入了两极分化的争议中。有人为其摇旗呐喊,夸赞是 " 下一个 DeepSeek 时刻 "" 一夜间革了 OpenAI 和 Anthropic 的命 "。也有人批评 Manus 雷声大雨点小,通过 " 邀请码 " 制造出的饥饿营销令人反感,在实际测评中,跑 Agent case 的效果差强人意。时间长、卡顿、重复返回是几个目前常见的问题。
如今的现状是,免费的邀请码被炒到了天价。有消息称,Manus 团队陷入了始料未及的处境,超出预期的热度,让其伺服器被挤爆。
不知是何原因,目前 Manus 在海外社交媒体 "X" 上的官方账号已被冻结。
在诸多零星而碎片化的信息中,我们试图先打捞起关于 Manus 的一些关键性事实。
Manus 官方定位为 " 通用 AI Agent",即一个多模型、多智能体产品,拥有 " 独立思考 " 能力,能够对复杂的通用任务进行多步骤拆解并执行。
Manus 推崇 "Less structure,more intelligence" 的理念,Agent 的能力进化依赖于基础模型能力的提升和数据增加,由此实现自然演化,而不是通过 workflow 来增强。
在 Demo 演示中介绍产品定位,不仅仅是另一个聊天机器人或工作流,是一个真正自主的主体,来弥合概念与执行之间的差距。当其他 AI 只是在生产想法时,Manus 在交付成果。
Manus 直言不讳地表示其产品属于 " 套壳 ",底层模型采用了 Claude 和 Qwen,单次任务消耗的成本大概在两美元左右。
Agent 的 " 玩具 "
Manus 对 Agent 产品的定义回归到了更加纯粹的层面,就是让 Agent 在不受人工干预的前提下,独立完成任务。从 AutoGPT 就开始提的概念,受制于基础大模型能力,一直迟迟无法实现,只能退而求其次地外接工具和规定 workflow 来保证 Agent 执行效果。
Manus 演示中最惊艳的一点是,真正做到了 " 所见即所得 ",这也是 Agent 最本质的交付逻辑。例如,以前只能按步骤分析檔案再制作表格,现在一步到位,在识别用户需求后,按步骤执行,直接交付最终的表格。
在其官方发布的演示视频中,Manus 可以分析简历、制作表格、出具房产研究报告并结合预算筛选出最佳选项以及分析股票等。
截至到目前,以上的功能都可以通过任意一款 AI 助手类应用实现。但某种意义上,Manus 算得上第一款完整的 Agent 产品。包括 OpenAI、Anthropic 和智谱都发布过 Agent 相关功能,但大多都作为工具属性存在。
打开 Manus 界面,有四部分构成,分别是浏览器、搜索、编辑器和终端。Manus 自称 " 套壳 " 名副其实,跟 AI 搜索 Perplexity 一样,是把各类功能组合封装好的一款产品。
里面有一个小插曲,据说,Manus 团队一开始的方向是 AI 浏览器。在偶然看到 Arc 被放弃后,他们才决定了终止 AI 浏览器的研发工作。现在在使用过程中,也能看到浏览器的痕迹。
具体来看,第一步跟 ChatGPT 一样有对话界面,用户需要提出具体的诉求。之后操作界面被划分为了两部分,左面是对话界面,右面是终端。
当开始执行任务后,左面开始识别意图、制定执行步骤以及开始搜索、调用所需的各类工具。右面的终端相当于一个虚拟机,可以同步执行檔案处理、代码生成、搜索浏览器等工作。所谓的 Computer Use 主要体现在,模拟用户点击、浏览和切换工具使用,意义不是十分大。
这样一来,Manus 约等于 "ChatGPT/Claude/DeepSeek 模型 +Agent 框架 + 搜索引擎 + 工具 +Computer Use+RAG"。该团队的创新点在于运用了很多工程化的方法,把上述的一套逻辑像搭积木一样组合得严丝合缝。
就其目前展示的 Demo 来看,很适合 C 端用户使用,门槛低,功能简洁明了,如若效果货真价实,还是能产生不错的用户体验。
据 " 自动华 .AI" 公众号,Manus 提到提升未来使用体验的 " 三板斧 ":
配置电腦,赋予 AI 访问浏览器和工具的能力,例如云端浏览器;开放权限,接入私有 API 和权威数据源,例如金融指标等;动态培训,用户可以通过反馈来实时调整 AI 行为,类似于培训 Agent 实习生,用了几天以后就能适配用户需求,提升使用体验。
改变供需关系
Manus 的各种花式营销操作,无非是想要抢先押注 Agent 应用赛道。透过 Manus,可以看到大模型时代供需关系的转变。
Agent 最终导向的是交付,拿效率和结果说话。这意味着 AI 变成了服务供给方,我们人类转变为了消费方。需求决定供给,供给满足需求,市场经济的逻辑一旦能在 Agent 应用里完成闭环,就能促成消费行为,最终实现价值。
此前,很多人寄希望于 AI 搜索可以完成上述使命,即便是头部公司 Perplexity 也只是想到了投放广告这一个 " 好办法 "。现在,Agent 正朝着生产力方向发展。
Manus 的功能很容易让人联想到 OpenAI 的 Deep Research。这也是一个 Agent,能像经验丰富的研究员一样,查资料、思考并完成报告。OpenAI 官方宣称,该功能将原本人类需要 8 小时的任务缩减到 5 分钟,帮助人们在工作中节省几小时甚至几天。
据最新爆料,OpenAI 计划为专业人士推出量身定制版 Agent,用于执行销售线索分类、軟體工程和博士级研究等高级任务。
与生产力挂钩后,商业化就变得水到渠成。按照现在的思路,大致有两类:一类是订阅收费,一类是以完成任务导向的结果收费。
OpenAI 的 Agent 服务采用的是订阅收费。据悉,未来 Agent 将作为主要的收入增长引擎。
为专业人士量身打造的 Agent 被分为了三档:第一档针对高收入知识工作者,每月收费 2000 美元;第二档针对軟體开发者,每月收费 10000 美元;第三档针对博士级研究,每月收费 20000 美元。
按 Manus 的想法,大概率要探索第二种,以完成任务导向收费模式。
Manus 在分享会上,提出了 "Agentic Hours per User ( AHPU ) " 概念,即衡量用户委托 AI 完成任务的时间效率,目标是通过并行任务提升生产力。目前,它已经通过 KV cache 优化、推理时延压缩、执行流程精简等手段,实现了单次任务消耗控制在两美元左右的成本。
这提供了另一种思路,对于使用频率不高的用户,可以单次任务为指标来收费。只要用户能从 AI 这里获得价值与满足,就可以完成付费行为。
谁是最终受益者?
当然,上面讨论的 Agent 能力和收费模式,还处于非常理想化的状态。
众所周知," 套壳 " 产品没有护城河。但谁能想到,一夜之间就倒塌了。昨天 Manus" 炸场子 ",今天开源社区通过逐帧扒视频来复现。"CAMEL AI" 公众号今天发布了一篇 "0 天复刻 Manus 通用智能体,完全开源 " 的帖子,将 Manus 核心工作流拆解为了六步。
一个 Manus 隐身了,千千万万个 Manus 诞生了。
Agent 能力提升很大程度还是要依赖于大模型能力。Manus 现在的思路是拼接,一个大模型能力不够,另一个来凑。其宣传的虽然是 "Agent 原生 ",但以其团队规模和训练能力,不排除还是有搭建 workflow 的可能性。因为在当下,越多的 workflow 设计,代表着越强的可控制性。整体来看,行业大部分玩家都处于该水平。
而 OpenAI 发布的 Agent 走的完全是模型训练的路径。Deep Research 突出特点便在于端到端训练带来的自主能力进化,基于微调的 O3 版本,底层训练赋予了 Deep Research 很多分析能力。长期来看,在模型之上进行强化学习调整,可能才是构建强大 Agent 的关键。
Deep Research 官方给出的案例中,已经涉及到旅行规划、股票分析、供应商采购、教育内容创建、在线商店运营分析等,基本覆盖了 Manus 的功能。短期,Manus 想要脱颖而出,就得靠体验和低价策略。长期的话,存在被 OpenAI 覆盖的风险,毕竟一个 " 终端 " 小设计对其不构成任何威胁。
成本也许是最致命的问题。Manus 声称单次完成任务消耗成本在两美元,换算成 token 消耗量几十万到百万。考虑到用户需求的复杂性,每次单个任务执行中还会涉及补充任务需求,这对伺服器资源和算力都是巨大的挑战。有报告显示,Agent 一次任务可能消耗 10-100 倍于传统聊天机器人资源。
但这对大厂都不是问题,元宝靠接入 DeepSeek 后来居上,在应用内使用推理功能比 DeepSeek 官方还要顺畅。大厂现在几乎人手一个 AI 应用,有自研大模型,同时接入了 DeepSeek-R1 推理模型,RAG、联网搜索更是现成的。对他们来说,原地改造或者再造一个 Manus 几乎不是问题。
如果考虑原地化改造,或许可以考虑阶梯付费模式。对大部分普通用户采取免费策略,吸引新用户和扩大用户规模。在此基础上,筛选高质量付费用户,也像 OpenAI 一样进行分层付费,提供服务质量越高,消耗的 token 数量越多,收费也就越高。