解密Manus：靠垂直整合，抢在了AI大厂前头

今天小编分享的互联网经验：解密Manus：靠垂直整合，抢在了AI大厂前头，欢迎阅读。

本文来自微信公众号：直面 AI，作者：麦思，题图来自：AI 生成

AI 圈正迎接新一轮的技术爆发期，DeepSeek 以深度推理模型 R1 震撼海内外，OpenAI、Anthropic、谷歌、阿里、字节、百度等纷纷推进自家大模型的新动态。模型层之外，应用层也开始多了些新变化。

最近的创新来自一家由中国 90 后创始团队推出的新产品——一款号称通用 AI Agent 的应用工具 Manus。

Manus 的官网（https://Manus.im/usecases）给出了一些例子可以供我们更加直观的了解 Manus 的能力，可以看到它的功能在官方演示中确实特别强大，目前 Manus 的使用需要提前获取邀请码。

有必要简单介绍一下 Manus。与传统 AI 助手相比，类似豆包、Kimi、DeepSeek 这些，其局限于信息检索与建议互動，而 Manus 首次实现 " 自主执行复杂任务→交付完整成果 " 的闭环能力，填补了当前市场空白‌。

另外一点是通用性定义的突破：跨领網域处理复杂任务（如股票分析、旅行规划、代码生成等），打破垂直赛道 AI 的局限性‌，这是惊艳的前两点。第三点是 Manus 是继中国团队做出来 DeepSeek 之后的又一力作，定位为 " 手腦并用 " 的通用助手，强调 " 输入需求→输出结果 " 的无中介执行模式，命名源自拉丁语 "Mens et Manus"（意为手腦并用），技术理念主张 "Less structure， more intelligence"，减少预设流程依赖，强化模型自主进化能力。

一、Manus 的优缺点

总结一下 Manus 的核心优势：

全流程自主执行：从需求分析（如简历筛选）、任务拆解（如房产选购规划）到成果交付（生成 Excel/PPT 报告）无需人工干预‌。

多工具链整合：支持浏览器操作、编程工具调用、跨平台数据抓取，实现复杂操作（如自动解压简历包并分析）‌。

覆盖教育（教学材料生成）、金融（股票关系分析）、人力资源（候选人分级）、企业服务（自动化周报）等多领網域‌。

跨领網域协同：可同时处理比如简历筛选与房产选购两类异构任务，体现通用 Agent 特性‌。

多 Agent 协作系统：规划、执行、验证三模块分立，云端虚拟机并行处理任务，提升容错率‌。

上面是 Manus 的优势，同样 Manus 也有一些劣势：

依赖预设流程框架：部分任务需在浏览器与作業系統间的 " 受限环境 " 执行，无法适配未预定义的应用程式‌。

执行稳定性问题：用户反馈存在崩溃前生成虚假结果（如伪造邀请码）等不可控行为‌。

高炒作热度导致早期用户预期与实际能力落差，部分场景仍需人工修正输出结果‌。

企业端部署成本：云端虚拟机运行模式对算力需求较高，限制中小型企业使用‌。

自主签署合同的法律效力尚未明确，隐私数据跨平台调用可能引发合规争议‌。

职场替代焦虑：80% 中低频白领工作（如简历筛选、报表生成）面临被低成本 AI 替代的风险‌。

二、Manus 究竟做了哪些技术创新？

说完优缺点之后，我们再重点看一下使得 Manus 这么强的背后技术创新，究竟是什么。

1. 多智能体协作系统（Multi-Agent Collaboration）

三层架构设计：

规划代理（Planning Agent）：采用蒙特卡洛树搜索（MCTS）算法动态拆解任务优先级，支持实时调整执行路径（例如在简历筛选中优先处理学历匹配度）。

执行代理（Execution Agent）：整合 200+ 工具接口（浏览器、Office 套件等），通过浏览器自动化引擎模拟人类操作（点击、滚动、表单填写），但受限于未开放 API 的 CS 架构应用。

验证代理（Validation Agent）：部署对抗性测试模块，检测逻辑矛盾（如财务数据与行业基准偏差超 5% 时触发复核流程）。

多重签名系统（Multisig System）：由多个独立模型协同处理子任务，通过交叉验证提升结果可靠性（例如股票分析中，3 个模型独立计算行业关联度，取置信度最高值）。

2. 动态训练与优化机制

实时反馈迭代：用户可通过 " 动态培训 " 功能修正输出格式（如指定 PPT 模板）或调整执行路径（如跳过特定网站数据抓取），模型即时更新策略。

崩溃恢复技术：任务中断时自动生成替代方案（如简历解析失败后改用关键词匹配模式），并保留进度至本地缓存。

3. 工具链深度整合

浏览器沙箱技术：在隔离环境中运行跨平台操作（如自动登录招聘网站抓取简历），避免用户隐私数据泄露。

记忆偏好系统：持续学习用户习惯（如合同模板偏好），占用云端存储资源形成个性化执行策略。

4. 性能验证体系

GAIA 基准测试 ( https://zhuanlan.zhihu.com/p/669652697 ) 突破：在三级测试中分别达 86.5%/70.1%/57.7%，超越 OpenAI 的 DeepResearch 模型，接近人类水平（90%）。

真实场景验证：在 Upwork 平台完成设计类任务（如 Logo 生成）、Kaggle 竞赛中实现数据分析自动化，验证跨领網域执行能力。

如果上面 Manus 的技术创新让你眼前一亮，这个时候你是不是会有一个疑问，为什么是 Manus？其他 AI 厂商，尤其是科技大厂为什么没有做出这样的成果，是其他厂商不具备这样的能力吗？目前来看，原因或许有以下几种因素：

1. ‌技术路径依赖‌。

‌模型规模优先策略‌：OpenAI 等厂商聚焦于扩大模型参数量（如追求 GPT-5），未将工具调用能力作为核心研发方向‌。

‌规则工程惯性‌：传统 AI 产品依赖预设流程（如客服对话树），难以适应 Manus 倡导的 "Less structure， more intelligence" 理念‌。

2. 工程化挑战。

‌多工具接口适配成本‌：需为浏览器、办公軟體等开发专用驱动，大厂不愿干脏活累活，其他小厂商又缺乏生态整合能力（如 Manus 团队耗时 2 年完成 200+ 工具接口开发）‌。

‌长周期任务管理难题‌：传统模型受限于会话式互動，难以实现 " 用户离线后持续执行跨日任务 " 的异步工作机制‌。

3. 市场定位差异。

‌ B 端服务壁垒‌：微软 Copilot 等产品聚焦 Office 场景，缺乏跨领網域泛化能力（如同时处理简历筛选与股票分析）‌。

‌伦理风险规避‌：头部厂商忌惮自主决策引发的法律争议（如合同签署效力），选择保守技术路线‌。

三、Manus 的后续改进和行业影响

针对目前 Manus 表现出的一些缺点，我们认为它未来的改进点如下：

增强环境适应性：突破浏览器 / 作業系統的 " 夹层 " 限制，实现更底层的系统权限调用‌。

降低算力依赖：通过模型压缩与边缘计算结合，推动中小型企业普及‌。

优先落地场景：企业自动化办公（智能客服、合同审核）、教育个性化教学（动态生成课件）‌。

开源生态建设：开放部分模型接口，吸引开发者构建插件生态（如第三方工具集成）‌。

建立 AI 执行审计机制：对自主决策过程留痕，明确错误结果的责任归属‌。

数据安全规范：限制敏感信息（如简历、财务报表）的跨平台流转权限‌。

但不容忽视的是，Manus 的出现肯定会对其他厂商带来一些影响：倒逼 OpenAI 等厂商加速从 " 对话式互動 " 转向 " 任务执行型 " 产品开发的节奏，加速 Agent 技术迭代‌；推动多模态互動（文字 / 图表 / 代码混合输出）、工具调用 API 集成成为 AI 产品新基准‌。

根据 Manus 计划，后续官方还将开源推理模块，有望借此催生基于其技术栈的二次开发社区‌。

Manus 需求爆火，还可能带动边缘计算设备需求激增，使得 AI 终端部署从云端向本地延伸‌，一批国产硬體厂商也有望从中受益。

AI 的发展速度正推动各行各业重新洗牌，未来不是属于资产的时代，也不是属于权力的时代，未来将是属于科技的时代。

本文来自微信公众号：直面 AI，作者：麦思