今天小编分享的互联网经验:解密Manus:靠垂直整合,抢在了AI大厂前头,欢迎阅读。
本文来自微信公众号:直面 AI,作者:麦思,题图来自:AI 生成
AI 圈正迎接新一轮的技术爆发期,DeepSeek 以深度推理模型 R1 震撼海内外,OpenAI、Anthropic、谷歌、阿里、字节、百度等纷纷推进自家大模型的新动态。模型层之外,应用层也开始多了些新变化。
最近的创新来自一家由中国 90 后创始团队推出的新产品——一款号称通用 AI Agent 的应用工具 Manus。
Manus 的官网(https://Manus.im/usecases)给出了一些例子可以供我们更加直观的了解 Manus 的能力,可以看到它的功能在官方演示中确实特别强大,目前 Manus 的使用需要提前获取邀请码。
有必要简单介绍一下 Manus。与传统 AI 助手相比,类似豆包、Kimi、DeepSeek 这些,其局限于信息检索与建议互動,而 Manus 首次实现 " 自主执行复杂任务→交付完整成果 " 的闭环能力,填补了当前市场空白。
另外一点是通用性定义的突破:跨领網域处理复杂任务(如股票分析、旅行规划、代码生成等),打破垂直赛道 AI 的局限性,这是惊艳的前两点。第三点是 Manus 是继中国团队做出来 DeepSeek 之后的又一力作,定位为 " 手腦并用 " 的通用助手,强调 " 输入需求→输出结果 " 的无中介执行模式,命名源自拉丁语 "Mens et Manus"(意为手腦并用),技术理念主张 "Less structure, more intelligence",减少预设流程依赖,强化模型自主进化能力。
一、Manus 的优缺点
总结一下 Manus 的核心优势:
全流程自主执行:从需求分析(如简历筛选)、任务拆解(如房产选购规划)到成果交付(生成 Excel/PPT 报告)无需人工干预。
多工具链整合:支持浏览器操作、编程工具调用、跨平台数据抓取,实现复杂操作(如自动解压简历包并分析)。
覆盖教育(教学材料生成)、金融(股票关系分析)、人力资源(候选人分级)、企业服务(自动化周报)等多领網域。
跨领網域协同:可同时处理比如简历筛选与房产选购两类异构任务,体现通用 Agent 特性。
多 Agent 协作系统:规划、执行、验证三模块分立,云端虚拟机并行处理任务,提升容错率。
上面是 Manus 的优势,同样 Manus 也有一些劣势:
依赖预设流程框架:部分任务需在浏览器与作業系統间的 " 受限环境 " 执行,无法适配未预定义的应用程式。
执行稳定性问题:用户反馈存在崩溃前生成虚假结果(如伪造邀请码)等不可控行为。
高炒作热度导致早期用户预期与实际能力落差,部分场景仍需人工修正输出结果。
企业端部署成本:云端虚拟机运行模式对算力需求较高,限制中小型企业使用。
自主签署合同的法律效力尚未明确,隐私数据跨平台调用可能引发合规争议。
职场替代焦虑:80% 中低频白领工作(如简历筛选、报表生成)面临被低成本 AI 替代的风险。
二、Manus 究竟做了哪些技术创新?
说完优缺点之后,我们再重点看一下使得 Manus 这么强的背后技术创新,究竟是什么。
1. 多智能体协作系统(Multi-Agent Collaboration)
三层架构设计:
规划代理(Planning Agent):采用蒙特卡洛树搜索(MCTS)算法动态拆解任务优先级,支持实时调整执行路径(例如在简历筛选中优先处理学历匹配度)。
执行代理(Execution Agent):整合 200+ 工具接口(浏览器、Office 套件等),通过浏览器自动化引擎模拟人类操作(点击、滚动、表单填写),但受限于未开放 API 的 CS 架构应用。
验证代理(Validation Agent):部署对抗性测试模块,检测逻辑矛盾(如财务数据与行业基准偏差超 5% 时触发复核流程)。
多重签名系统(Multisig System):由多个独立模型协同处理子任务,通过交叉验证提升结果可靠性(例如股票分析中,3 个模型独立计算行业关联度,取置信度最高值)。
2. 动态训练与优化机制
实时反馈迭代:用户可通过 " 动态培训 " 功能修正输出格式(如指定 PPT 模板)或调整执行路径(如跳过特定网站数据抓取),模型即时更新策略。
崩溃恢复技术:任务中断时自动生成替代方案(如简历解析失败后改用关键词匹配模式),并保留进度至本地缓存。
3. 工具链深度整合
浏览器沙箱技术:在隔离环境中运行跨平台操作(如自动登录招聘网站抓取简历),避免用户隐私数据泄露。
记忆偏好系统:持续学习用户习惯(如合同模板偏好),占用云端存储资源形成个性化执行策略。
4. 性能验证体系
GAIA 基准测试 ( https://zhuanlan.zhihu.com/p/669652697 ) 突破:在三级测试中分别达 86.5%/70.1%/57.7%,超越 OpenAI 的 DeepResearch 模型,接近人类水平(90%)。
真实场景验证:在 Upwork 平台完成设计类任务(如 Logo 生成)、Kaggle 竞赛中实现数据分析自动化,验证跨领網域执行能力。
如果上面 Manus 的技术创新让你眼前一亮,这个时候你是不是会有一个疑问,为什么是 Manus?其他 AI 厂商,尤其是科技大厂为什么没有做出这样的成果,是其他厂商不具备这样的能力吗?目前来看,原因或许有以下几种因素:
1. 技术路径依赖。
模型规模优先策略:OpenAI 等厂商聚焦于扩大模型参数量(如追求 GPT-5),未将工具调用能力作为核心研发方向。
规则工程惯性:传统 AI 产品依赖预设流程(如客服对话树),难以适应 Manus 倡导的 "Less structure, more intelligence" 理念。
2. 工程化挑战。
多工具接口适配成本:需为浏览器、办公軟體等开发专用驱动,大厂不愿干脏活累活,其他小厂商又缺乏生态整合能力(如 Manus 团队耗时 2 年完成 200+ 工具接口开发)。
长周期任务管理难题:传统模型受限于会话式互動,难以实现 " 用户离线后持续执行跨日任务 " 的异步工作机制。
3. 市场定位差异。
B 端服务壁垒:微软 Copilot 等产品聚焦 Office 场景,缺乏跨领網域泛化能力(如同时处理简历筛选与股票分析)。
伦理风险规避:头部厂商忌惮自主决策引发的法律争议(如合同签署效力),选择保守技术路线。
三、Manus 的后续改进和行业影响
针对目前 Manus 表现出的一些缺点,我们认为它未来的改进点如下:
增强环境适应性:突破浏览器 / 作業系統的 " 夹层 " 限制,实现更底层的系统权限调用。
降低算力依赖:通过模型压缩与边缘计算结合,推动中小型企业普及。
优先落地场景:企业自动化办公(智能客服、合同审核)、教育个性化教学(动态生成课件)。
开源生态建设:开放部分模型接口,吸引开发者构建插件生态(如第三方工具集成)。
建立 AI 执行审计机制:对自主决策过程留痕,明确错误结果的责任归属。
数据安全规范:限制敏感信息(如简历、财务报表)的跨平台流转权限。
但不容忽视的是,Manus 的出现肯定会对其他厂商带来一些影响:倒逼 OpenAI 等厂商加速从 " 对话式互動 " 转向 " 任务执行型 " 产品开发的节奏,加速 Agent 技术迭代;推动多模态互動(文字 / 图表 / 代码混合输出)、工具调用 API 集成成为 AI 产品新基准。
根据 Manus 计划,后续官方还将开源推理模块,有望借此催生基于其技术栈的二次开发社区。
Manus 需求爆火,还可能带动边缘计算设备需求激增,使得 AI 终端部署从云端向本地延伸,一批国产硬體厂商也有望从中受益。
AI 的发展速度正推动各行各业重新洗牌,未来不是属于资产的时代,也不是属于权力的时代,未来将是属于科技的时代。
本文来自微信公众号:直面 AI,作者:麦思