大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 财经

从Manus到MCP:2025年AI的三大新趋势

2025-03-15 简体 HK SG TW

今天小编分享的财经经验:从Manus到MCP:2025年AI的三大新趋势,欢迎阅读。

2025 年开年以来,AI 发展如火如荼,DeepSeek R1、OpenAI CUA、Manus 等重要创新层出不穷,眼花缭乱。

这里我将最近一个月以来的思考总结一下,对 2025 年 AI 发展趋势做几点预判。

一、Manus:Agent 元年的一次抢跑

Manus 推出之后,我们第一时间拿到了体验账号,进行了充分的体验测评。

先说结论:虽然 Manus 目前还有种种不足,但它的产品设计思路创意满满,值得我们给予充分的肯定。

Manus 的核心架构基于" 虚拟机 + 多 Agent 协同 "模式,通过整合多个底层大模型的 API,实现任务的动态分配与模型调用。

Manus 突破了传统 AI 助手仅生成建议的局限,实现了从 " 需求输入 " 到 " 成果交付 " 的端到端闭环。

Manus 提出 "Less Structure, More Intelligence" 的互動理念,通过无代码化的自然语言接口降低用户使用门槛。

与此同时,Manus 使用一个外置的 markdown 檔案来管理 Agent 的任务规划,并且将阶段性的工作成果存储为独立檔案,这也是一个非常有趣的创新点。

二、Manus 的不足与缺陷

Manus 在 MultiAgent 的道路上提供了一种非常有趣的思路,但现在依然存在一些显而易见的不足之处。

首先是 " 幻觉累加 " 的问题。

Agent 的本质是多次大模型问答的串并联。如果单次大模型问答的准确率是 90%,串联 10 次的话,最终 Agent 回答准确的概率是 0.9^10,只有 1/3 左右了。

在下面的案例中,Manus 的任务是针对某上市公司进行财务数据分析。Manus 很聪明地 import 了 data_api 模块,准备从雅虎提供的接口中调取财务数据。

但是在 process_financial_data 函数中,manus 竟然把 revenue、gross_profit 等数据直接 " 硬编码 " 到了代码中,让人猝不及防。而且经过验证,这里的数据有部分是错误的。

如果原始数据出错了,那么后续无论分析得多么深入、图表做得多么 fancy 都失去了意义。

Manus 的第二个问题是可供大模型调用的工具不足。

下面这个例子中,Manus 的任务是写一篇关于 " 小米 Su7" 的市场分析报告 PPT。

Manus 完美地拆分了任务,并且检索了大量新闻,但是最后它无法生成一份 PPT,因为它无法调用 Office 軟體。

目前 Manus输出的内容形式多为纯文本或者网页,还无法和人类工作流进行完美融合。

Manus 遇到的第三个挑战是小院高墙的互联网生态。

互联网上有很多优质信息是存放在 " 围栏 " 中的。

比如当我们让 Manus 去分析比较市面上所有 AI 智能眼镜的性价比时,它聪明地找到了对应商品的淘宝网页。

但是当 Manus 想要打开具体产品页面获取价格性能等详细信息时,淘宝判定它为机器人,并拒绝了 Manus 的访问。

无独有偶,当我们让 Manus 为一家非上市公司进行出具商业分析报告时,Manus 为了获取公司的最新融资进展,访问了 CrunchBase 数据库。

但是 Manus 的访问被 CrunchBase 判定为机器人,随后被无情地拒绝了。

互联网看似公开透明,实则存在大量类似小院高墙的情况,优质信息往往就存放在这些高墙之内,Manus 无法直接获取,这无疑阻碍了 Manus 的工作效果。

尽管有着种种问题和挑战,Manus 依然给大家描绘了 MultiAgent 的巨大前景,打响了 Agent 元年的第一枪,值得我们给予充分的肯定。

在 Manus 占据大家视野的同时,海外 AI 大厂究竟做了哪些技术储备呢?

三、OpenAI CUA:一个会自主操作电腦的 Agent

在今年的 1 月底,OpenAI 发布了由其新模型 CUA 驱动的 AI 智能体 Operator。

CUA 模型融合了 GPT-4o 的视觉能力和通过强化学习实现的高级推理能力,能够将任务分解为多步骤计划,并在遇到挑战时进行自我调整和纠正。

简而言之,CUA 就是一个会操作电腦的 Agent,它的运作原理非常直白且简洁,如下图所示。

首先,CUA 会同时接受两种模态的输入:其一是文本指令,其二是螢幕截图。

CUA 会同时处理这两种信息,并且生成一系列动作指令,比如 " 点击螢幕上坐标为 ( 300,200 ) 的点,并且输入 XXX,按回车 "。

电腦接收到指令并完成操作后,会将新的螢幕截图与新的任务指令返回给 CUA,如此循环往复,直到获得最终答案。

那么 CUA 目前操作电腦的能力达到了怎样的水平呢?

根据 OpenAI 的官方测评,CUA 在操作电腦和操作浏览器这两个场景上,相比上一代 SOTA 都有了巨大的性能提升。

但是相比人类而言,依然有着较大的差距。换句话来说,目前顶级的 Agent 依然没有办法像一个成年人一样正确地操作电腦,但我相信这个现状在今年内就会发生质变。

四、Anthropic MCP:AI 时代下的 TCP/IP 協定

刚才在分析 Manus 的缺陷时,提到了 " 工具不足 " 的问题。

Anthropic 显然也意识到了这个问题,并在去年年底推出了 MCP 来从根源上解决这个问题。

MCP 的全称是 Model Context Protocol,它定义了应用程式和 AI 模型之间交换上下文信息的方式,这使得开发者能够以一致的方式将各种数据源、工具和功能连接到 AI 模型。

MCP 之于 AI,有点类似于 TCP/IP 之于互联网。

MCP 有三个重要特点:

双向通信:AI 与工具之间的通信是双向的,有状态的。AI 既能从工具获取数据,也能向工具发送指令。

当前越来越多的工具及服务开始接入 MCP,呈现愈演愈烈之势,包括 Google Maps、PGSQL、ClickHouse、Atlassian、Stripe 等等。

在 Smithery 平台上你可以轻松查找不同功能对应的工具及服务。随着越来越多的 Server 接入 MCP 協定,未来 AI 能够直接调用的工具将呈现指数级增长,这能从根源上打开 Agent 能力的天花板。

五、2025 年 AI 发展新趋势:后训练、RL、MultiAgent

这里我结合最近几个月以来的观察和思考,总结一下 2025 年 AI 发展的几点重要趋势。

第一,预训练即将终结,后训练成为重点。

这其实已经是行业共识。去年年底时,Ilya 在 NeurIPS 大会上提到一个重要观点:数据是 AI 时代的化石燃料,因为我们人类只有一个互联网。

与此同时,在今年 DeepSeek R1 的论文中,提到了后训练将成为大模型训练管线中的重要组成部分。

第二,针对后训练而言,强化学习将成为主流,监督学习的重要性逐渐下降。

DeepSeek R1 带来最重要的启发是:纯粹的 RL 可能是通向 AGI 的正确路径。

随着 TTS 的增加,大模型会自我涌现出复杂的推理行为,而无需刻意引导。

如下边右图所示,横轴是大模型 RL 的迭代步数,纵轴是单次问答的 token 长度。我们可以看到,随着大模型 RL 步数的增加,大模型会自主地从 " 快思考 " 变成 " 慢思考 ",从最开始每次回答 100 个 token,到最后每次回答接近 10000 个 token。

DeepSeek 团队将这种现象称为 "self-evolution",并认为它是 "the emergence of sophisticated behaviors"。

具体是哪些复杂行为的涌现呢?DeepSeek 也给出了答案,比如:self-verfication、reflection等。

这个发现对于我们来说有着重要的启发。未来监督学习在 AI 训练中究竟应该扮演怎样的角色?监督学习是否反而限制了 AI 解决问题的能力?

是否不应该让 AI 通过模仿人类的思维方式来获得智能,而是让 AI 发展出更加原生的智能?

这些问题,都有待整个 AI 行业通过实践来给出答案。

第三,MutiAgent 是确定性的大趋势。

如果将 AI 和人腦进行类比的话,大模型就像是人腦中的 " 前额叶 "。

众所周知,前额叶主要负责高级认知功能,比如注意力的分配、思考推理、决策等。

但是仅仅有前额叶,大腦是无法处理复杂任务的。我们需要有颞叶来进行听觉信号的解析,需要顶叶进行阅读和算术,需要小腦来进行运动协调,需要海马体来进行记忆索引。

MultiAgent 的定义恰恰就是让多个不同的模型之间互相协调,从单独的 " 前额叶 " 走向 " 完整的大腦 ",从而处理更加复杂的现实任务。

在这个蓝图中,MCP 就起到了非常重要的作用:协调统一大模型与各工具之间的数据通信接口。

结语:抓好扶手,未来已来

2025 年是 AI Agent 元年,Manus 的出现打响了第一炮。

无论是 OpenAI 的 CUA 还是 Anthropic 的 MCP 都指向了一个共同的未来,未来二年 AI 的发展速度将非常陡峭。

抓好扶手,未来已来!

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們