今天小编分享的科技经验:百度,来势汹汹,欢迎阅读。
出品 | 虎嗅科技组
作者 | 房晓楠
编辑 | 苗正卿
头图 | 视觉中国
4 月 25 日,在 Create2025 百度 AI 开发者大会上,百度发布了文心大模型 4.5 Turbo 和深度思考模型 X1 Turbo 两款新模型。较之文心 4.5,文心 4.5 Turbo 速度更快,价格下降 80%。
其实此次距离文心 4.5 和文心 X1 的发布才刚刚过去一个多月,模型短期内多次迭代,与之相对应的 " 应用 " 价值是否会被覆盖?创始人李彦宏的看法是,找对场景、选对基础模型、会调模型,做出来的应用就不会过时。
李彦宏演讲中多次提到应用,甚至断言," 模型有很多,但统治这个世界的是应用。"
此次,百度也发布了多款 AI 应用产品,包括一款官方定位为通用超级智能体的心响 App。
据研发团队透露,这款产品是一支 95 后年轻团队在 30 天左右交付的结果,而正式开发是在 3 月 18 日。从时间推断,这个时间距离 Manus 亮相过去 12 天。
智能体来势汹汹。如果说去年关于大模型的落地应用还是处于悬而未决的试探阶段,那 3 月初 Manus 的爆火,直接给出了一个明确而具体的答案,应用是未来,AI 智能体的喧闹前奏已经响起。
不管是对于大厂,还是初创企业来说,DeepSeek 式的冲击与带来的措手不及,一次就好。这次,必须快速响应。像是字节,据媒体报道,在 Manus 出现前后,内部大概有 7 个团队在开发不同的智能体产品。
如今,初创企业中 Genpark 发布了 Super Agent,大厂中的字节和百度相继推出新品,其他玩家也在蓄势待发。这一年,注定是 AI 智能体喧哗热闹的一年。
在心响 App 正式发布前,虎嗅等媒体事先进行了产品体验,同时也与百度智能体业务首席架构师、心响 App 负责人黄际洲,心响 App 产品经理黎宇昕进行了交流,他们结合心响 App 的研发,分享了当下 AI 智能体行业发展的新思考。以下为交流实录,部分内容略有删减:
提问:短期组建的团队要在一个月内做出这一产品,为什么这么着急?是老板给定的 deadline,为的是抢占行业时机节点?
黄际洲:我们没有非要赶某个时间节点,老板也没有给我们下目标(笑),我们就是想发一个现货。
AI 智能体的摩尔定律是,每隔 7 个月 AI 智能体能完成的最长任务时长会翻番,设想一下如果按部研发、迭代,那等到呈现给大家用时,已经过时了。所以每一个节点,我们会逼着自己做一个(产品)发布。
提问:目前心响只有 App,将来会出 PC 端吗?
黄际洲:会的。PC 端在计划中,包括大家可能想要的上传檔案、输入 Excel 表格输出图表、做分析、与 Word 联动等功能,都会有的。
提问:据了解,Manus 这一智能体产品也在海外上线了 App 端,你认为 PC 端与 App 端智能体的不同点在哪?
黄际洲:首先,第一个不同也是最大的难点是,不是技术上实现不了,而是手机螢幕实在太小了,如果想让用户看清楚某个东西,或者进行快速互動时,不是件容易的事情。反之,PC 端的螢幕大,但大也会带来问题,就是如何高效利用起来,高效互動。
第二是,在 PC 端可以非常方便地去打开各种生产力工具,比如 Excel 和 Word,但在移动端想传一个檔案难度很大,快速填表、填数据等在 PC 端很容易实现的事情,在移动端不容易实现。
黎宇昕:当然,两者技术上有更多的相通性,我们可以用多智能体协同的 Pipeline 去实现这个功能。PC 端更多倾向于办公场景,比如 PPT,我们确实有生成 PPT 的功能,但是在手机播放 PPT 也太鸡肋了,但在 PC 端就会相对轻松,文案一键编辑、自动改编、填表、写文档等都可以。
提问:当前的通用智能体或者超级应用,都是多智能体协同操作,过程中的技术难点在哪?
黄际洲:首先,最大的问题在于很多时候想去接入很多东西,而 MCP 協定的出现解决了这一问题,让大家能更快地接入。但到目前为止业界比较大的问题在于,大家都想获得但很少去做贡献,免费好用的工具实在太少了。可以算一个数字,把 Tool Use 做成 MCP 给到别人,乘以 1000 是很小的成本,但如果乘以 10 万、100 万、1000 万、1 亿,那很难扛得住这个成本,所以我们想要构建广泛的生态,呼吁更多的开发者一同来做,这是一个所有人都受益的事情。
第二个问题是,要实现多模态工具间的使用,比如 Agent Use,必须要有很强的協定。举个例子,平时工作中做(产品)开发会有 PM、PE、FE 各种各样的研发,承担不同的角色,彼此知识背景、专业术语不一样,说的话很难互相理解,频率不同接收的信息就有折损。智能体也一样,各个子智能体之间的互动和信息传递要尽可能做到无损,所以需要设计很好的協定和互動方式,能够把它协同起来。
第三个问题是大模型产品的 " 不可能三角 "(虎嗅注:" 不可能三角 " 国际经济学的一个著名理论,简单来说是指如果一件事情同时存在三个要素,三者不可都得),以搜索为例,大家已经养成的搜索习惯是输入一个词很快就返回答案,这是我们对搜索的心智。而对任务心智来讲,你要的是一个精准替你完成任务的管家,智能体产品能帮你完成任务、交付很好的结果。但在当下的技术发展趋势下,很难让它短时间内给到你最终任务结果,所以要做出(时间)牺牲。
提问:目前心响上各个场景中的智能体,都是百度自己开发的,还是外部接入?
黄际洲:我们很难把智能体开发得超过很多专业玩家。比如 AI 绘本,是接的百度文库的 AI 绘本功能,为了做到免费,我们向百度文库争取到了最大权益。健康也是如此,引入的是第三方。未来,我们想要构建开放生态,只要是市面上好的体验、做得比我们好、愿意被我们接入或者愿意接入我们,都可以接进来。
提问:当前越来越多的大厂开始接受 MCP,未来智能体可能会变成红海赛道,竞争激烈。像是前段时间支付宝的百宝箱开了支付 MCP Server 協定。那百度在智能体竞争中,想怎么做?
黄际洲:MCP 是个通用協定,只要大家遵循这个協定,开发者就不需要为 A、B、C、D 各开发一份,省时省力。而对于接入方来讲,遵循这一協定以后,可以很方便地接入,不需要再充分对接。
对我们来讲,现在是这样,如果某一东西(功能)是我们内部开发的,那有比 MCP 更高效的協定,从而保证更快接入(心响)。我们既支持自己独有的協定,也会把 MCP 接进来,这是一个原则。
当前实践告诉我们,优质的 MCP 是稀缺的,因为算力很贵。我做这么好的服务,不可能免费接入,我要构建起商业模式。但用户想白嫖,我们也想白嫖,开发者就被白嫖死了,无法养家糊口。所以未来是有一个供需之间的 GAP 存在,而最终生态的繁荣一定是能把商业模式跑通的繁荣。开发者能挣到钱,我们能挣到钱,需求越做越大,给大家提供越来越好的体验。当前,我们只专注于给用户提供极致的通用超级智能体产品体验。
提问:现在大家都在说超级智能体或超级应用,你认为最终的互動方式该是怎样的?
黄际洲:对于这一问题,我们也一直在思考。
关于互動方式,如果把用户千奇百怪的输入和不同的互動方式(语音、文字等)整合在一个产品里,这对于互動的要求超高,在完成不同任务时,也很难。所以我们一直强调一个很简单的输入,目标就是消灭复杂的 prompt,但这很难一下子做到,所以我们尝试从极简化用户需要输入的东西开始,比如做城市攻略,用户输入 " 哈尔滨旅游攻略 " 就足够了,剩下的事情智能体会一步步帮你细化和完善,最后给出一个成品。