今天小編分享的科技經驗:百度,來勢洶洶,歡迎閲讀。
出品 | 虎嗅科技組
作者 | 房曉楠
編輯 | 苗正卿
頭圖 | 視覺中國
4 月 25 日,在 Create2025 百度 AI 開發者大會上,百度發布了文心大模型 4.5 Turbo 和深度思考模型 X1 Turbo 兩款新模型。較之文心 4.5,文心 4.5 Turbo 速度更快,價格下降 80%。
其實此次距離文心 4.5 和文心 X1 的發布才剛剛過去一個多月,模型短期内多次迭代,與之相對應的 " 應用 " 價值是否會被覆蓋?創始人李彥宏的看法是,找對場景、選對基礎模型、會調模型,做出來的應用就不會過時。
李彥宏演講中多次提到應用,甚至斷言," 模型有很多,但統治這個世界的是應用。"
此次,百度也發布了多款 AI 應用產品,包括一款官方定位為通用超級智能體的心響 App。
據研發團隊透露,這款產品是一支 95 後年輕團隊在 30 天左右交付的結果,而正式開發是在 3 月 18 日。從時間推斷,這個時間距離 Manus 亮相過去 12 天。
智能體來勢洶洶。如果説去年關于大模型的落地應用還是處于懸而未決的試探階段,那 3 月初 Manus 的爆火,直接給出了一個明确而具體的答案,應用是未來,AI 智能體的喧鬧前奏已經響起。
不管是對于大廠,還是初創企業來説,DeepSeek 式的衝擊與帶來的措手不及,一次就好。這次,必須快速響應。像是字節,據媒體報道,在 Manus 出現前後,内部大概有 7 個團隊在開發不同的智能體產品。
如今,初創企業中 Genpark 發布了 Super Agent,大廠中的字節和百度相繼推出新品,其他玩家也在蓄勢待發。這一年,注定是 AI 智能體喧譁熱鬧的一年。
在心響 App 正式發布前,虎嗅等媒體事先進行了產品體驗,同時也與百度智能體業務首席架構師、心響 App 負責人黃際洲,心響 App 產品經理黎宇昕進行了交流,他們結合心響 App 的研發,分享了當下 AI 智能體行業發展的新思考。以下為交流實錄,部分内容略有删減:
提問:短期組建的團隊要在一個月内做出這一產品,為什麼這麼着急?是老板給定的 deadline,為的是搶占行業時機節點?
黃際洲:我們沒有非要趕某個時間節點,老板也沒有給我們下目标(笑),我們就是想發一個現貨。
AI 智能體的摩爾定律是,每隔 7 個月 AI 智能體能完成的最長任務時長會翻番,設想一下如果按部研發、迭代,那等到呈現給大家用時,已經過時了。所以每一個節點,我們會逼着自己做一個(產品)發布。
提問:目前心響只有 App,将來會出 PC 端嗎?
黃際洲:會的。PC 端在計劃中,包括大家可能想要的上傳檔案、輸入 Excel 表格輸出圖表、做分析、與 Word 聯動等功能,都會有的。
提問:據了解,Manus 這一智能體產品也在海外上線了 App 端,你認為 PC 端與 App 端智能體的不同點在哪?
黃際洲:首先,第一個不同也是最大的難點是,不是技術上實現不了,而是手機螢幕實在太小了,如果想讓用户看清楚某個東西,或者進行快速互動時,不是件容易的事情。反之,PC 端的螢幕大,但大也會帶來問題,就是如何高效利用起來,高效互動。
第二是,在 PC 端可以非常方便地去打開各種生產力工具,比如 Excel 和 Word,但在移動端想傳一個檔案難度很大,快速填表、填數據等在 PC 端很容易實現的事情,在移動端不容易實現。
黎宇昕:當然,兩者技術上有更多的相通性,我們可以用多智能體協同的 Pipeline 去實現這個功能。PC 端更多傾向于辦公場景,比如 PPT,我們确實有生成 PPT 的功能,但是在手機播放 PPT 也太雞肋了,但在 PC 端就會相對輕松,文案一鍵編輯、自動改編、填表、寫文檔等都可以。
提問:當前的通用智能體或者超級應用,都是多智能體協同操作,過程中的技術難點在哪?
黃際洲:首先,最大的問題在于很多時候想去接入很多東西,而 MCP 協定的出現解決了這一問題,讓大家能更快地接入。但到目前為止業界比較大的問題在于,大家都想獲得但很少去做貢獻,免費好用的工具實在太少了。可以算一個數字,把 Tool Use 做成 MCP 給到别人,乘以 1000 是很小的成本,但如果乘以 10 萬、100 萬、1000 萬、1 億,那很難扛得住這個成本,所以我們想要構建廣泛的生态,呼籲更多的開發者一同來做,這是一個所有人都受益的事情。
第二個問題是,要實現多模态工具間的使用,比如 Agent Use,必須要有很強的協定。舉個例子,平時工作中做(產品)開發會有 PM、PE、FE 各種各樣的研發,承擔不同的角色,彼此知識背景、專業術語不一樣,説的話很難互相理解,頻率不同接收的信息就有折損。智能體也一樣,各個子智能體之間的互動和信息傳遞要盡可能做到無損,所以需要設計很好的協定和互動方式,能夠把它協同起來。
第三個問題是大模型產品的 " 不可能三角 "(虎嗅注:" 不可能三角 " 國際經濟學的一個著名理論,簡單來説是指如果一件事情同時存在三個要素,三者不可都得),以搜索為例,大家已經養成的搜索習慣是輸入一個詞很快就返回答案,這是我們對搜索的心智。而對任務心智來講,你要的是一個精準替你完成任務的管家,智能體產品能幫你完成任務、交付很好的結果。但在當下的技術發展趨勢下,很難讓它短時間内給到你最終任務結果,所以要做出(時間)犧牲。
提問:目前心響上各個場景中的智能體,都是百度自己開發的,還是外部接入?
黃際洲:我們很難把智能體開發得超過很多專業玩家。比如 AI 繪本,是接的百度文庫的 AI 繪本功能,為了做到免費,我們向百度文庫争取到了最大權益。健康也是如此,引入的是第三方。未來,我們想要構建開放生态,只要是市面上好的體驗、做得比我們好、願意被我們接入或者願意接入我們,都可以接進來。
提問:當前越來越多的大廠開始接受 MCP,未來智能體可能會變成紅海賽道,競争激烈。像是前段時間支付寶的百寶箱開了支付 MCP Server 協定。那百度在智能體競争中,想怎麼做?
黃際洲:MCP 是個通用協定,只要大家遵循這個協定,開發者就不需要為 A、B、C、D 各開發一份,省時省力。而對于接入方來講,遵循這一協定以後,可以很方便地接入,不需要再充分對接。
對我們來講,現在是這樣,如果某一東西(功能)是我們内部開發的,那有比 MCP 更高效的協定,從而保證更快接入(心響)。我們既支持自己獨有的協定,也會把 MCP 接進來,這是一個原則。
當前實踐告訴我們,優質的 MCP 是稀缺的,因為算力很貴。我做這麼好的服務,不可能免費接入,我要構建起商業模式。但用户想白嫖,我們也想白嫖,開發者就被白嫖死了,無法養家糊口。所以未來是有一個供需之間的 GAP 存在,而最終生态的繁榮一定是能把商業模式跑通的繁榮。開發者能掙到錢,我們能掙到錢,需求越做越大,給大家提供越來越好的體驗。當前,我們只專注于給用户提供極致的通用超級智能體產品體驗。
提問:現在大家都在説超級智能體或超級應用,你認為最終的互動方式該是怎樣的?
黃際洲:對于這一問題,我們也一直在思考。
關于互動方式,如果把用户千奇百怪的輸入和不同的互動方式(語音、文字等)整合在一個產品裏,這對于互動的要求超高,在完成不同任務時,也很難。所以我們一直強調一個很簡單的輸入,目标就是消滅復雜的 prompt,但這很難一下子做到,所以我們嘗試從極簡化用户需要輸入的東西開始,比如做城市攻略,用户輸入 " 哈爾濱旅遊攻略 " 就足夠了,剩下的事情智能體會一步步幫你細化和完善,最後給出一個成品。