今天小編分享的互聯網經驗:審視AI Agent:追捧、落地,和2024年的To B破局點,歡迎閱讀。
圖片來源 @視覺中國
文 | 產業家,作者 | 鬥鬥 ,編輯 | 皮爺
今年 4 月份,斯坦福和谷歌的研究者共同創建了一個 " 西部世界小鎮(Westworldsimulation)",在這個小鎮裡,25 個智能體可執行類似人類的日常行為,比如起床後做早餐然後去上班,藝術家作畫,作家寫作。
這些就是如今人們共同談論的 "AI Agent 實驗 "。而在國内的今年下半年,大模型市場的玩家們,似乎正齊刷刷地轉向 AI Agent ——這個清晰可見的 AGI 終局產品。
一組數據顯示,截止 11 月中旬,AI Agent 賽道發生融資事件 13 起,總融資金額約 735 億人民币,公司融資均值為 56.54 億人民币。
而在國外,這一領網域亦是火爆。" 至少有 100 個項目正致力于将 AI 代理商業化,近 10 萬名開發人員正在構建自主 Agent。" 外媒 MattSchlicht 曾表示。
AI Agent 為何如此火爆?
關于 AI Agent 的想象力,一個高贊回答是:" 大語言模型只能編個貪吃蛇,而 AI Agent 可以整出一個王者榮耀。"
成熟的 AI Agent 可以使軟體生產大幅降低成本。未來 Coding 工作流中會很多 Agent 臨時寫成的軟體和測試方案,不追求長期的可復用性,可以随用随抛。目前一家軟體行業巨頭動辄上萬甚至十萬人,有了 AI Agent 之後研發、交付需要耗費的人力和資金将大幅降低。而且使得軟體可以靈活地解決更多長尾需求。
此外,AI Agent 或将為 LLM 搭建一套框架來進行深度思考和分析,從而做出更復雜和可靠的決策。
總之,就像微軟創始人比爾 · 蓋茨所說的那樣:" 誰能主宰個人助理 Agent,那才是大事。因為你将永遠不去搜索網站,不去生產力網站,不去亞馬遜。"
值得注意的是,在這種巨大的技術變革下,目前我們仍沒有切身體會到 AI Agent 所帶來的紅利和變化。很明顯,AI Agent 的發展仍面臨一些難題。
一些值得探讨的問題是,國内外 AI Agent 的發展現狀如何?AI Agent 落地的關鍵點是什麼?以及 AI Agent 未來是怎樣的?
AI Agent 現狀,海外 VS 本土
目前,國内一些科技公司已經產出了數個知名大模型,因此孕育而生的 Agent 智能體應用也開始逐漸進入大眾視野。
例如百度将文心大模型應用到智能搜索、自動駕駛;阿裡将通義千問模型應用到高德地圖、優酷,盒馬等產品。華為将其盤古模型應用到智能氣象、語音識别等。
一家叫面壁智能的創業也公司推出了他們的 AI Agent 產品 ChatDev,可以在短時間内完成一個軟體或者一個小遊戲的開發,用戶所需要做的,只是提供給它一個要求。
值得注意的是,協同辦公領網域似乎是巨頭們做 AI Agent 的 " 必經之地 "。
例如釘釘魔法棒套件中,從聊天 AI、文檔 AI、會議 AI、宜搭 AI、TeambitionAI 等都匯集了釘釘 AI 產品能力;騰訊會議中的 " 會議助理 " 功能提供了一些智能化的支持,如自動總結會議紀要、轉錄和翻譯;百度推出的智能工作平台如流搭載了文心大模型,可以實現智能創作、智能推薦等功能;字節跳動旗下的辦公軟體飛書宣布推出智能 AI 助手 "MyAI",旨在提升團隊協作效率。
曾有投資人對媒體調侃:" 十個 AI 應用裡面,五個辦公 Agent,三個 AIGC,還有兩成是回春的數字人。"這不僅是國内 AI Agent 發展的現狀,其實從國外一些諸如谷歌、微軟等企業也在将 AI Agent 落于協同辦公場景。
其實在海外,AI Agent 概念從出現到爆發,已經邁過多個階段。
在單一 Agent 階段,主要是針對不同領網域和場景的特定任務,開發和部署專門的智能體。以 GPTengineer 為例,給它一個需求,其就可以把代碼寫個大概。
而多 Agent 合作階段,是由不同角色的 Agent 自動合作完成復雜的任務。例如在 MetaGPT 上,如果讓其做一個股票分析的工具,它會把這個任務分别翻譯給產品經理、架構師、項目經理等 5 個角色,模拟整個的軟體開發中所有決策工作流。
不過,随着微軟全新工具 AutoGen 的發布,AI Agent 很快翻開了新的篇章。
AutoGen 允許多個 LLM 智能體通過聊天來解決任務。LLM 智能體可以扮演各種角色,如程式員、設計師,或者是各種角色的組合,對話過程就把任務解決了。這與 MetaGPT 不同,MetaGPT 的角色模型是被定義好的,而 AutoGen 可以讓開發者自己定義 Agent,還可以讓他們相互對話。
這是一個新的且富有創造性的 Agent 框架。在 AutoGen 發布的兩個星期内,星标量從 390 狂增到 10K,并在 Discord 上吸引了 5000 多名成員。
微軟在 AI Agent 的布局較早。2023 年 3 月 Microsoft365Copilot 發布,在當時便提示了一種基于 LLM 的應用開發範式,即 Agent。目前,微軟 CopilotStudio 已經支持自定義 ChatGPT 助手無縫集成在 CRM、ERP、OA 等日常辦公系統中。
可以發現微軟的 AI Agent 能力主要是從其本身業務衍生出來的,AutoGen 更像是一種自身基于業務所打造的能力的外放,這與 OpenAI 并不相同。
OpenAI 開發的 GPTs,以及推出的 GPT-4Turbo 和可定制 AI Agent,使得每個人都可以打造自己的大模型應用。諸多業内人士認為,超低的創建門檻和 APP Store 一樣的商業模型,會讓 OpenAI 快速構建 GPTs 生态。
OpenAI 提供的是基礎 Agent 的構建能力,如工具調用、基于知識庫檔案記憶能力等。這項產品的發布,使得 AI Agent 進入了另外一個新階段,即為人人都可以打造自己的 Agent 提供了一種可能性。
值得注意的是,目前海外已經在零售、房地產、旅遊、客戶服務、人力資源、金融、制造業等多個領網域出現 AI Agent 架構與產品。
例如零售領網域的亞馬遜 Alexa、Aktify、Regie.ai 等;房地產領網域的 Epique、propertypen、Listingcopy 等;客戶服務領網域的 Agent4、Ebi.Ai、JasonAI、Aide 等;人力資源領網域的 AutonomousHRChatbot、AIInterviewCoach、CareersAI 等。
總體來看,在 AI Agent 在底層技術、架構以及具體產品應用等方面都較為完善。像 OpenAI、微軟、谷歌這類科技巨頭,有着先發優勢。另一個可以看到的現象是,國内 AI Agent 的深度與廣度仍有所差距。
一個值得思考的問題是,Agent 落地的關鍵是什麼?
Agent 落地的關鍵:模型?行業經驗?還是載體?
當前市場上的大多數 Agent,包括 OpenAI 推出的 GPTs,其實只是構建了一個基于特定知識庫或專業數據的 Chatbot。這些智能體主要用于進行問答互動,如獲取行業資訊、報告等。
然而,在程式聯動和操作方面還有很大的提升空間。目前,我們還無法直接使用 GPTs 來操作 SAP 或金蝶等 ERP 系統,因為這涉及到 API 的應用、授權、維護以及無 API 管理軟體的連接問題。
對于企業而言,如果 GPTs 等 AI 智能體僅用于知識問答,那麼其作用将非常有限,就像一個玩具一樣,因為它目前還無法深入到企業的業務流程中。
這背後的原因有很多,包括模型能力、行業經驗、場景貼合度等,都會影響 Agent 的能力體現。
AI Agent 需要具備感知環境、做出決策并執行适當行動的能力。在這些關鍵步驟中,最重要的是理解輸入給 Agent 的内容、進行推理、規劃、做出準确決策,并将其轉化為可執行的原子動作序列,以實現最終目标。
目前,許多研究利用 LLM 作為 AI Agent 的認知核心,這些模型的發展為完成這一步驟提供了質量保證。因此,基于 GPT-4 的 Agent 表現得更加智能。
但就目前而言,包括 GPT-4 在内的所有大模型,能力仍需提升。
" 底座模型問題都還很大,AI Agent 真正落地還要等更優秀的模型。"某位身處大模型技術一線的業内人士對產業家說。
不過針對模型能力不足這一問題,智譜 AI& 清華 KEG 提出了一種對齊 Agent 能力的微調方法 AgentTuning,該方法使用少量數據微調已有模型,顯著激發了模型的 Agent 能力,同時可以保持模型原有的通用能力。
AI Agent 的行業經驗對于其落地也至關重要。
" 如果一篇論文提出了某種不同的訓練方法,OpenAI 内部的 Slack 上會嗤之以鼻 , 因為這些都是我們玩剩下的。但是當新的 AI Agents 論文出來的時候 , 我們才會認真興奮的讨論。" 這是 OpenAI 聯合創始人 AndrejKarpathy 最近發表的一段講話。
簡而言之,我們基于大模型能做出什麼樣的東西,說到底還是要靠行業經驗,而這恰是 OpenAI 等一眾大模型巨頭們所欠缺的。
要知道,企業要引入 AI Agent 進行流程優化,必須經過成本控制、投入預算、實現效率、安全管控等多方面嚴格及缜密的評估。這就要求技術供應商提供的必須是平台級解決方案,而不是只針對單一、個别場景需求來提供的 AI Agent 自動化解決方案。
大型企業引入新的 AI 技術不允許任何試錯成本,因此技術供應商給出的解決方案必須是開箱即用、具備行業 Know-How 術語和業務規則的真實智能體數字員工。也只有這樣的标準化 AI Agent,才能被納入企業的内部編制中去統一管理和調度。
例如,一個醫療行業的 AI Agent 需要具備醫學知識,并能夠理解和處理醫療數據。一個金融行業的 AI Agent 需要具備金融知識,并能夠理解和處理金融數據。
AI Agent 的落地效果也受限于應用場景。在如出行預訂中,得益于豐富的 API 等問題,AI Agent 表現出色。而在如法律助手場景中,由于新知識的頻繁出現和 API 的不完善,實際應用面臨更多挑戰。
這一點,從國内 AI Agent 紛紛生長于協同辦公平台就可見一斑。
事實上,協同辦公平台本身具備良好的 API 接口和插件體系,這使得将大模型集成到現有工具中變得更加容易。
此外,許多企業和組織都在使用協同辦公軟體,這意味着大模型可以迅速覆蓋大量的潛在用戶。廣泛的用戶基礎可以加速大模型的迭代和優化過程,使其更好地滿足用戶需求。
還有大量的數據資源助于提高模型的性能,豐富的場景也可以推動大模型技術持續改進。
釘釘、飛書和企業微信在作為 Agent 載體時,也各自具有不同的優勢。釘釘提供了完善的組織架構管理功能,可以方便地創建、管理和調整團隊架構,使得企業能夠快速搭建适應其需求的組織結構。
飛書強調實時協作和溝通,支持多人在線編輯文檔、共同讨論等功能,有助于團隊高效地完成協作任務。其特有的一體化,使得整個辦公流程更加标準化。
企業微信與微信互通,這使得其 AI Agent 有可能借助微信龐大的用戶數據和應用場景,提供更加個性化和場景化的服務。
站在這個角度來看,國内 AI Agent 扎堆協同辦公領網域,則變得理所當然。而找到一個适合 AI Agent 落地的場景或者說載體更為重要。
不過,除了協同辦公,還有許多其他載體可能更适合 AI Agent 的落地應用。
例如智能客服、智能助手、RPA、CRM 等。具體來看,在智能客服方面,AI Agent 可以自動回答用戶的問題,處理投訴和建議,提高客戶滿意度和效率。在智能助手方面,蘋果公司的 Siri、谷歌公司的 GoogleAssistant 和亞馬遜公司的 Alexa 都是智能助手的代表。
在智能流程自動化方面,許多企業采用智能流程自動化工具,如 UiPath、BluePrism 等,來自動完成某些特定的業務流程。
在智能營銷方面,許多營銷平台都集成了 AI Agent,如 HubSpot、Salesforce 等。這些平台的 AI Agent 可以通過數據分析和機器學習技術,提供精準的營銷建議和預測,幫助企業更好地了解客戶需求,提高銷售業績。
總而言之,模型能力是核心,行業經驗是關鍵,載體是保障。無論是模型能力還是行業經驗抑或是載體都是 AI Agent 落地的關鍵。值得注意的是,國内的軟體業态,倒逼國内廠商造就了一身定制化、個性化能力,這種能力側面驗證了國内企業在技術落地上的潛力,這将會進一步推動 Agent 的落地。
AI Agent 的終局是什麼?
在文章開篇的 " 西部世界小鎮(Westworldsimulation)" 裡,這些智能體可以與别人和環境交流(互相注意到彼此舉動、發起對話或者問候)、反思這些觀察結果(形成獨特的個人觀點)、制定每天的計劃。他們擁有自己記憶和目标,會產生可信的個人和湧現的社交行為,而不是通過預先設計實現。
例如從用戶指定的單一任務開始,即一個 AI Agent 想要舉辦情人節聚會,AI Agent 們在接下來的時間裡會自發的傳播邀請、認識新朋友、互相約出參加聚會的日期,并協調在正确的時間一起出現在聚會上。
這是 Agent 項目裡具有代表性的應用。人們之所以為這個項目感到驚訝,是因為 Agent 的互動出現了人類意料之外的現象。AI Agent 爆發的一段時間,人們普遍認為補齊了大模型短板的 AI Agent 更具備實用性,将是大模型重要落地方向。
随着 Agent 的構建越發簡單,Agent 生态的成熟會讓 C 端 Agent 出現百花齊放的局面,面對用戶,Agent 将會更加接地氣,引起新一輪的爆發。
但就目前而言,這一路徑的商業化存在諸多問題。拿遊戲場景而言,目前收費主要來源于出售遊戲裝備、皮膚等方式。而 AI Agent 的價值無法體現在這些固有的變現途徑上。并且就目前 Agent 落地效果來看,未出現颠覆性的能力,C 端用戶是否會為其買單無法得知。
更值得注意的是,随着讓 C 端 Agent 百花齊放,其應用價值方面也随邊際效應而無限趨向于更小量級。換言之,AI Agent 能否成為 AI 大模型從 C 端商業化爆發一個最核心應用方向,還需時間驗證。且即使未來會成為 C 端商業化爆發一個最核心應用方向,但其 " 壽命 " 并不長。
一個事實是,AI Agent 最終的落腳點或将在 B 端。
比爾蓋茨認為,智能體作為下一個平台,将會影響人們使用軟體的方式以及軟體的編寫方式。它更擅長查找信息并為用戶總結信息,能夠會為用戶找到最優惠的價格,将取代搜索網站及電商網站,也将取代文字處理器、電子表格和其它生產力應用程式。并且,現在各自獨立的搜索廣告、廣告社交網絡、購物、生產力軟體等,都将變成智能體這一項業務。Agent 會徹底改變應用軟體的打開方式。
這些變革來臨之前,相對于 Agent 本身帶來的影響,如何構建一個 Agent,是一個更值得關注的問題。
Agent 構建平台上,企業或将可以自己構建自己 RPA、CRM、辦公 OA 等一系列管理軟體;軟體廠商也可以基于此平台構建軟體為企業提供服務。
對于身處或準備進入 AI Agent 領網域的玩家而言,找到切入點以及好的商業模式至關重要。
未來 AI Agent 的發展将不僅僅局限于單體智能,而是會擴展到物的智能和機器人的聯動。
從群體智能的角度來看,ToC 可能會形成更大的社區化虛拟組織,每個人的 Agent 都能通過虛拟數據連接在一起;而 ToB 則可能形成虛拟的組織和企業,不同的企業和員工都能通過智能體納入到網絡當中。
最終,整個社會将變成一個巨大的虛實結合的網絡,形成 " 智聯網 "。在這個網絡中,不同的智能體将提供更強的生產力,重新塑造整個生產關系,從而提升整個社會的產能。
因此,AI Agent 的發展前景非常廣闊,它們将不斷擴展其應用範圍和影響力,為未來的社會發展帶來巨大的變革和機遇。
時至今日,AI Agent 雖然帶來了諸多想象力,卻仍舊存在諸多質疑。技術發展之路本就充滿質疑與批判,科技變革對于任何一個企業與個體都是一場機遇,關鍵在于如何把握它。