今天小編分享的互聯網經驗:AI智能體創業必讀,詳解AI Agent市場格局、技術路徑與未來市場,歡迎閱讀。
圖片來源@視覺中國
文|王吉偉
七張圖,深度了解全球AI Agent行業
五個板塊七張圖片,帶你深度認知全球AI Agent行業
AI智能體市場規模有多大?目前市場格局是怎樣的?一篇文章看明白
AI Agent市場格局如何?未來市場前景怎麼樣?一篇文章看明白
了解AI Agent市場格局、技術路徑與未來市場,看這一篇就夠了
詳解AI Agent市場格局、技術路徑與未來市場,智能體創業一定不要錯過
雖然GPTs推出後暴露了很多問題,時不時就會有安全組織現身說法,卻無法阻擋人們創建專屬CahtGPT的熱情。
因為宮鬥,OpenAI不得不将GPT Store的上線推遲到2024年,這就讓一些第三方GPT Store的聲望更強,GPTs Hunter數據顯示目前的GPTs數量已經達到3.3W+。
按照這個發展速度,就是OpenAI官方GPT Store在明年1月1日上線,GPTs的數量最少也能超過10W+。如果算上企業用戶借助微軟OpenAI服務開發的GPTs,這個數量可能要翻倍。
微軟屬于近水樓台,緊跟着OpenAI推出的Copilot Studio功能更強且應用更廣,已經支持自定義ChatGPT助手無縫集成在CRM、ERP、OA等日常辦公系統中,安全性能也更強。
這還只是OpenAI一家廠商的GPTs產品,其他廠商的同類產品已經在路上或者發布。
比如國内大語言模型(LLM,Large Language Models)廠商昆侖萬維發布的天工SkyAgents平台,可以讓用戶通過自然語言構建私人助理。字節跳動的豆包平台,也悄悄上線了創建AI智能體功能。在這個兩個平台,都能構建類GPTs產品,當然也能深度集成各自生态内的辦公等產品。
開源廠商也不例外。比如LangChain推出的開源項目OpenGPTs,能讓用戶構建類GPTs產品。
"準Agent"GPTs作為AI智能體的早期產品,它的大量出現必然會帶來LLM在更多場景的大量應用,也為真正AI智能體的應用做了鋪墊,先一步引領了用戶體驗并教育了整個市場。
用比爾蓋茨的話來說,Agent将能夠幫助人們處理幾乎所有活動和生活各個領網域的事務,對軟體業和整個社會都将產生深遠影響。
GPTs是AI智能體時代的前夜,它的大量應用意味着自主智能體時代即将到來。
未來AI智能體的普及應用,将會造就一個極其龐大的市場。大模型廠商、技術供應商、企業服務軟體廠商、初創企業以及各領網域的大型企業,都将參與到這場AI智能體的饕餮盛宴。
那麼,未來的AI智能市場規模會有多大?市場格局又是怎樣的?目前都有哪些具有代表性的Agent產品及項目?
本文,王吉偉頻道通過七張圖來為大家揭開這些謎題。如果你是AI Agent創業者,這篇文章将非常适合你。
AI Agent市場前景
先來看一下AI Agent的市場前景。
單從自主智能體(Autonomous Agent)市場規模來看,marketsandmarkets數據顯示2019年全球自主智能體市場規模為3.45億美元,預計到2024年将達到29.92億美元,2019-2024期間的年復合增長率将達到54%。
其中,自動化和敏捷性的提高、交付增強客戶體驗的需求、成本節約和投資回報的增加是自主智能體行業的一些主要增長因素
同時該機構預計,2023年全球自主人工智能和自主智能體(Autonomous Agent)市場的收入規模超過48億美元,到2028年有望達到285億美元左右,預計2023-2028年的年復合增長率為43.0%。
自主人工智能和智能體的擴張受到多重因素的推動,包括人工智能應用的日益普及、并行計算資源的可訪問性的提高,以及自動駕駛和醫療保健的進步。
grandviewresearch預測數據與此相當。其數據顯示,2022年,全球自主人工智能和自主智能體市場規模為39.3億美元,預計從2023年到2030年将以42.8%的復合年增長率(CAGR)增長,其中亞太地區的復合年增長率将高達46.2%。
"自主(autonomous)"或"自動駕駛(self-driving)"術語用于描述無需人工幹預即可獨立操作和做出決策的人工智能系統。自主智能體產品形态主要體現于虛拟助手,包括亞馬遜的Alexa、蘋果的Siri和谷歌的Assistant等。
這意味着,大量Agent将會以軟體助手的形态出現,同時原有軟體形态的助手類產品也會更新迭代為自主智能體。
該機構特别提到,軟體市場在2022年已經以超過42.0%的收入份額領先市場。由于系統随着時間的推移而發展,适應環境并從中學習,軟體市場正在迅速增長。
需要說明的是,這幾組數據主要預測的是自主智能體的市場。雖然未來的AI智能體市場會以自主智能體為主,但不同企業往往會因為業務屬性與市場目标的不同,在具體需求上不一定都是自主智能體,還會涉及到非自主智能體以及生成式智能體等多種形式。
再就是某些引入Agent架構的傳統軟體產品,不一定會以智能體的形式出現。
因此,AI Agent的未來的市場空間實際要大得多。
自主智能體是一種軟體或程式,不需要人工幹預就能為用戶或系統做事情或做出決策。自主智能體的設計目的,是在與環境或其他自主智能體互動的同時完成特定的任務或目标。
例如,聊天機器人是自助服務智能體,可以通過文本或語音與用戶交流,響應查詢,提供數據,甚至完成諸如安排約會或訂購產品之類的任務。
另一個例子是,2023年3月美國軟體公司Adept籌集了3.5億美元,用于開發數字助理,這是一個能夠将文本命令轉換為一系列動作的人工智能模型。
對于AI Agent的未來,Octane AI 聯合創始人Ben Parr認為,Agent不僅在科技領網域更是整個商業領網域的浪潮,他預測10年内,将有多家價值數十億美元的公司的運營完全交給自主智能體。
事實上,從現在出現的少數人力資源+AI Agent的公司,已經能看到AI智能體往這個方向的發展苗頭。這個話題不是本文的重點,王吉偉頻道會在另一篇文章中與大家探讨。
AI智能體市場格局
對于自主智能體這個新興領網域,資本市場已經用其獨到的投資眼光将AI智能體產業劃分為三層架構。
大家可以看下面這張來自風險投資公司Aura Ventures的《自主人工智能體新興市場格局》圖(成圖于7月之前),它将整個Agent產業自下而上劃分三層,最下面為用于智能體運營(AgentOps)的模塊插件層,中間為程式應用層(APPlications),最上面為服務層(services)。
可以明顯感受到,智能體運營層借鑑了OpenAI官方給出的AI Agent架構,該架構也是當前最為流行的Agent架構之一。
智能體運營層
智能體運營層主要分為七個部分,分别為智能(Intelligence)、記憶内存(Memory)、工具和插件(Tools and plugins)、多智能體遊樂場和協定(Multi-agent playgrounds and protocols)、多智能體通信模式(Multi-agent communication schemas)以及多智能體通信模式、監控、安全和預算(Monitoring,security and budgetary)及智能體運營市場(AgentOps marketplace)。
智能(Intelligence):智能體的"大腦",由負責任務創建、規劃和上下文的 LLM 提供支持。它們理解并產生自然語言,擁有廣闊的世界知識,并且能夠學習,LLM一般通過 API或開源被使用。
OpenAI的GPT、Claude等LLM都在這個部分,更先進的例子包括 HuggingGPT及Falcon 等。其中也包括特定領網域的LLM和DAAS,比如為心理健康數據提供API的Sahha 。
分銷優勢、成本、社區護城河和模型質量,将是這個部分的制勝關鍵。
記憶内存(Memory):獲取、存儲、保留和檢索數據。分為短期記憶、長期記憶和感覺記憶。向量數據庫和嵌入框架的激增是其中的關鍵。參與者包括 Pinecone 和 Chroma以及像Perplexity AI一樣具有集成優勢的Text to SQL 初創公司,
工具和插件(Tools and plugins):能夠提供工具與插件的市場、API和技能庫,用于創建、修改和利用外部對象來執行超出LLM 限制的事情。外部工具可以顯著擴展模型功能,例如浏覽器掃描和桌面支持等。目前,這些實用程式主要存在于提示和技能庫中。
典型的產品,如Openai插件、replit及toolformer等。其他如SLAPA是一個自學習的API 系統,是早期產品化應用案例。Relevance AI也是該領網域另一個快速發展的參與者,它在 UX 和"用低代碼輕松創建智能體鏈"的能力方面頗具優勢。
多智能體遊樂場和協定(Multi-agent playgrounds and protocols):智能體網絡之間應該應用什麼通信協定,該問題将在這部分得到解答。PumaMart和SIM Gen Agents一直在做這方面的突破瓶頸,E2B是這個領網域的新興參與者。E2B已與OpenAI等LLM廠商建立合作,其Playgrounds沙盒環境可以讓用戶構建各種基于LLM的智能體及相關應用。
多智能體通信模式(Multi-agent communication schemas):由AgentOps的混合組成的Agent,将需要能夠使它們以盡可能最佳的方式進行互動的服務。多智能體通信協定,更有益于多智能體學習、反思和解釋的概念。
目前這些主要作為提示技術存在,更多是在論文中提及,比如Chain of Thoughts prompting Wei et al (2022) 和 Reflexion (Shinn & Labash 2023)(回復 格局 ,獲取本文所用所有大圖資料)。
這一部分,主要提供思維鏈、自我詢問,cmol調試器子目标以及分解相關。這個細分市場,也會在接下來迎來一些玩家。
監控、安全和預算(Monitoring,security and budgetary):在智能、内存、工具和插件、通信和協定、安全和安保方面,Agent都應受到監管。目前而言,對于工具級别或智能體級别的AI進行監控,仍然是一個懸而未決的問題。
這是Agent商業落地最重要的部分,能夠通過跨多個平台的監控(錯誤的數據沿襲)、安全性和預算來優化智能體的玩家将會勝出,也會催生很多智能體安全相關的初創項目。
智能體運營市場:被定義為智能體框架產品發布平台,如FinGPT,BabyAGI,AutoAGI,CAMEL等都在這一層。HuggingFace和Github也被放在這一層,主要因為這兩個平台提供并托管了大量的模型和相關項目。
HuggingFace是模型分發的主要參與者,有機會為Agent創建一個類似市場的產品,就像Smol-ai Developer所做的,AI工程師可以輕松地為任務選擇最佳的Agent基礎設施。
Agent應用程式層
Agent應用程式層主要包括通用應用(General purpose)和行業應用(Business industry)兩部分。
通用應用(General purpose):這些Agent提供了前所未有的數據驅動智能水平,并為個人用戶實現智能應用的民主化。這些将圍繞"待完成的工作"框架展開。病毒式傳播、建立分銷優勢的能力,以及利用更多可抵御大型科技公司的"利基"用例将是獲勝的關鍵。
目前主要案例是個人編程類工具,如 GitWit、GPT-Engineer等, Embra AI(MAC個人助理)、Dust(生產力助手)等個人生產力領網域的項目數量也在不斷增長。
行業應用(Business industry):垂直領網域的Agent,比如用于編程、營銷、輔導及研究人員等的智能體,使用特定于上下文的業務規則或數據進行微調,可以有效降低成本和提高績效。
預計進入AgentOps的行業下遊參與者将在這個市場中占據優勢,其技術堆棧更具防御性。當然,敏捷構建的現有企業也有可能獲勝。
關于應用層的其他Agent產品,大家可以按圖索骥,這裡不再贅述。
services服務層
services服務層包括用戶構建自己的智能體(Build your own-deployment)、智能體市場(Agent marketplace)和多智能體監控(Multi-Agent monitoring)三部分。
構建專屬個性化智能體(Build your own-deployment):大量廠商正在湧入這個領網域,目前主要是低代碼或無代碼平台包括RPA等超自動化平台。這些廠商在原有產品基礎上構建的基于LLM的平台,可以使任何企業或消費者用戶都能夠輕松創建和部署智能體。
為實現差異化、用戶體驗、客戶支持以及針對特定領網域的(例如,B2B、B2C、行業)定制可用性能力,将是廠商們獲勝的關鍵。
值得一提的是,這些平台的一個關鍵銷售參數是客戶保留,而集成和用戶體驗(例如支持)将是提高用戶粘性的關鍵。這部分的參與者包括 Relevance AI、XpressAI、SuperAgentAI 和 AgentRunnerAI等。
智能體市場(Agent marketplace):随着市場形勢的爆炸式增長,應用程式将在市場上上市進行推廣,将會出現更多為特定任務"雇傭"預先訓練的應用程式的平台,不管是在B2C領網域還是B2B領網域。
現有的此類產品中,如GitHub和Fiverr開始扮演這個角色。NexusGPT 正在通過自由智能體市場和MindOS 來颠覆這一點,已經具備廣泛關注度。未來,我們可能會看到特定行業或功能領網域的"捆綁"或大批人工智能工人作為產品出售。
多智能體監控(Multi-Agent monitoring):多智能體的控制室引擎是一個即将被颠覆的新興開放類别,企業和個人級别都有用例。這個領網域的企業,采用更簡單的方式構建集成和API的能力将是其獲勝的關鍵。
目前該領網域尚處于萌芽階段,但也有适用于企業和個人的項目,如 Alphakit.AI 是這一領網域的先行者,已經實現通過手機監控個人Agent。
需要說明的是,這張圖繪制于7月份之前,所以大家要注意并不是現在只有這些Agent相關產品及架構。最近4個多月裡又出現了大量的Agent,并且有了OpenAI的Assistant API這樣的工具,傳統AI廠商想要構建Agent應用也是相當簡單。
包括國内也出現了很多Agent項目,前段時間奇迹論壇的一場路演據說有30+Agent項目,這預示着AI Agent即将進入井噴期。
所以這張Agents市場格局圖并不是用來看有哪些產品的,主要是為了讓大家熟悉Agent產業結構。這樣要創業的話就能找到自己的位置,清楚自己的項目處于哪個層次,并能夠了解國外有哪些對标產品。
AI Agent SDK、框架與庫
前面提到現在已發展出很多Agent架構,下面我們也通過一張圖來了解。
目前在智能體的構建上,開發人員為解決可靠性、标準化、數據安全等問題而選擇的範式各不相同。
目前的智能體要麼建立在現有工具之上,要麼創建自己的内部解決方案,要麼采用一些專門為智能體構建的產品,其中許多仍處于早期階段或 alpha/beta 版本。
一些開發人員,為傳統軟體中智能體問題的等效問題提供了解決方案,比如:
用于智能體編排和調試的Inngest;
用于可觀測性的Sentry;
用于數據集成的LlamaIndex。
傳統的軟體解決方案仍然無法應對LLM性質所帶來的特定于智能體的挑戰。一個例子是調試智能體,它本質上是在處理提示,并且缺少與實時調試等效的智能體。
更多開發人員在構建智能體時,會使用新的框架和SDK來重新發明輪子,而不是在現有技術之上進行構建。
所以,現在的一些廠商完全摒棄傳統軟體構建智能替代邏輯,有的正在構建完全自定義的基礎設施,有的則使用現有技術至少以某種方式适合他們的智能體案例。
其中一種理念是多智能體系統的基礎設施補充,應該是面向智能體的智能體專有雲,如E2B 為智能體或 AI 應用程式構建的AI playground、沙盒雲環境,這些環境對于智能體的編碼案例很有用。
還有更多為AI 智能體或 LLM 應用程式量身定制的項目,最常見的是用于構建、監控和分析的框架。這些構建AI Agent產品所需要的特定SDK和框架,見下圖。
這張圖展示了目前已有的用于創建、監控、調試和部署AI Agent產品的SDK、框架、庫和工具的數據庫。
按照不同作用及功能,将這些框架及工具分為九個部分:監控、可觀察性及分析(Monitoring、Observability、Analytics),前端(Frontend),大語言模型運行時(Runtime for LLMs),構建框架和平台(Building Frameworks platforms),數據集成與内存管理(Data integration,Memory management),大語言模型API和路由器(API and routers for LLMs),人工智能產品構建庫(Libraries for building Al products),編排(Orchestration),構建和部署LLM(Building&deploying LLMs)。
其中在構建框架和平台中,我們看到了OpenAI的Assistants API、Langchain、AutoGen、OpenGPTs、Hugging Face Agents等知名Agent構建框架。
有意思的是,GPTs與Assistants API推出後,被網友認為已死的Langchain及其推出的全新框架OpenGPTs都在其中,這也間接證明了Langchain的生命周期并沒有傳言那麼慘。
對于創業者而言,這張圖算是點明了Agent技術發展路線。想要打造AI Agent的團隊,可以根據該圖來選擇其產品需要的框架及相關組件,或者尋找相應的替代品,不用再去為選擇什麼框架與技術而大費周章。
開源Agent和閉源Agent
E2B出品的這份AI Agent行業全景圖,所涉及的項目不算是最全的,卻是比較完整的,目前所涉及的行業及領網域都有相應的代表性產品。
該圖把目前的Agent產品分為開源和閉源兩個部分,并将按照項目屬性及面向用戶群體将這些產品放到了不同領網域及行業,其中還涉及到了Agent構建架構及運營支持的部門。
它被E2B放在名為awesome-ai-agents的GitHub項目上,此項目是開放性的,創業者可以在GitHub頁面提交相關項目。
這張圖一直在持續更新,目前已經更新11月的2.2版本。新版本與上一個版本的最大區别是,加入了「智能體運行時」單元。
可能是登上這張圖的項目過濾标準較高,也可能是迭代速度跟不上項目提交速度。目前圖片上的智能體相關項目(包括智能體構建框架及運行支持,雲平台除外)為98個,但項目頁面提交的項目展示數量已經超過130個。
從圖片來看,編程類Agent項目最多,整體數量已經達到38個,其中開源項目18個。
Agent構建框架類項目數量僅次于編碼類的Agent,總數量為19,開源項目為16個,閉源項目3個,其中包括OpenAI Assistans API。
生產力類Agent以閉源項目居多,數量為13,開源項目3個。
通用型Agent數量為12個,其中開源項目要多一些,數量為8。
數據分析類的Agent總共6個,其中閉源項目4個。
而3個商業智能類Agent,都是閉源項目。
科學、研究、設計、市場營銷類的Agent的數量各為1個,其中只有科學類和研究類Agent為開源項目。從中可以看出,垂直領網域類的Agent目前數量很少,也就意味着比較廣闊的市場,創業的話可以往相關的方向走。
當然,還有很多Agent項目這裡并沒有放上,另外各領網域的傳統企業管理軟體也正在發力Agent,AI智能體的列表必然會越來越長。
後記:個人智能體時代即将到來
下面這張圖,來自風險投資機構madrona在6月份發布的一篇關于AI Agnet的博文。
這張圖很簡單,羅列了當時比較具有代表性的生成式AI應用。其實用現在的眼光來看,這些應用當時正在向Agent模式過渡。尤其是智能助手類工具,幾乎都在謀求向Agent的轉型。
最近比爾蓋茨關于AI Agent的文章《AI is about to completely change how you use computers》刷了屏,詳細闡述了Agent将如何在未來幾年颠覆軟體行業。
其實在4月份高盛(Goldman Sachs)和SV Angel舉辦的關于人工智能的活動中他就提到過,未來的人工智能頂級公司可能會創建一個個人數字智能體,可以為人們執行某些任務。
或許正是受此啟發,madrona這篇博文名為《A Wave of Personal Agents is Coming》,談的是正在到來的個人智能體時代。
該圖按照個人應用工作流,将相關的工具與應用分為增強(ENHANCED)和原生(NATIVE)兩個板塊。增強板塊列舉了當時非常接近于Agent的應用,主體部分原生板塊分為内容創作及個人智能體&聊天助手兩部分。
在内容創作部分,紅杉将其分為視頻/圖片、市場營銷圖片、寫作、幻燈片、額外内容創建及3D遊戲開發幾個子版塊,每個版塊都列舉了相應的應用。
個人智能體&聊天助手部分是按照行業應用劃分的,分為購物、外賣/即時訂餐、家居、房地產、餐廳訂位、橫向聊天助手、個人生產力、旅行、人工智能朋友/夥伴、健康和教練及教育等行業。
其中前六個都标注了開放機會,并且第六個用T.B.D.标注,意味着在更多行業及領網域都會有更多的相關的產品走出來。
這張圖會繪制于6月份,所列舉的應用還是生成式AI應用或者可以用"準Agent"來表達,現在看來有些產品甚至可以被OpenAI的GPTs替代掉。
圖片左邊的被紅杉稱作增強型應用的產品,在當時已經很接近智能體功能,但還不具備自主采取行動的能力。比如Expedia在其移動應用程式中實施了AI聊天搜索用于發現行程,Kayak、Instacart和Klarna等公司在ChatGPT 中都有插件。
現在,随着OpenAI推出Assitant API以及更多Agent架構的出現,這些產品應該正在或者已經快速向Agent對齊。當時madrona調研的一些創業團隊,已經從特定領網域的方法開始構建Agent,還有些團隊采用橫向方法來創建個人智能體。
這張圖片上列舉的產品不是現在意義上的AI Agent,主要還是用于展示未來個人Agent的豐富應用場景,這也應該是其認為"一波個人智能體應用潮即将襲來"的主要緣由。
總體而言,這張圖對未來Agent的產品分類和應用領網域還是做了不錯的梳理。同時這些產品都有機會用現在的新架構及新技術迭代更新成為Agent,擁有一定的參考與借鑑意義的。
也希望你的項目,能夠早日進入類似的名單。