劍指「智能體」

今天小編分享的互聯網經驗：劍指「智能體」，歡迎閱讀。

文 | 王智遠

關于 ChatGPT 做搜索的新聞，我一直挺感興趣。

上個月 25 号，OpenAI 在當地推出了一個新產品，名叫 "SearchGPT"。官方說，產品能給用戶提供帶鏈接的搜索結果，用戶還可以繼續問問題，系統會根據上下文給出回答。

我看到消息後，馬上申請内測。但一個月過去，官方還沒給我權限；現在網上辦法多。我就通過特殊朋友渠道，弄到了一個測試賬号，體驗了一把。

體驗之後什麼感覺呢？

一句話總結即： perplexity AI 解決不了的問題，SearchGPT 也解決不了。

比如：AI 幻覺。一千個觀眾有一千個哈姆雷特，不同的人看同一信息可能得出不同的結論。就算是同一個人，今天看到的東西和明天可能理解也會有所不同。

這就像 AI 面對復雜、多變的人類思維一樣，如果 AI 不能真正地 " 站在你的角度 " 去理解問題，感受你的感受，那它很難獨立地給出人們真正想要的答案。

因此，除非 AI 能達到這樣高級的理解和适應能力，不然，AI 永遠無法避開幻覺問題。所以，怎麼辦呢？

來看看另一個新聞：

不久前，Twitter 上有個名叫 @iruletheworldmo 的用戶頻繁爆料，談到 Project Strawberry（草莓計劃），這是 OpenAI 的一個項目，以前叫 Q-Star。

這個計劃目标是讓 AI 變得更聰明，更能自主。 簡單來說，他們希望訓練出來的 AI 能自己處理很多事，不太要人來監督。

這意味着，AI 将能自己搜索信息，深入研究問題，甚至自己創造數據，這樣就能減少對人類的依賴。也就是說，AI 可能會變得更像人，更會思考。

這條推文引起了不少人的關注，大家都在猜到底是不是 OpenAI 内部信息，但還沒等到官方回復，就有人跳出來了，這人叫 Div Garg，是 MultiOn 公司的創始人。

他說：

OpenAI 的 "Q" 還沒正式出來，但我們已經推出了一個新的智能體，叫 "Agent Q"，并且邀請大家來試試，很多人懷疑他在利用 OpenAI 的秘密項目來做廣告。

我查了查，發現 MultiOn 這家公司确實在 2023 年接受了 OpenAI、DeepMind 等公司、高管個人的投資；所以，讓人不禁猜想，OpenAI 做的搜索項目，和他們到底有沒有關系？

好吧。姑且，不論這事，來看看 MultiOn 這家公司。

MultiOn 專門做 AI 智能體，目标是，通過智能體幫助人們完成日常任務，比如： 網頁浏覽、網購和郵件處理，他們希望構建一個能在數字世界裡，能自主完成復雜任務的 AI 系統。

這麼一看，兩者之間确實有些相似。相似在哪呢？

我們換個角度：

請問，你解決不了 AI 搜索幻覺的問題，還要不要解決？作為普通人的我們當然覺得，要。必須解決。其實，單一視角往往會限制我們。

系統科學家羅素 · 艾可夫 ( Russell L. Ackoff ) ，在作品《問題解決的藝術》中提到：

復雜問題往往源于問題定義本身，如果能夠以新的視角、新框架重新定義問題，有時能發現原本看似復雜的問題，其實有更簡單的解決之道，或者，原本的問題根本就不需要以傳統的方式解決。

也就是說： 解決一個復雜問題，最好的辦法是，繞開把它轉成一個非問題。

舉個通俗的例子：

想象一下，你家廚房每次做完飯都一團糟。通常，你可能會選擇在烹饪後進行一次大掃除，這樣雖然能清理幹淨，但每次要花費大量時間和精力。

如果你換一個角度來看就不一樣了。類似，重新組織廚房物品，把常用的廚具、調料放在容易拿到的地方，不常用的東西則收好。

改進烹饪流程，做飯時，邊做邊清洗用過的器具，甚至，在操作台上放一個垃圾桶，用于臨時收集廚餘和垃圾。

這樣，是不是做飯過程中就能持續保持廚房整潔了？這就是，非問題化；重新定義問題和調整處理方式，使原本要解決的問題變得不再是問題。

那麼，這和搜索與智能體之間有什麼關系呢？來看看，OpenAI 首席執行官 Sam Altman 在 2024 年 4 月 25 日斯坦福大學的演講。

他說，AI 實現通用人工智能（AGI）要經過五個階段：

一級：能夠進行對話互動的人工智能；二級：系統能夠解決博士級别的問題。三級：系統能夠代表用戶工作幾天；四級：人工智能能夠開發創新。五級：人工智能系統可以執行組織的工作。

他并指出，目前 OpenAI 處于第一級，接近第二級。

考慮到進展，請思考一下，這樣一個 AI 行業巨頭，如何從當前階段過渡到更高級階段，比如 " 三級或四級，或者說，如何讓弱人工智能到強人工智能？讓技術更能滿足每個用戶第一場景使用情況？

答案很明顯：AI 智能體。

因為，智能體是過度解決問題的最好辦法。想象一下，在理想狀态下，面對億萬用戶時，如果能夠展示數千萬個 AI 解決方案，來幫助大家解決各種問題，那麼，無疑是最有效的。

畢竟，每個人都能找到符合自己需求的解決方案，極大提到了解決問題的效率和質量。

為什麼是智能體？

昨天，一個朋友抱怨說，買房後要還貸款，未來幾十年每月都要還幾千塊錢；他讓我幫忙算一算，到目前為止，他一共還了多少本金和利息，如果他想提前還款，根據現在的政策，可以節省多少錢。

這種復雜的問題我怎麼能解決？于是，我把它給了豆包。

我先描述基本情況，讓豆包記住，然後，再把其他想法和訴求告訴它。大概幾十輪的對話後，豆包幫我詳細計算了出來，并生成一份大約 600 字的詳細分析報告。

這份報告包括了完整的背景信息、我的具體訴求、計算過程和對比分析等。

你用過豆包，或者其他可以和 AI 對話的工具麼？不知道你有沒有發現，現在此類對話工具，連續上下文邏輯能力變強了。

我再說一個貼身經歷：

最近幾天，經常接到一些奇怪的電話，涉及内容如貸款、房產購買、京東優惠等。

這些電話中，上來就問需要、不需要、行或者不行。我發現，對方語氣很像真人，但當我給出它們設定範圍以外的問題時，它無法回答了。

這說明，智能體已經在不知不覺中融入了日常生活，它們，能夠在特定的環境中模仿人類的互動方式。

所以，一個完整智能體，能夠充分與環境互動，這包括智能體自身和它所處的環境兩個部分；就像人類在物理世界中的行為一樣，智能體在其 " 外部環境 " 中也能執行任務。

說白了，我可以與它互動，也能設定好指令，界定範圍，讓它幫我完成目标。

對比下來，是不是不難看出，智能體無疑是繞過 AI 搜索中幻覺問題、并成功商用的有效方式之一？

為什麼這麼說？

你想想看，考慮傳統 AI 搜索和提問時，AI 搜索直接給出答案，這種答案比較扁平化，不具備連貫性。 換言之，你提出一個問題，AI 直接給你一個結論，結論會引用來自多個信息源的數據。就結束了。

智能體工作方式不同。

它不僅對單一問題做出反應，還會引入外部信息，在一連串多輪問答中，會反復接受來自你的信号，通過這種互動，它更能理解你的訴求。

在解決問題之後，它能生成一篇簡短的文章、總結方案，把整個互動過程指标串聯在一起； 很明顯，智能體不是一個簡單的 AI 提問、總結工具，是一個完全符合每個人需求的系統。

因此，智能體能完美繞過 AI 幻覺，畢竟過程中，你不滿意時，能一次次糾正它的錯誤。

縱觀國内市場，目前誰在做智能體呢？我查閱了一下，據說有超過 4500 家，比如：大家耳熟能詳的百度、科大訊飛、雲從科技、字節跳動和騰訊等。

所以，誰在做智能體，這個問題不好解答。與其這樣，不如換種思考方式： 智能體類型有哪些？我們通過類型看各家所在的生态位。

我盤點結果是：

智能體（Agent）平台大體上分為兩類： 一類基于知識庫和數據庫的。 就像聊天機器人（Chatbot）這種簡單的平台； 另一類是用來解決更復雜問題的。 這種平台有多工作流編排的能力，比較高級。

國外 Orkes Conductor、ControlFlow by Team Prefect、和 Flyte 等平台，就是專為復雜工作流和數據處理設計的。

這些平台主要用戶包括數據科學家、工程師、開發者，他們用平台來建立和優化復雜的工作流程，提高數據處理的效率和自動化水平。

國内也有類似的平台。像扣子 Coze、百度智能雲的千帆 AgentBuilder、科大訊飛的星火智能體平台，還有騰訊的元氣和阿裡雲的 AgentScope 等。

他們利用大模型搭建 AI 原生應用工作台，給開發者提供 RAG、Agent、GBI 等應用框架，賦能他們開發出來文生文、對話、文生表等垂直應用，以幫助企業和個人解決問題。

我根據對象、流程和代碼復雜程度，把它細抽成三類：

面向公眾和非開發人員

面向開發者的平台

企業級開發平台

第一種，主要偏向低代碼平台，不要你懂太多編程。

像 GPTs 這樣的工具，提供很标準的操作界面和流程，主要用來做基于知識庫的聊天機器人。給你一個模板，你按步驟填信息就行，不用自己調整太多東西。

字節跳動的扣子（國内版），就是被設計來幫助人們輕松創建下一代的 AI 聊天機器人。

第二種平台功能更強大，可以讓開發者用各種 API、第三方庫，還能自己編寫代碼和調整參數，來精細控制智能體的行為。

Coze 海外版很受歡迎，它的功能全面，支持很多高級操作。像百度、阿裡和亞馬遜也提供這樣的平台，讓開發者可以用各種 AI 模型來做更復雜的應用。

企業開發平台，專為企業設計，重點是幫助企業自動化他們的工作流程。

比如：

實在智能的 TARS-RPA-Agent 和壹沓科技的 " 數字員工團隊 "CubeAgent，它們是用來自動化企業日常操作的。

還有國外的 Torq 和國内瀾碼科技的 AskXbot 平台，也提供了大模型結合企業知識庫的解決方案，幫助企業自動化處理更多復雜任務。

三種類型各有千秋，這麼說，是不是更清楚一些？那麼，站在 AI 搜索和智能體中間來看，智能體屬于那種呢？

04 ‍

解答該問題，不妨站在行業結構視角看。我盤了一下，智能體（Agent）行業結構有四層，分别為：基礎工具層、運營平台層、開發工具層，以及服務與培訓平台層。

組件是做智能體必不可少的基礎。 有各種智能模塊、記憶模塊，比如語言模型、數據庫，還有一些安全工具和通信工具，就像蓋房子的磚塊和水泥。

運營層，包括制作 Agent 組件的廠商和各種運營集成平台。 如 GitHub 這樣的 Agent 框架發布平台，它們提供必要的環境和服務，支持智能體運行。

開發層相對容易理解了。

像 Agent 工具集成平台 AgentLego、或提供專屬雲環境及沙盒環境的平台等，它們使開發者能夠構建、測試和部署智能體。

值得一提的是，像 NexusGPT、Relevance AI 等平台，它們提供數字員工 Agent 的訓練服務，目的幫助企業把智能體整合進現有的工作流程中，或者幫助個人創建能自動完成任務的 AI 團隊，這反而是目前很多企業剛需。

國内也有類似的公司。例如：

金柚網的梧桐數字員工、壹沓科技的數字員工平台 1Data Agent，以及實在智能的 RPA Agent。

這些平台的特點是允許用戶通過聊天，輕松與智能體互動，管理和優化各種業務流程，使智能體理解和執行復雜任務，讓日常更高效。

不論怎麼說，從短期發展看，智能體要解決兩個問題：

一，豐富通用工作流和場景工作流，類似于 AI 搜索下的大搜，還要在處理數據訓練、多輪對話的準确性上下功夫。

二，讓智能體成為知識專家，形成可持續的服務能力。有點像針對特定領網域進行深入挖掘。

比如，假設我是做消費品營銷的，如果有一個專門的智能體，它學了很多關于社交媒體趨勢、消費者行為的知識，那麼，它就能真正幫到業務。

當然，智能體在其他行業也在不斷爆發，像遊戲，金融、醫療等，總體上說，基于 LLM 的能力，下一步基礎智能體必将是繞不開的一步。

總結

讓它光思考，遠遠不夠。

想實現真正全面 AGI，得把對話模型變成基本智能體，讓它參與到實際使用中去；就像人們常說的，從實踐中來，到實踐中去一樣。

所以，AI 生成避免不了幻覺，但智能體的輪番互動，可以微調，可以解決具體問題，至少，使用場景下，這是閉環的正向反饋動作。