大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

劍指「智能體」

2024-08-23 简体 HK SG TW

今天小編分享的互聯網經驗:劍指「智能體」,歡迎閱讀。

文 | 王智遠

關于 ChatGPT 做搜索的新聞,我一直挺感興趣。

上個月 25 号,OpenAI 在當地推出了一個新產品,名叫 "SearchGPT"。官方說,產品能給用戶提供帶鏈接的搜索結果,用戶還可以繼續問問題,系統會根據上下文給出回答。 

我看到消息後,馬上申請内測。但一個月過去,官方還沒給我權限;現在網上辦法多。我就通過特殊朋友渠道,弄到了一個測試賬号,體驗了一把。 

體驗之後什麼感覺呢? 

一句話總結即: perplexity AI 解決不了的問題,SearchGPT 也解決不了。 

比如:AI 幻覺。一千個觀眾有一千個哈姆雷特,不同的人看同一信息可能得出不同的結論。就算是同一個人,今天看到的東西和明天可能理解也會有所不同。 

這就像 AI 面對復雜、多變的人類思維一樣,如果 AI 不能真正地 " 站在你的角度 " 去理解問題,感受你的感受,那它很難獨立地給出人們真正想要的答案。 

因此,除非 AI 能達到這樣高級的理解和适應能力,不然,AI 永遠無法避開幻覺問題。所以,怎麼辦呢?

01

來看看另一個新聞:

不久前,Twitter 上有個名叫 @iruletheworldmo 的用戶頻繁爆料,談到 Project Strawberry(草莓計劃),這是 OpenAI 的一個項目,以前叫 Q-Star。 

這個計劃目标是讓 AI 變得更聰明,更能自主。 簡單來說,他們希望訓練出來的 AI 能自己處理很多事,不太要人來監督。 

這意味着,AI 将能自己搜索信息,深入研究問題,甚至自己創造數據,這樣就能減少對人類的依賴。也就是說,AI 可能會變得更像人,更會思考。 

這條推文引起了不少人的關注,大家都在猜到底是不是 OpenAI 内部信息,但還沒等到官方回復,就有人跳出來了,這人叫 Div Garg,是 MultiOn 公司的創始人。 

他說: 

OpenAI 的 "Q" 還沒正式出來,但我們已經推出了一個新的智能體,叫 "Agent Q",并且邀請大家來試試,很多人懷疑他在利用 OpenAI 的秘密項目來做廣告。 

我查了查,發現 MultiOn 這家公司确實在 2023 年接受了 OpenAI、DeepMind 等公司、高管個人的投資;所以,讓人不禁猜想,OpenAI 做的搜索項目,和他們到底有沒有關系? 

好吧。姑且,不論這事,來看看 MultiOn 這家公司。 

MultiOn 專門做 AI 智能體,目标是,通過智能體幫助人們完成日常任務,比如: 網頁浏覽、網購和郵件處理,他們希望構建一個能在數字世界裡,能自主完成復雜任務的 AI 系統。 

這麼一看,兩者之間确實有些相似。相似在哪呢? 

我們換個角度: 

請問,你解決不了 AI 搜索幻覺的問題,還要不要解決?作為普通人的我們當然覺得,要。必須解決。其實,單一視角往往會限制我們。 

系統科學家羅素 · 艾可夫 ( Russell L. Ackoff ) ,在作品《問題解決的藝術》中提到: 

復雜問題往往源于問題定義本身,如果能夠以新的視角、新框架重新定義問題,有時能發現原本看似復雜的問題,其實有更簡單的解決之道,或者,原本的問題根本就不需要以傳統的方式解決。 

也就是說: 解決一個復雜問題,最好的辦法是,繞開把它轉成一個非問題。 

舉個通俗的例子: 

想象一下,你家廚房每次做完飯都一團糟。通常,你可能會選擇在烹饪後進行一次大掃除,這樣雖然能清理幹淨,但每次要花費大量時間和精力。 

如果你換一個角度來看就不一樣了。類似,重新組織廚房物品,把常用的廚具、調料放在容易拿到的地方,不常用的東西則收好。 

改進烹饪流程,做飯時,邊做邊清洗用過的器具,甚至,在操作台上放一個垃圾桶,用于臨時收集廚餘和垃圾。 

這樣,是不是做飯過程中就能持續保持廚房整潔了?這就是,非問題化;重新定義問題和調整處理方式,使原本要解決的問題變得不再是問題。

02

那麼,這和搜索與智能體之間有什麼關系呢?來看看,OpenAI 首席執行官 Sam Altman 在 2024 年 4 月 25 日斯坦福大學的演講。

他說,AI 實現通用人工智能(AGI)要經過五個階段: 

一級:能夠進行對話互動的人工智能; 二級:系統能夠解決博士級别的問題。三級:系統能夠代表用戶工作幾天;四級:人工智能能夠開發創新。五級:人工智能系統可以執行組織的工作。 

他并指出,目前 OpenAI 處于第一級,接近第二級。 

考慮到進展,請思考一下,這樣一個 AI 行業巨頭,如何從當前階段過渡到更高級階段,比如 " 三級或四級,或者說,如何讓弱人工智能到強人工智能?讓技術更能滿足每個用戶第一場景使用情況? 

答案很明顯:AI 智能體。 

因為,智能體是過度解決問題的最好辦法。想象一下,在理想狀态下,面對億萬用戶時,如果能夠展示數千萬個 AI 解決方案,來幫助大家解決各種問題,那麼,無疑是最有效的。 

畢竟,每個人都能找到符合自己需求的解決方案,極大提到了解決問題的效率和質量。 

為什麼是智能體? 

昨天,一個朋友抱怨說,買房後要還貸款,未來幾十年每月都要還幾千塊錢;他讓我幫忙算一算,到目前為止,他一共還了多少本金和利息,如果他想提前還款,根據現在的政策,可以節省多少錢。 

這種復雜的問題我怎麼能解決?于是,我把它給了豆包。 

我先描述基本情況,讓豆包記住,然後,再把其他想法和訴求告訴它。大概幾十輪的對話後,豆包幫我詳細計算了出來,并生成一份大約 600 字的詳細分析報告。 

這份報告包括了完整的背景信息、我的具體訴求、計算過程和對比分析等。 

你用過豆包,或者其他可以和 AI 對話的工具麼?不知道你有沒有發現,現在此類對話工具,連續上下文邏輯能力變強了。 

我再說一個貼身經歷: 

最近幾天,經常接到一些奇怪的電話,涉及内容如貸款、房產購買、京東優惠等。 

這些電話中,上來就問需要、不需要、行或者不行。我發現,對方語氣很像真人,但當我給出它們設定範圍以外的問題時,它無法回答了。 

這說明,智能體已經在不知不覺中融入了日常生活,它們,能夠在特定的環境中模仿人類的互動方式。 

所以,一個完整智能體,能夠充分與環境互動,這包括智能體自身和它所處的環境兩個部分;就像人類在物理世界中的行為一樣,智能體在其 " 外部環境 " 中也能執行任務。 

說白了,我可以與它互動,也能設定好指令,界定範圍,讓它幫我完成目标。 

對比下來,是不是不難看出,智能體無疑是繞過 AI 搜索中幻覺問題、并成功商用的有效方式之一? 

為什麼這麼說? 

你想想看,考慮傳統 AI 搜索和提問時,AI 搜索直接給出答案,這種答案比較扁平化,不具備連貫性。 換言之,你提出一個問題,AI 直接給你一個結論,結論會引用來自多個信息源的數據。就結束了。 

智能體工作方式不同。 

它不僅對單一問題做出反應,還會引入外部信息,在一連串多輪問答中,會反復接受來自你的信号,通過這種互動,它更能理解你的訴求。 

在解決問題之後,它能生成一篇簡短的文章、總結方案,把整個互動過程指标串聯在一起; 很明顯,智能體不是一個簡單的 AI 提問、總結工具,是一個完全符合每個人需求的系統。 

因此,智能體能完美繞過 AI 幻覺,畢竟過程中,你不滿意時,能一次次糾正它的錯誤。

03

縱觀國内市場,目前誰在做智能體呢?我查閱了一下,據說有超過 4500 家,比如:大家耳熟能詳的百度、科大訊飛、雲從科技、字節跳動和騰訊等。

所以,誰在做智能體,這個問題不好解答。與其這樣,不如換種思考方式: 智能體類型有哪些?我們通過類型看各家所在的生态位。 

我盤點結果是: 

智能體(Agent)平台大體上分為兩類: 一類基于知識庫和數據庫的。 就像聊天機器人(Chatbot)這種簡單的平台; 另一類是用來解決更復雜問題的。 這種平台有多工作流編排的能力,比較高級。 

國外 Orkes Conductor、ControlFlow by Team Prefect、和 Flyte 等平台,就是專為復雜工作流和數據處理設計的。 

這些平台主要用戶包括數據科學家、工程師、開發者,他們用平台來建立和優化復雜的工作流程,提高數據處理的效率和自動化水平。 

國内也有類似的平台。像扣子 Coze、百度智能雲的千帆 AgentBuilder、科大訊飛的星火智能體平台,還有騰訊的元氣和阿裡雲的 AgentScope 等。 

他們利用大模型搭建 AI 原生應用工作台,給開發者提供 RAG、Agent、GBI 等應用框架,賦能他們開發出來文生文、對話、文生表等垂直應用,以幫助企業和個人解決問題。 

我根據對象、流程和代碼復雜程度,把它細抽成三類: 

面向公眾和非開發人員

面向開發者的平台

企業級開發平台

第一種,主要偏向低代碼平台,不要你懂太多編程。 

像 GPTs 這樣的工具,提供很标準的操作界面和流程,主要用來做基于知識庫的聊天機器人。給你一個模板,你按步驟填信息就行,不用自己調整太多東西。 

字節跳動的扣子(國内版),就是被設計來幫助人們輕松創建下一代的 AI 聊天機器人。 

第二種平台功能更強大,可以讓開發者用各種 API、第三方庫,還能自己編寫代碼和調整參數,來精細控制智能體的行為。 

Coze 海外版很受歡迎,它的功能全面,支持很多高級操作。像百度、阿裡和亞馬遜也提供這樣的平台,讓開發者可以用各種 AI 模型來做更復雜的應用。 

企業開發平台,專為企業設計,重點是幫助企業自動化他們的工作流程。 

比如: 

實在智能的 TARS-RPA-Agent 和壹沓科技的 " 數字員工團隊 "CubeAgent,它們是用來自動化企業日常操作的。 

還有國外的 Torq 和國内瀾碼科技的 AskXbot 平台,也提供了大模型結合企業知識庫的解決方案,幫助企業自動化處理更多復雜任務。 

三種類型各有千秋,這麼說,是不是更清楚一些?那麼,站在 AI 搜索和智能體中間來看,智能體屬于那種呢?

04 ‍

解答該問題,不妨站在行業結構視角看。我盤了一下,智能體(Agent)行業結構有四層,分别為:基礎工具層、運營平台層、開發工具層,以及服務與培訓平台層。

組件是做智能體必不可少的基礎。 有各種智能模塊、記憶模塊,比如語言模型、數據庫,還有一些安全工具和通信工具,就像蓋房子的磚塊和水泥。 

運營層,包括制作 Agent 組件的廠商和各種運營集成平台。 如 GitHub 這樣的 Agent 框架發布平台,它們提供必要的環境和服務,支持智能體運行。 

開發層相對容易理解了。 

像 Agent 工具集成平台 AgentLego、或提供專屬雲環境及沙盒環境的平台等,它們使開發者能夠構建、測試和部署智能體。 

值得一提的是,像 NexusGPT、Relevance AI 等平台,它們提供數字員工 Agent 的訓練服務,目的幫助企業把智能體整合進現有的工作流程中,或者幫助個人創建能自動完成任務的 AI 團隊,這反而是目前很多企業剛需。 

國内也有類似的公司。例如: 

金柚網的梧桐數字員工、壹沓科技的數字員工平台 1Data Agent,以及實在智能的 RPA Agent。 

這些平台的特點是允許用戶通過聊天,輕松與智能體互動,管理和優化各種業務流程,使智能體理解和執行復雜任務,讓日常更高效。 

不論怎麼說,從短期發展看,智能體要解決兩個問題: 

一,豐富通用工作流和場景工作流,類似于 AI 搜索下的大搜,還要在處理數據訓練、多輪對話的準确性上下功夫。 

二,讓智能體成為知識專家,形成可持續的服務能力。有點像針對特定領網域進行深入挖掘。 

比如,假設我是做消費品營銷的,如果有一個專門的智能體,它學了很多關于社交媒體趨勢、消費者行為的知識,那麼,它就能真正幫到業務。 

當然,智能體在其他行業也在不斷爆發,像遊戲,金融、醫療等,總體上說,基于 LLM 的能力,下一步基礎智能體必将是繞不開的一步。

總結 

讓它光思考,遠遠不夠。 

想實現真正全面 AGI,得把對話模型變成基本智能體,讓它參與到實際使用中去;就像人們常說的,從實踐中來,到實踐中去一樣。 

所以,AI 生成避免不了幻覺,但智能體的輪番互動,可以微調,可以解決具體問題,至少,使用場景下,這是閉環的正向反饋動作。 

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們