今天小編分享的科技經驗:「錢景無限」的Agent,究竟是誰的機會?,歡迎閱讀。
近日,主打企業級 Agent 產品的 AI 創企斑頭雁智能科技收獲了近千萬美元的 A 輪融資。
Agent 有「錢景」在業界已是共識。《產業家》的一組數據顯示,截止 2023 年 11 月,Agent 賽道發生融資事件 13 起,總融資金額約 735 億人民币,公司融資均值為 56.54 億人民币。
而在大洋彼岸,據知名 AI 記者 Matt Schlicht 的統計,至少有 100 個項目在将 Agent 商業化,近 10 萬名開發者正在構建 Agent。
AI 界迅速凝聚共識離不開大佬們的推波助瀾。
從去年 6 月 OpenAI 應用研究主管 Lilian Weng 提出 Agent 是 AI 應用層的發展方向,到 11 月比爾 · 蓋茨在博文中指出 " 誰能主宰個人助理 Agent,那才是大事。因為你将永遠不去搜索網站,不去生產力網站,不去亞馬遜 ",「大模型賦能千行百業」俨然已經更新成「Agent 賦能千行百業」。
近期由 IDC、釘釘聯合發布的《2024 AIGC 應用層十大趨勢》中同樣強調:"AI Agent 是大模型落地業務場景的主流形式 "。
為什麼 Agent 成為了科技圈的新共識?它的價值是什麼?科技弄潮兒又在它身上玩出了什麼花樣?從藍圖到現實,Agent 距離我們的生活還有多遠?
1、Agent,為何成了 AI 界的新頂流?
将大模型應用于生產和生活的過程中,許多人都會碰到的一個問題是,不知道如何與這顆矽基大腦溝通。
對此,市面上甚至出現了許多教人使用大模型的課程。這些課程的重點,往往都圍繞着那些咒語般繁瑣的提示詞展開。
而 Agent 與大模型及其衍生產品相比,最突出的特點就在于,它不需要用戶輸入精準的提示詞(Prompt)。
放在和大模型互動當中,Agent 相當于替用戶給出了一系列精準的提示詞。從用戶的視角出發,Agent 和大模型在體感上的差别在于,Agent 是掌握了一整套工作、思維方式,能主動完成信息抓取、分析和實操的老員工,而大模型只是需要人為反復強調細節信息的新人。
将視角從用戶切換到企業身上。
卷了近一年大模型研發後,業界普遍認識到兩點。一是價格高昂的通用大模型在各行業中所能起到的助力有限。二是通用大模型很難打出差異,眼下各大廠商的產品在功能上都差不多。
因此,為了吸引用戶,尤其是更加務實的企業用戶為 AI 買單,必須把高成本、高門檻、泛用的大模型向小型、專業、便捷的方向發展。
用更通俗的話來說就是,大模型企業必須打造出一款便宜、上手門檻低,且能凸顯出自身差異的產品級 AI 應用,才能在市場競争中生存下來。
而 Agent 正是這輪商業邏輯轉向的抓手。
與通用大模型的大力出奇迹不同,想要打造出「小而美」的 Agent,背後的企業必須在研發之初就決定好應用的場景和領網域。往往只有對某個行業足夠了解,才能覺察到其中的痛點環節。
譬如,近期發布 AI Agent 平台 AskXBOT 的瀾碼科技,為企業提供文檔檢索、AI 調用、數據查詢、智能編程等基礎能力。這個平台的亮點在于它将各種模型能力都集成、封裝到了一款工作流設計器中,支持用戶使用「拖拉拽」的方式操作,定制 AI 工作流。
在「工作流」上下功夫的靈感來源于周健此前在 PRA(機器流程自動化)廠商弘玑 Cyclone 擔任 CTO 的經驗。
RPA 已經初步證明了用「拖拉拽」組件構建自動化辦公流程的市場需求,但周健發現,RPA 的實操過程中,由于員工缺少專家的經驗,人和系統之前仍然存在操作的真空,比如業務流程到底是怎樣的——這塊知識的「空隙」仍需要人力去填充。
AI Agent 的出現恰好可以彌合空隙。通過一個個 AI 工作流的建立,Agent 既可獲得對業務的理解能力,同時可以可自主執行任務,還能随着企業知識庫的不斷更新同步迭代。
某種程度上,「Knowhow、技術并重」是做好 Agent 的前提,開頭提到的斑頭雁智能科技的創始人張毅身上也能看到類似的特質。
張毅是原釘釘副總裁,任職期間,他曾用 8 年時間帶領團隊陸續打造出釘釘考勤、審批、智能人事、日志、健康打卡等產品。此外,他還在阿裡無線技術委員會、ToB 產品委員會擔任委員。
Agent 之所以成為創業者新的淘金地,也很好理解。一方面,在「大煉模型」階段,AI 創企由于在算力和技術上處于劣勢,往往很難和 BAT 這樣的大廠進行競争。另一方面,進入到 Agent 階段之後,研發者對行業的理解以及專業數據庫扮演起了更重要的角色,這恰恰是他們的優勢所在。
2、Agent 組團出道,還是單飛?
Agent 的落地形式有兩種,一種是單體 Agent,一種是群體 Agent。
單體 Agent 的特點是以組件的形式嵌入傳統產業鏈當中去,針對顆粒度非常細的場景做優化。
比如高瓴創投投資的語音轉錄平台 Airgram,推出了銷售場景下的會議 Agent;成立于 2021 年的魔音智能的 Agent,聚焦在私網域運營和客服場景。而百度、滴滴、藍凌等大中型廠商,則針對企業的費控、數據分析、溝通等具體工作環節,分别推出了 Agent 方案。
這種做法的優點在于嵌入性、穩定性強,不會給企業運行帶來太多的動蕩。
對大型企業來說,除了要考慮未來的發展趨勢,維持當下的運行穩定同樣重要。因此,技術提供商給出的解決方案必須是開箱即用,能夠被快速整合到原先的運行體系中的產品。
這種方式也是業内的主流意見之一,360 創始人周鴻祎就曾在公開場合中表達過,AI 產品與傳統產業結合的路徑應該是最初以松耦合的方式嵌入業務鏈條,然後再随着企業的智能化發展不斷向其他環節蔓延。
然而,并不是所有業務都可以被切抽成孤立環節的,在這些業務中,直接打造一條 Agent 作業鏈會是更直接有效的解決方式,群體 Agent 也因此應運而生。
譬如,清華大學計算機科學與技術系副教授劉知遠成立的面壁智能,就把軟體開發平台 ChatDev 做成了一家只有 Agent 員工的軟體開發公司。CEO Agent 負責接收用戶需求後,并把開發和交付任務分配給 CTO、開發經理、產品經理、測試專員等 Agent 角色。
ChatDev 平台本身也是一個群體 Agent 的經典案例。
雖然從形式上看,ChatDev 只是一家開發 AI 聊天機器人的公司,但這些聊天機器人可以扮演各種專業角色并相互讨論,直至給出一份完整的解決方案,包括源代碼、環境依賴和用戶手冊等等。
與單體 Agent 相比,群體 Agent 有望幫助企業迅速從無到有搭建起新的業務部門或直接兜售解決方案,并且,他們似乎具有一定的創造力。
火遍全球的群體 Agent 項目「斯坦福小鎮」就是一個典型案例。創作者在沙盒世界中放置了 25 個 Agent,他們有自己的初始設定,彼此用自然語言對話。結果這些 Agent 之間的互動出現了人類意料之外的變化:Agent 們自己創辦了派對,并且它們的人際關系變得更加復雜了。
就目前而言,除了少數幾家公司實驗性地推出了群體 Agent,大多數企業的選擇都是從單體 Agent 出發。
對小企業而言,單體 Agent 路線的技術、算力門檻更低,從研發到形成商業閉環的速度更快。
但另一方面,單體 Agent 的競争力高度依賴研發者對行業的理解以及背後的數據支撐,如果專業程度不夠深,沒有用戶買單繼而形成數據飛輪,就很容易成為大象腳邊的螞蟻。
去年 11 月 GPT Builder 在 OpenAI 的首次開發者大會上亮相後,許多 Agent 創企陷入了深度焦慮。究其原因就是很多企業只是套殼了 Agent 概念,沒有真正找到落地場景。
對大公司來說,由于旗下場景、算力、技術儲備都足夠豐富,在「All in AI」理念的推動下,已經在全流程推動 AI 替代或研發,單體 Agent 或群體 Agent 的路線選擇對它們來說并不重要。
有百度内部人士對「矽基研究室」透露,從 2023 年年初開始,李彥宏就已經要求内部養成 AI 思維,工作時保持思考能否将原先的業務用 AI 來做。
另一方面,群體 Agent 本身就是單體 Agent 的組合,雖然涉及到各業務串聯等問題,但在場景有限 Agent 開發邏輯中,完全可以謀定而後動。
3、如何打造具備生產力的 Agent?
在介紹 Agent 時,許多人都會用《鋼鐵俠》裡的賈維斯舉例子,電影裡最能體現 Agent 超越傳統意義上工具一幕,是史塔克每次去冒險之前,賈維斯都會詢問他要不要給波茲(史塔克的妻子)打個電話。
而在現實生活中,我們接觸到 Agent 最多的場景,可能是電話那頭的 AI 客服。從這個角度來說,藍圖和現實的距離就是我在電話這頭,你在電話那頭。
之所以會有這樣的落差也不難理解。最直觀的原因就是,大模型的復雜推理能力不夠強、延遲過高等問題抑制了 Agent 應用的真正成熟,這也是接下來業界工程優化和技術科研突破的方向。
但對大多數企業來說,更務實的着眼處是如何在現有的技術條件下,打造出真正能發揮生產力的 Agent。
辦公協同軟體幾乎是國内 Agent 生長最肥沃的一片土壤,從 WPS 到釘釘、飛書、企微,都上線了相應的 AI 應用。究其原因,這些平台本身就具備良好的 API 接口和插件體系,這使得将大模型集成到現有工具中變得更加容易。
換而言之,在辦公協同領網域,那些 Knowhow 已經被整理成了符合大家工作習慣的工具鏈,這條鏈條上錘子、扳手、等工具都準備好了。并且,這個行業本身的數據規模就頗可觀,這是訓練出高質量輸出的 Agent 的基礎。
文首提到的張毅在介紹斑頭雁拳頭產品 BetterYeah AI 時也強調了類似的邏輯。
BetterYeah AI 的一大優勢就是擁有整套自研 RPA 等超級自動化工具集,及 Web Builder 低代碼平台,可為 Agent 提供手和腳,在更多場景裡使用,并大幅降低開發成本。
常被業内人士提及的另一個關鍵詞是調用 Agent 的成本。
雖然與大模型相比,Agent 更貼近產業,也能讓客戶的每筆錢都花得更值,但不論是對客戶還是對開發商,Agent 帶來的收益是否邁過了成本的門檻仍是未知數。
一個具體的例子是,斯坦福和谷歌聯合研究的 Agent 世界「西部世界小鎮」裡,每個 Agent 的成本是 20 美元 / 時,比大多數人的時薪都要高。
算力是成本構成的大頭,但并非所有企業都有能力深入到算法環節進行優化,因此在交付環節下苦功可能會是更優選。譬如,可以提供一站式 AI 開發平台,或提供封裝好的 Agent,幫助企業或部門以極低成本快速應用。
科大訊飛在推廣校園 AI 應用時就曾展示過對應開發平台,教師只需要通過自然語言輸入需求,平台便可自動生成應用。
最後,也是對買家影響最大的因素,是 Agent 的安全性和隐私性。
Agent 商業化的基礎在于捕捉到了用戶的痛點環節,這也意味着這些環節往往能接觸到企業關鍵數據或信息。一旦 Agent 被攻擊,導致短暫停工或信息洩漏,就有可能造成用戶和社會蒙受巨大損失。
眼下 GPT Builer 面臨的一個問題就是,開發者發現第三者可以通過與 GPT Builer 的對話套出 Agent 的 Prompt 和上傳數據,知識產權無法得到有效保障。
立足當下,Agent 無疑是傳統企業的又一次機會,得以繞過算力和技術的壁壘憑借經驗再下一城。但同時也應該清晰地認識到,經驗有時候也會成為束縛,仍需要對行業範式的改變保持警惕。
畢竟馬車夫再怎麼鑽研給技術,也不可能跑得過汽車。