今天小編分享的科技經驗:Agentic AI正在重啓入口之争,歡迎閲讀。
文 | 窄播,作者 | 李威
喬布斯在 2010 年給 Siri 描繪的藍圖,正在成為很多 AI 助手對自己的期待。
在 Siri 聯合創始人 Norman Winarsky 的回憶中,喬布斯在 2010 年就已經意識到擁有一位可以像真人一樣進行真情互動的私人助理能夠帶來什麼樣的獨特價值。這樣的助理将不僅能聊天,有足夠的理解能力,還具有幫助用户執行任務的能力。
十四年後,一切并沒有變化。大家依然在期待出現一個「真正了解自己的,可以為自己做很多事情,并執行跨任務和跨領網域命令」的強悍助手。已經曝出的消息顯示,OpenAI 明年 1 月可能會發布的 AI 助手產品,依然在致力于實現自動發送工作郵件、制定旅行計劃。
大模型的突破,被認為正在縮短實現這種期待的進程。OpenAI 的高管會在不同場合強調 AI Agent 将會成為下一個巨大突破。美國銀行在 11 月初的一份研報中指出,相比 ChatGPT 和 Copilot,具備更強自主規劃和行動能力的 Agentic AI 正在帶來一個超級創新周期。
成為距離用户最近、連接用户最廣泛、能促成更多 Agent 協作的那個 AI 助手,是這個創新周期内已經被大家意識到的一個平台級機會。
一方面,在大模型的支持下,基于自然語言的互動有望替代更多圖形界面互動,任何場景都有被新的互動形式重構的可能性。另一方面,互動方式的變化很可能會打破既有的軟體、硬體領網域平衡,并在塑造新格局的過程中,可能會迎來既得利益者的衰落與後來者的崛起。
當下的競争還處在早期。從參與者來看,鋭意進取的大模型創業公司,掌握着主要平台的互聯網巨頭,從互聯網巨頭夾縫中生存下來的中型公司,以及觊觎軟體利益的硬體企業,都在試圖抓住這個機會。從競争層級上看,通用 AI 助手、垂直領網域 AI 助手、工具型 AI 助手中都有人在進行探索。
最終,誰在大模型技術、Agent 生态、用户獲取效率以及商業鏈路創新等層面積累更多優勢,誰就更有可能吃到新的入口紅利,在新的食物鏈中占據更重要的位置。
從 GenAI 到 Agentic AI
美國銀行在研報中将 AI 的發展劃抽成三波浪潮:前 GenAI、GenAI 和 Agentic AI。其中,前 GenAI 的時間是從 1940 年到 2022 年 11 月 ChatGpt 發布。在這個漫長的時間裏,盡管也曾出現過 Siri、Alexa、小愛、天貓精靈等語音助手,但 AI 的效用更多還是發揮在幫助不同場景實現數據驅動的趨勢洞察和決策上。
在截至 2024 年 10 月的 GenAI 階段裏,基于 GenAI 的應用主要集中在兩個方面:一個是實現更自然的人機交流,最早的 ChatGPT、智能體、C.AI 等都通過流暢的交流赢得了用户認可;另一個是幫助個人提升生產、生活效率,AI 搜索、視頻生成、代碼生成、PPT 生成、論文總結等應用都屬于這一類。
Salesforce AI Research 執行副總裁兼首席科學家 Silvio Savarese 認為,Agentic AI 階段「在正轉向使用人工智能來自動化整個任務并代表我們采取行動」,與以前的人工智能相比是一場重大的能力飛躍。Gartner 預測,到 2028 年,至少會有 15% 的日常工作決策将由 Agentic AI 自主做出。
雖然在 2024 年,這個比例還是 0,但是我們已經能看到一些向着這個方向進行的努力。
首先,大模型開始更加強調上下文的記憶能力,這是形成自主決策的前提條件。Google 的 AI 助手 Gemini 已經能夠記住 Google One AI Premium 計劃訂閲用户的生活信息、工作内容和個人偏好。
其次,技術上的突破正在讓大模型獲得多模态能力和操作 APP 的能力,AI 助手的能力邊界不斷得到擴充。多模态的大模型能力支持下,AI 助手能夠獲得聽讀看等多種感知,實現更加自然的互動。理想狀态下,通過語音和視頻可以實現所見即所得的信息搜索和獲取。
智譜推出的 AutoGLM 和 Anthropic 推出的 computer use 在前段時間分别展示了在手機和電腦上實現 AI 助手操作 APP 的能力。同時,手機廠商也在發布會上圍繞外賣點單、預定餐廳等動作,展示了自己的 AI 能力。我們也需要承認,這些嘗試都在初期階段,離真正的大規模應用還比較遠。
最後,不少企業已經開始依托 AI 助手搭建自己的第三方 AI 應用生态,或者説是第三方 AI 智能體生态。微軟推出了全新的 AI 應用平台 Azure AI Foundry,旨在幫助組織設計、定制和維護管理 AI 應用和 AI 助手。百度推出了新的無代碼 AI 應用搭建工具秒哒,并宣布要支援創建數百萬個 " 超級有用 " 的應用程式。
在一位蘋果的前員工看來,沒有盡快拓展第三方生态系統,是 Siri 後繼乏力的原因之一。在 AI 助手的語境下,第三方應用生态本質上就是能夠被 AI 助手調用的人才庫,通過理解用户的需求、意圖,喚出人才庫中的相應人才,實現需求的滿足。當然,這些人才會包括其它的 AI 助手,也包括功能性更強的 AI 化功能。
誰在觊觎話事人之位
當下 AI 助手的競争很像杜琪峰電影裏呈現的社團話事人選舉。話事人意味着話語權,話語權往往會與利益的分配權挂鈎。因此,上一屆的話事人,也就是當下的互聯網平台們,不願交出手中的龍頭棍;新被提名者,也就是大模型創業公司,想要進入權力中心;社團元老,也就是硬體廠商,想要平衡各方利益;作為精鋭小弟的工具型產品,也需要選擇押寶哪一方。
現在看,這次多方博弈的序幕才剛完成了人物出場介紹。大模型創業企業作為下一屆的被提名者,是最積極的一方。無論是國内的 AI 六小龍,還是海外的 OpenAI、Anthropic,幾乎每一家大模型創業企業都依托對話能力推出了自己的 AI 助手產品,并不斷為其增加内容生成能力和智能體連接能力。
一些有着先發優勢和更高關注度的明星企業、明星產品,在光環和資本雙加持下,實現了更快增長。10 月的數據顯示,ChatGPT、Kimi 兩款大模型創業企業推出的 AI 助手產品,在全球蘋果端 AI App 下載榜單中占據了第一和第三位。但随着資源從大模型向應用傾斜,一些大模型企業的 AI 助手很可能會出現後繼乏力的情況。
作為上屆的話事人,阿裏、百度、騰訊、字節等手握互聯網平台的大廠也沒有放棄競逐下一屆話事人的機會。阿裏的通義、支付寶的支小寶、百度的文小言、騰訊的元寶、字節的豆包,都已經搭起了 AI 助手的框架,并且相較于積累不深的創業企業,這些巨頭平台在用户、數據、場景、資源上都有更深厚的積累。
依托現有的優勢,這些產品的步伐會更輕松從容。在量子位智庫統計的統計中,截至今年 10 月,豆包的歷史累計下載量已經破億,與第二名 Kimi 的 5700 萬遠遠拉開了距離。手握更多平台場景和雲服務企業的阿裏和騰訊,在 AI 助手的競争上則會有更強的系統性優勢。
硬體廠商在軟硬體泾渭分明的移動互聯網階段并沒有吃到移動應用大爆發的紅利。從購物到支付,從視頻到音樂,硬體廠商都有過自己的布局,小米甚至還推出過有品這樣頗有聲量的電商應用。但是,直到目前為止,硬體廠商都沒有擺脱自己管道化的定位,其互聯網服務更多還只是廣告收入。
AI 助手為硬體廠商提供了一個能将用户習慣、數據積累、螢幕識别、應用操作融為一爐的機會。相比于軟體產品,硬體能夠為用户提供調用 AI 助手的更短路徑。微軟在鍵盤上添加的 Copilot 鍵、iPhone16 的相機控制按鈕都是喚起 AI 助手的途徑。同時,硬體廠商還更有能力實現端雲混合 AI,實現數據安全與用户隐私的保護。
工具型產品圍繞 AI 助手有兩種路徑選擇。一種是像釘釘、知乎、誇克和美圖一樣,從自身的能力積累出發,推出面向垂直場景的 AI 助手,以自然語言互動和自動化執行更新自己的用户體驗,力求延續、甚至擴張自己在移動互聯網時代相對獨立的地盤。另一種則像什麼值得買一樣,一開始就将自己的内容積極融入到其它 AI 助手中。
龍頭棍背後的幾個支柱
最終決定誰将成為話事人的,是龍頭棍的歸屬。某種意義上,不是龍頭棍選擇了誰,而是誰更有能力拿起龍頭棍。這裏的能力是各個幫派大哥綜合實力的體現。回到 AI 助手的話事人争奪中,這種綜合實力會涵蓋模型能力、業務場景、用户獲取、軟硬體整合等方面。
第一,基礎模型的能力進步依然很重要。無論是對用户意圖的精準理解,還是對應用、其他 Agent 的更靈活調用,都還是需要依托基礎模型能力的提升來實現。
特别是各家給出的對圖形互動的替代方案,都需要依托模型能力實現對螢幕和視窗的理解與操控。有媒體報道稱,谷歌的 Project Jarvis 項目,就是要開發一個新的模型,将其運行于 Gemini 模型之上,在浏覽器内實現截圖解釋、點擊按鈕和輸入文本。
第二,助手能夠鏈接的能力的豐富度會決定入口的層級高度。AI 助手不會出現一家獨大的情況,更底層的 AI 助手會有更多分發權。足夠豐富的 Agent 生态意味着足夠的能力供給,能夠将眾多能力整合在自己的生态内,也意味着自己會成為更底層的 AI 助手。
可以看到,與原生的 AI 助手一樣,具備平台能力的產品都在 AI 化的同時,在嘗試提供更便利的工具,讓其接入更多 Agnet 能力。大的諸如前文提到的微軟、百度,以及字節的扣子,都是在用工具孵化生态,将更多開發者的成果注入到自己的 AI 助手上。另一方面,Slack、釘釘,也在向開發者開放垂直場景,豐富自己的能力儲備。
第三,硬體與助手會是一體兩面,軟硬產廠商需要找到助手時代的相處之道。在榮耀 CEO 趙明看來,新一代的 AI OS,如何理解、如何服務消費者、如何在螢幕内操作和跨系統操作,以及如何與雲端的 AI 智能體的協同,都是全新的課題,給大家提供了一個換賽道超車的機會。
不僅是榮耀,小米、vivo、OPPO 應該都想要抓住這個重構 AI OS 的機會,在蘋果和 Google 手中拿到更多系統層的話語權,同時在與互聯網平台的相處中占據更多主動。同樣的,推出 AI 耳機的字節、推出 AI 眼鏡的百度,未嘗不想在實現自己的軟硬一體,端雲融合。也因此,找到一個能同時滿足軟硬體利益訴求的 AI 助手商業鏈路會變得至關重要。
第四,在模型能力、產品體驗、生态成熟度相差不大的情況下,助手之争還是流量之争,成為 AI 助手話事人的前提是以更低成本掌控更多流量。在這方面,硬體廠商和互聯網平台有着天然的優勢。豆包能夠遠超 Kimi,META AI 用户數能夠超過 5 億,都離不開低成本流量的支持。
相對的,新勢力的投流買量壓力會越來越大。App Growing 數據顯示,Kimi 在 10 月投放量飙升,20 天投出 1.1 億元,接近其整個第三季度的總和。同一時間段内,豆包投出了 1500 萬,騰訊元寶在廣點通投了 3000 萬。整個第三季度,Kimi 投出了 1.5 億,豆包則投出了 2 億。
德勤在一份報告中指出,對比兩輪信息革命更新,應用價值實現與基礎技術的更新密不可分:圍繞數據資源的基礎設施更新有效推動應用場景的拓展和功能體驗的創新,最終引發新生态的構建,生成了用户入口的超級應用;AI 時代用户的注意力争奪成為應用發展的重中之重,未來将誕生新的用户入口。
AI 助手之争,最終依然是入口之争,分發權之争。只不過,這一次的勝利者,依靠互動、決策與執行的更新,有更大的可能實現 C 端與 B 端的通吃。