今天小編分享的科技經驗:AI“縫”搜索,歡迎閱讀。
大廠要出 " 框 ",小廠要入 " 框 "
下半年,搜索領網域變得熱鬧起來。
8 月 27 日,誇克發布全新 PC 端,整合 AI 搜索、AI 寫作、AI PPT、AI 檔案總結等功能。差不多同一時間,字節繼頭條搜索、悟空搜索、閃電搜索之後,在移動市場上線 " 抖音搜索 "App,第四次把腳踏入了搜索的 " 河 "。9 月 4 日,百度推出新搜索 " 文小言 ",融合一系列能力後,提供 " 搜創聊 " 的體驗。
三家動作各不相同,誇克希望補全在 PC 端的能力,趕上 AIPC 風口;字節則希望完善搜推一體化,鞏固自身内容生态;百度則希望讓文小言成為探索搜索 4.0 時代的 " 先鋒 ",提前卡位。如果把視線放到整個搜索領網域,抖音、視頻号在搜索框新增電商入口,這門古早的生意,又變得熱鬧起來。
百度副總裁、AI 創新業務負責人薛蘇認為,傳統搜索與 AI 搜索有三個不同。一個是支撐技術上,AI 搜索的底層是生成式大模型;其次是場景與需求差異,傳統搜索用排序方式解決需求,而 AI 搜索則是用生成式方法;再次是在產品理念與定位上,存在工具性與人性的差異。
實際上,目前領跑 "AI 搜索 " 的大廠們,對于技術本身要保守得多。由于 RAG 與搜索的親緣性,主導着當下國内 AI 應用開發。然而,OpenAI 最近發布的新系列模型,為行業提供了新的參考:o1 兩個版本專注在推理上,不再通過 prompt 完成 CoT(思維鏈),而是使用強化學習,執行鏈式思考。
即便學術界已在今年開始讨論 RAT(RAG+CoT)的可行性,但國内巨頭似乎還未将重心放在這裡,反而更具現實主義地押注生态。相較而言,初創公司所面對的挑戰要艱難得多,沒有巨頭那麼多花式各樣的 " 縫補布料 "(生态),有且只有一身蠻力。
移動時代的老巨頭們依托于生态優勢,試圖打通端與端、應用與應用、内容形式的隔閡——試圖擺脫搜索框的束縛,從而在下個時代來臨前,為通用搜索上豎起 " 盾 "。而 Kimi、智譜、MiniMax,則長袖善舞,想要找到更垂直的領網域,完成數據的輸入與輸出,比如想盡辦法附着在搜索框中。
眼下,搜索框成了錢鍾書的 " 圍城 ",有人想打破,有人卻在死命朝裡鑽。
構建、補全、重塑
分類目錄、文本檢索、整合分析、用戶中心、生活生态圈,被歸類為搜索的五個發展階段。
五個發展階段的确存在代際之分,但不是今是昨非。分類目錄仍然在各應用中普遍存在,文本檢索依然是愛如生古籍庫這些文史類專用數據庫中最基礎的搜索形态,當下主流搜索市場仍以整合分析為主,至于用戶中心與生活生态圈,還有待 AI 技術與端側成熟。
去年以來,百度、阿裡(誇克)、字節、360 等傳統搜索引擎廠商都推出了各自号稱 "AI 搜索 " 的產品,實際上都只是完成了搜索 AI 化改造中的部分環節,包括結果上的智能化排序、推薦、關鍵詞解析等。
無論字節完善搜推一體化,還是誇克補全 PC 端,抑或是百度推出 " 新搜索 ",都表明巨頭們視搜索為打開商業生态的一把 " 鑰匙 "。這便是字節始終不願放棄搜索的核心原因,也恰好證明搜索本身在 AI 時代的重要戰略價值。畢竟,學習和搜索是唯二的能夠無限 scaling 計算能力,簡單來說,因為豆包與内容生态的存在,字節不缺學習,缺的只有搜索。
而在搜索的 AI 化改造過程中,通用搜索至少面臨着兩重挑戰,第一個來自端側。
日前國内一家半導體公司表示,作為新業務板塊,今年 AI 芯片市場的需求井噴,且大客戶集中在國内互聯網巨頭。而 Canalys 日前發布的數據顯示,處于中遊的聯想,其 AIPC 第二季度出貨量環比增長 228%。PC 端之所以率先起量的核心原因,是辦公智能化推動。因此,誇克 8 月末更新後,完成了移動端與 PC 端的布局,并上線了多種面向辦公場景的功能,初步坐上了牌桌。
互聯網公司推出适配端的產品,并不意味着 AI 搜索往後是一片坦途,在端的調用權限仍然在硬體廠商手中。早前,蘋果在 Apple Intelligence 的發布會上,展現了一家硬體廠商如何通過端側内置全系統調用工具,提供新的用戶體驗,甚至連第三方應用也得配合,顯示出封閉生态下的硬體廠商,會更有主導權。
第二重考驗是打破以移動 App 為首的信息孤島,解決内容、場景、知識垂類間的隔閡。
阿裡與騰訊在幾個月時間内,先後打通了信息流(微信廣告跳轉淘寶天貓)與資金流(淘天接入微信支付),巨頭間正在拆除藩籬。這一背景,對于通用 AI 搜索而言是一大利好。
百度在 " 文小言 " 的發布會上呈現了多種類搜索的探索,包括對話框式的傳統搜索、互動式的 AI 助手、自主專題訂閱,以及涉及到圖文視頻等媒介下的搜索等。傳統訂閱機制以 App、内容平台為核心,例如微信公眾号訂閱。而文小言的 " 自由訂閱 " 則呈現了 " 需求導向 " 的特點,例如按照關鍵詞訂閱,從而可以跨 App 與内容平台。
盡管 " 文小言 " 算得上是目前通用 AI 搜索最大膽的嘗試,但從内容、產品、場景等層面來看仍有諸多挑戰。
内容上,百度既有生态占比權重非常高,其他巨頭的内容權重占比很低。產品方面,經歷移動時代規訓的用戶,能否适應各種 AI 原生的互動形式,還有待觀察。前文提到的 " 自由訂閱 " 并沒有在文小言界面中呈現,而是需要在與 AI 助手對話中才能實現。
追逐、聚合、突圍
"AI 時代的超級應用,大概率會是一個 AI 助理 "。誠如月暗楊植麟在最近的采訪中所言,比起随時會被超越的大模型,現階段資本和 AI 巨頭更願意把賭注壓在看得見產品和增長的 AI 助手上。
OpenAI 是指引的燈塔,AI 助手成為了各家 " 秀肌肉 " 的視窗,從 Sora 到 GPT-4o,凡是被 OpenAI" 鴿掉 " 的功能都被聚合在了國内的 AI 助手中。于是,在一個看似平平無奇的 App 中,同時可以驗收大模型訓練、推理、長文本、多模态、Agent 等多項技術成果。
智譜把對話、AI 生圖、AI 生視頻、AI 視頻通話等統統打包進了智譜清言中,Minimax 同樣把對話、語音、AI 生圖、AI 生視頻、AI 生音樂等功能内嵌入海螺 AI 當中。
追逐最前沿的技術,以此與傳統的大廠作出區隔,成為了 AI 頭部創業公司的選擇。畢竟 OpenAI 式的叙事極具誘惑,據媒體報道,OpenAI 正在洽談新一輪融資,其估值達到了 1500 億美元,對比中國大模型公司目前 30 億美元的最高估值,差距相當于 50 個智譜和月暗。
大廠高調談 AI 搜索,而 AI 公司卻緘默不語,只是在其應用内部悄悄上線 " 聯網 " 或 "AI 搜索 " 相關功能。一方面,國内的 AI 公司将 AGI 奉為圭臬,不願意被貼上 "AI 搜索 " 的标籤,像 "Perplexity" 一樣把路走窄;另一方面,也暴露出其被互聯網巨頭圍剿的困境。
阿裡、百度、騰訊之長,恰恰是 AI 公司之劣勢。内容、產品、場景、生态,大廠均已提前鎖定,反觀 AI 公司產品尚未成熟就被迫推向市場,宛如一個個 " 打黑工 " 的童工。智譜、月暗、Minimax 等聲稱的 " 聯網 " 與 "AI 搜索 " 本質上還是在 " 爬數據 ",只不過内化為生成問答的步驟之一。上述的 " 爬 " 繞不過互聯網大廠的生态藩籬,這意味着如果某廠拒絕向 AI 公司開放鏈接,那就有一定概率影響最後回答質量。
這過程中還存在一個問題,即缺乏場景支撐的搜索問答更加容易出現幻覺和泛化問題。假設将 AI 搜索和問答鎖定在電商領網域,就會自然劃分出種草、交易、售後易等幾個細分場景,無論是 AI 搜索還是數據反饋都能更加精準對應,如此迭代下來,遠比毫無目的的搜索對話效果更強。當用戶打開 Kimi、海螺 AI 時,他們是茫然的,大部分人可能還得思考幾秒提什麼問題,但打開淘寶,用戶的搜索是相對明确的。
為此,市面的 AI 助手都不約而同地弱化了 " 搜索 " 的标籤。為了能建立集中獲取數據反饋的渠道,在互聯網大廠的地盤上,這些 AI 公司也只能低頭,雙手奉上投流 " 過路費 "。為了解決問答不夠垂和專,彌補場景缺陷,AI 公司也在嘗試通過專家數據标注和用戶數據分類收集、處理等方式來解決。
每一次新技術更新和產品推出都能引發圈内的一次狂歡,帷幕落下,尚未有明确的數據證明帶來了直接的用戶或商業轉化。靠資本去治療 AI 公司的先天體弱,到底還能支撐多久?
CoT 再次定義 AI 搜索
時至今日,國内市場對 AI 助手的期待經歷了 "Copilot 輔助 "" 效率工具 " 再到 "Super App" 的轉變,其所承載的意義早已超過了本身。
從上文的描述中不難發現,圍繞着 AI 助手和 AI 搜索,互聯網大廠的思路是跳出 " 框 ",進而去補足和強化生态體系;AI 公司則在入 " 框 ",把對話框視為與用戶互動和反饋最有價值的渠道。
到現在,AI 搜索在技術方面已經沒有壁壘,模型推理能力的不足靠 RAG 縫縫補補,大廠和 AI 公司也能交出一份差強人意的答卷。對未來 AI 搜索發展可能會涉及幾個方面:跨端、跨場景、跨數據、主動适應、自然語言喚起、多輪對話以及多步推理。
近期,OpenAI 發布 o1,将此前普遍運用于 Agent 訓練的 CoT 技術自動化,實現模型的自我理解和進化,标志着大模型推理能力邁上新台階。
從 RAG 到 CoT,也将開啟了 AI 搜索的新時代。CoT 的本質是将復雜問題切分為若幹個簡單執行任務,重推理而弱化了搜索色彩,最後導向的方向是既垂直又精專。
OpenAI 已經落子,國内大概率要 follow。CoT 就像給 AI 搜索再次開啟了 " 加速器 ",會進一步明晰化大廠與 AI 公司的分野。
對強技術而弱搜索生态的 AI 公司不失為一個好消息,從整體上提升模型推理能力,搜索和強化學習機制内化,不過多地展示過程和呈現參考資料,直接解決問題。畢竟,AI 助手内的參考資料引用明為 " 提高準确率 ",實則是給推理能力不足的大模型 " 開外挂 "。
互聯網大廠的落地在垂直場景中,"CoT 自動化 +Agent" 也許是下一個 " 黃金拍檔 ",先理解、推理與制定計劃,再由 Agent 執行。在娛樂、電商、社交等場景,既能簡化跳轉步驟,減少流程,還能直接替代用戶上手操作。
短期内,AI 搜索的產品形式不會有太大變化,但是速度和效果将會提升一個 level,唯一需要考慮的因素是推理成本。
AI 搜索是否需要以一個獨立的產品存在值得商榷,畢竟國内已經有無數多的場景和產品可以嵌入。包括新生代的 AI 助手,如何與舊業務和產品融合打通,怎麼在新場景中發揮其功能,可能才是眾多玩家關注的重點。
本文來自微信公眾号 "guangzi0088"(ID:TMTweb),作者:郝鑫 吳先之。