今天小編分享的科技經驗:大模型落地,搜索先成卷王,歡迎閱讀。
文 | 戴菁
大模型重新诠釋了「中國速度」。自從今年 3 月百度發布國内首個類 GPT 產品以來,短短 3 個月時間,國内已經跑出 79 個 10 億參數規模以上的大模型。
《中國人工智能大模型地圖研究報告》還提供了另外一個觀察視角:美國和中國發布的通用大模型總數已占全球發布量的 80%。很明顯,中美兩國的科技企業正在成為這輪席卷全球的生成式 AI 革命的主要推手。
Open AI 和微軟構成的聯合陣營,已經在教育、投行、辦公領網域打造出多個标杆級的應用落地場景,如堪稱王炸的 Office 全家桶、語言學習平台 Duolingo 的 AI 陪練、摩根士丹利的數十萬頁知識庫,以及支付服務平台 Stripe 用于打擊欺詐的最新解決方案。這些落地案例同時涵蓋了 B 端和 C 端。相較之下,國内大模型的上線速度之争剛剛告一段落,大規模商業應用落地還在路上。
這段路極具挑戰,但至關重要。百度 CEO 李彥宏最近在一次會議上強調,「新的國際競争戰略關鍵點不是一個國家有多少個大模型,而是你的大模型上有多少原生的 AI 應用,這些應用在多大程度上提升了生產效率。」
公開信息顯示,跑在最前面的文心一言,目前已經推出 11 個行業大模型,覆蓋汽車、能源電力等多個 to B 領網域。
此時誰能打響大模型 to C 應用第一槍,成為備受關注的一個焦點。注意,是商業應用上的打「響」,而不是 PPT 層面的「打出」。
圖源:《中國人工智能大模型地圖研究報告》
站在 C 端用戶視角,《降噪 NoNoise》認為,教育和搜索兩個領網域都有機會:教育無需贅言,從那些 AI 學習機等終端硬體的熱賣不難看出,要說大模型的剛需付費群體,還得是家長;至于搜索,擁有 GPT 的新 Bing 可以讓微軟 CEO 納德拉驕傲地說出——是微軟讓谷歌「跳舞」,可見大模型為搜索帶來的想象空間有多大,而且搜索本身就是世界上規模最大的 AI 應用場景。
同時看到這一前景的百度也在不舍晝夜地「煉丹」。通過密集推出「AI 夥伴」等生成式 AI 產品,百度希望加快将搜索帶入新時代,并繼續保持市場引領者的地位。
問題來了,搜索會打響大模型大規模應用的第一槍嗎?
01
搜索框背後的幾個真相
在回答這個問題之前,我們需要先界定搜索與大模型的關系本質。
ChatGPT 橫空出世後,一種聲音認為谷歌、百度等搜索巨頭都将被颠覆,Open AI 會成為搜索遊戲規則的改變者。
最負盛名的代表人物是微軟聯合創始人比爾 · 蓋茨。他在年初預言,未來的頂級 AI 公司會在 AI 個人助理上發力,用戶永遠不會再去搜索網站和亞馬遜。盡管在 2019 年 9 月之前,蓋茨對 Open AI 的技術能力一直存疑,還被馬斯克怼過「對 AI 的理解十分有限」。
置身事内的搜索巨頭們顯然持有不同看法。「我覺得應該會加強百度的地位,因為 ChatGPT 要解決的問題很多就是搜索要解決的問題,它們的目标是一致的。」近期在一檔名為《新智者首席 Time》的欄目訪談中,百度副總裁、搜索平台負責人肖陽作出自己的判斷。自 2004 年加入百度,肖陽見證了搜索行業 20 年的發展歷程。
從演進路線來看,搜索引擎誕生之初要解決的是信息獲取效率的問題,為用戶提供從提問到答案的最短路徑。此前類似的檢索任務先後由《大英百科全書》、網絡黃頁等信息工具來承載,直至算法出現。
算法讓搜索引擎天然擁有 AI 基因,因為機器執行任務的前提是「理解」搜索框背後的需求。
只不過在不同階段,信息匹配的方式各不相同。
以肖陽入行的 2004 年為例,當時搜索引擎還處于關鍵詞檢索時代——用戶要像在圖書館裡搜書一樣,在搜索框敲下關鍵詞,然後通過不斷變化關鍵詞,找到精準匹配的網頁内容。
當年百度搜索的 PM 内部還會舉辦比賽,試圖不斷尋找更快搜到目标資料的方法。
後來用戶的需求越來越強,從關鍵詞檢索變成提問題,搜索演變成非對稱性匹配,即當用戶提問後,搜素引擎給出的是類似專家咨詢式的回答。打個比方,用戶問「明天天氣怎麼樣?」,答案可能是「雷陣雨伴有短時大風」。這個回答中壓根沒有出現與問題交叉的關鍵詞。
該匹配模式要求搜索引擎對用戶問題及全網内容這兩端都要有更深入的「理解」。
這大概能解釋,為什麼 2013 年百度、谷歌、微軟都會不惜代價參與對「深度學習之父」傑夫 · 辛頓教授的公司的收購競拍。
當時辛頓教授剛剛取得深度神經網絡技術的重大突破,搜索巨頭是最早嗅到技術潛力的一批公司——深度學習有望提升搜索效率。事後看,搜索也為深度學習提供了最早的應用落地場景。百度、谷歌都是最早布局深度學習的科技巨頭,百度大腦、谷歌大腦後來也都成為頂級 AI 開放平台。
圖:傑夫 · 辛頓
大約從 2018 年、2019 年開始,深度學習又迎來一輪突飛猛進,搜索引擎的語義變革繼續演進。谷歌、百度等搜索巨頭的大語言模型越來越大,模型能力越來越強,智能搜索引擎雛形已現。以百度為例,其在 2019 年便推出文心大模型 1.0,此後持續迭代到 2.0、3.0 版本。
正是基于這些積累,在 ChatGPT 發布後,谷歌和百度能很快推出 Bard、文心一言。外界看似一夜間長出來的大模型產品,實則是搜索巨頭多年業務實踐積累的產物。
被 ChatGPT 搶了風頭後,谷歌 CEO Sundar Pichai 在一次采訪中不無憋屈地說,「實際上我們已經擁有 AI 模型十幾年了。」
李彥宏也在公開演講中數次強調,無論是哪家公司,都不可能靠突擊幾個月就能做出(文心一言)這樣的大語言模型。「深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。」
02
搜索之變
搜索引擎發展到今天,已經成為世界上規模最大的 AI 應用場景和成功的商業模式。
從技術演進來看,似乎也很難得出搜索被大模型颠覆的結論。如果說狹義的搜索只是一個「搜索框」,廣義的搜索則是用戶表達和機器反饋的一個過程,而搜索框、對話框只是不同的人機互動形式。
這也是肖陽為什麼會說 GPT 和搜索引擎目标一致的底層邏輯。甚至大模型會讓頭部搜索引擎在競争格局中處于更加有利的位置,因為搜索有馬太效應——擁有更多用戶、技術、數據和算力的公司,產品效果會越來越好。
全球至今只有美中俄韓 4 個國家擁有本土搜索引擎不是沒有道理的。作為一項互聯網基礎設施,後來者很難颠覆格局。當然歐盟還是不信邪,2022 年曾掏 5800 萬元試圖打造一個歐盟自己的開放搜索引擎,以替代谷歌,目前還沒有下文。
基礎大模型也有相似特點,跑在前面的會跑得越來越快。「百度一手有搜索,一手有文心一言大模型或者說生成式 AI 技術,就像同時持有倚天劍、屠龍刀,雙劍合璧會產生更大的價值。」在作此判斷的同時,肖陽也承認,頭部搜索引擎并不能因此在競争中松懈半分,理應讓用戶體驗發生迅猛的變化。
「其實這個事很簡單,你讓用戶滿意了,用戶就留下來,你讓用戶感知到你能夠使他滿意,新用戶就會來,你讓他不滿意,他就會走。」
用李彥宏的話說:永遠不要以任何方式遏制用戶的需求表達。
用戶需求表達的更新,只能用技術的更新來回應。在生成式 AI 出現之前,用戶的需求表達方式已經呈現出越來越豐富、多元的趨勢,比如更多口語化、模糊化表達、對圖片和視頻類信息搜索需求上升。
對此,搜索引擎巨頭們紛紛在語意推理模型的基礎上強化跨模态能力,類似後來的 GPT-4。
大語言模型的出現也把搜索引擎帶到更為智能的階段——能聽會看,越來越懂用戶。過去人們調侃:谷歌可以給你 10 萬個答案,但是一個圖書管理員可以給你最為精準的答案。如今,大模型讓搜索引擎解決問題的能力更強,并開始朝着廣義的搜索生成體驗演進。
從行業引領者百度最新探索的一系列路徑,我們可以看到這種演進趨勢的眉目。
通過「卷」起自己,百度把「極致滿足」比例提升為搜索内部隐形 OKR。
所謂極致滿足,就是在用戶問出一個問題後,看搜索引擎給出的首條回答能不能解決你的問題。
首條回答的形式不僅有文字,還有視頻,搜索引擎可以從一段視頻中抽取出關鍵摘要。比如當家長想找一部教小朋友畫畫的藝術卡通片,以前需要花時間去浏覽、篩選、判斷和總結。而現在,百度搜索可以為用戶整理多個答案,并标注每個答案被提到的次數,每個答案中還包含更豐富的内容,大大節省了家長的精力。
另外一個有意思的探索在于「權威回答」。ChatGPT 出現後,人們在震撼之餘很快發現,它還會一本正經地胡說八道。計算機「幻覺」的存在,讓部分内容的真實可信度打個問号。百度搜索的新功能,則可以引用書籍直接回答提問,以增加信任感。
當你問出某個問題,搜索引擎可能會告訴你在這個問題在哪本書裡寫過,随後是進一步有拓展的閱讀,其相當于一個 AI 時代圖書管理員的角色。
肖陽透露,百度搜索一直在關注「極致滿足」數據:半年前,「首條滿足」比例只有 40%;現在達到 70%。且從數據變化來看,用戶是願意為搜索體驗的上升而買單的——今年以來,百度搜索日均新增問答需求超過 5000 萬次。
作為搜索代際變革的一部分,能聽會看的「AI 夥伴」也走上重要位置。百度在今年 5 月底的移動生态大會上首次演示了内測「AI 夥伴」的能力。
現場 Demo 顯示中,它不只是一個聊天機器人的對話界面,還能幫助用戶标記答案重點、提供權威來源,總結文檔概要,同時支持調用各種工具和服務,以及根據用戶意圖制作圖片或進行文案創作。
據了解,這個「AI 夥伴」目前還在内測當中,用戶的許多需求讓工程師意想不到,預計未來「AI 夥伴」的能力都會持續演進。
不過未來會否進入比爾 · 蓋茨所預言的 AI 個人助理時代,最終還要依賴搜索引擎與大模型的融合程度。這條路徑充滿挑戰,同時也被想象力鋪滿黃金。
03
新故事
在去年的一場媒體交流中,肖陽曾聊到一個問題:搜索做到最後,拼什麼?
業内公認,搜索是互聯網領網域難度最高的業務之一,它可是一個簡單的搜索框,也可能是一個非常開放的體系。但這個市場從來不乏挑戰者。前兩年,字節、華為等都有積極布局相關業務。彼時 ChatGPT 還沒有帶來颠覆性變革。
肖陽當時的回答是,最終拼對用戶的理解、對技術的投入以及能否把搜索做到極致的能力。如今大模型的智能湧現,讓所有人同時看到了做到極致的方向——搜索生成體驗,甚至輔助決策。
這些進化反過來不斷激發新的用戶需求。
大模型也讓百度搜索有了新故事。過去百度只是一個需求的「起點」,用戶獲取信息後,再去到其他網站或者 App 獲得服務場景,比如電商、本地生活或者内容創作。
為了提升服務價值,百度陸續通過布局小程式、百家号等產品進一步豐富搜索的内容生态,希望以此讓用戶能夠一站式解決問題,享受閉環服務。放眼全球搜索行業,這種生态戰略布局都有領先價值。
不過大模型出現以前,補齊理想的生态閉環需要更長的時間和耐心,因為工具類產品都有用戶粘性和停留時長的挑戰。
大模型加速了閉環的形成,它拉通了提問、找答案、決策落地的全過程,搜索引擎也因此獲得更大的商業想象力。這大概是所謂「雙劍合璧」的商業價值。
幾乎可以預見,融合更多人工智能創新應用後,搜索引擎們可能會打造一個更有活力的生态系統。
從百度等公司今年以來密集亮出的「武器庫」、「路線圖」來看,搜索主要玩家大概率不會被颠覆,相反會作為颠覆式創新的主要參與者,繼續推動技術變革。
>