今天小編分享的互聯網經驗:成立一年估值5億,Perplexity如何改變搜索方式?,歡迎閲讀。
圖片來源 @視覺中國
文 | 讀懂财經
曾經,很多人以為,ChatGPT 的橫空出世,就幾乎等于敲響搜索的喪鍾。
這樣的説法在當時不在少數。按前谷歌第 23 位員工、Gmail 的創建者之一 Paul Buchheit 的説法,ChatGPT 将摧毀谷歌,就像當年搜索引擎徹底幹掉黃頁電話簿一樣。
一年時間過去了,AI 大模型替代搜索的進程,遠沒有大家想象的那般順利。但一切并非毫無意義。随着 Perplexity 等 AI 搜索產品的湧現,也讓我們對 AI 給搜索行業帶來的變化有了更加清晰的認識:
首先,與傳統搜索引擎相比,AI 搜索讓信息的顆粒度從網頁細化到信息本身,進而提升了信息獲取的效率。這是 AI 搜索最大的價值。
其次,作為一款 AI 套殼產品,像 Perplexity 等產品的成功在于,實現了單點的價值創造和體驗優化,更是一次 AI 工程化層面的勝利。
第三,像 Perplexity 這樣的 AI 搜索,目前更多集中在知識等小眾領網域,距離替代谷歌成為通用搜索引擎仍然有很長的距離要走。
盡管當下 AI 搜索替代谷歌幾無可能,但長期并非毫無可能。從過去科技的演進看,新技術對老技術的替代,往往是以意想不到的颠覆形式完成的。正如誰能想到如今擁有上億用户的快手,當初只是一個做 GIF 的工具。變化與未知,就是新技術的魅力。
比搜索更精準是如何做到的?
在 AI 搜索的賽道,Perplexity 是絕對的明星。公司創始人 Aravind Srinivas 來自 OpenAI,2022 年 8 月創立了 Perplexity。2023 年 10 月,公司完成了新一輪融資,估值達到 5 億美元。
與其説,Perplexity 是一個搜索引擎,倒不如説是答案引擎。當用户向 Perplexity 輸入問題并點擊搜索後,你能得到一個回答。比如,當你向 Perplexity 提問 " 蠟筆小新是誰 ",會得到 Perplexity 的相應回答。
這個答案是通過網上已有的信息總結提煉而來。在回答欄目的上方,Perplexity 還會給出參考内容的來源,并支持點擊。在回答的下方,Perplexity 預測了幾個用户可能會追問的問題,點擊後頁面繼續向下展開對于該問題的答案,用户也可以自行進行提問。
此外,在回答欄目的側邊,用户還可以搜索相關主題的圖片和視頻。
Perplexity 不僅能夠回答簡單問題,還能理解用户一些比較復雜的問題,比如當用户就 " 生成式 AI 與過去的 AI 相比有哪些不同和特點 " 進行提問時,Perplexity 也能進行回答。
但不足的地方是,在 " 生成式 AI 與過去的 AI 相比有哪些不同和特點 " 問題來説,Perplexity 推薦的視頻和主題關系并不大。也就是説,在復雜問題從文字向更多模态轉化過程中,搜索内容的效率有比較大的下降。
看上去,AI 搜索更像是傳統搜索引擎的一次更新,即從過去的單邊的信息查詢和 SEO 策略優化,轉變成雙邊的信息互動。
過去的傳統搜索引擎的工作流程是,基于用户搜索的内容,對相關内容進行索引并創建搜索索引,所謂的索引,可以理解為内容過濾後,一個與搜索内容有關,且包含頁面及其内容和排名信息的數據庫。然後再對索引中的頁面使用各種算法進行排名,進而給出搜索結果。
相比之下,Perplexity 比搜索引擎額外多做了幾件事。在搜索前,Perplexity 會通過大模型,重新理解用户提出的問題,然後解析為一個更清晰的搜索指令。接下來,調用 Google、Bing 等搜索引擎的 API 創建相應的索引庫,然後用自有的排序算法,對所有的搜索結果做重新排序,篩選出數量不等且高質量的網頁。最後,讓大模型閲讀篩選出來的内容并輸出和問題相關的答案,以及可能用到的問題。
也就是説,相比搜索引擎做的是信息相關度的匹配,而 Perplexity 是在此基礎上做了更多理解指令上的工作,進而讓搜索結果更接近用户想要的東西。
搜索效率更新的背後,是搜索顆粒度的細化。在互聯網時代,搜索引擎将信息以網頁為最小粒度為用户進行排序和推薦。而大模型能夠學習所有 Google 上能得到的信息,并将知識以詞匯為最小粒度生成相應的内容。
Perplexity 破局的啓示
聽起來,Perplexity 所做的事情很簡單,就是在原有搜索引擎基礎上加入了大模型的自然語言理解和生成豐富回答能力。那麼,是不是意味着所有大模型企業也可以做?
其實并非如此。曾經在很多人看來,生成式 AI 可能會取代傳統搜索引擎,但用大模型直接進行搜索也會出現很多問題。
比方説,生成式 AI 無法做到實時更新,且受限于訓練數據,可能無法覆蓋相對小眾、缺乏通用性的長尾知識。同時,生成式 AI 對生成内容的可控性較差,存在 " 幻覺 " 問題,用户也難以對答案進行直接驗證。
Perplexity 所做的事情就是,把這些大模型搜索過程中出現的 " 坑 " 一個個都填掉,其中最重要的事情就是信息的實時性和準确性。
實時性方面,與 ChatGPT 等大模型依賴訓練時的數據和語料獲取信息不同,Perplexity 基于底層傳統搜索引擎開發而得,能夠及時抓取最新的信息。
準确性方面,Perplexity 做了兩件事情:減輕幻覺和内容溯源。為了減少幻覺現象,Perplexity 引入了 RAG 技術(檢索增強生成),RAG 的作用好比是給模型提供一本教科書,讓它根據特定的問題去查找信息,通過關聯外部知識來提高答案的準确性,有效減少了語言模型中出現的虛假信息,使得生成的回答更準确可信。
與此同時,Perplexity 還對生成的每一句話都附有引用鏈接,在保證可靠性的同時便于用户溯源或深入研究。
不僅如此,Perplexity 還對召回和排序環節的算法做了創新,保證内容的有用性及引用的精确程度。其中," 召回 " 指根據搜索指令從數據庫中獲取盡可能多的正确結果," 排序 " 指根據用户搜索内容的相關性對召回結果進行排序,決定了搜索引擎的精确程度和性能上限。
來源:中金研究部
這也讓 Perplexity 成為當下綜合性能最好的 AI 搜索引擎。在 2023 年 4 月的論文中,斯坦福的研究人員對 YouChat、Perplexity.AI、NeevaAI 及 BingChat 四個生成式搜索引擎進行了人工評估。結果顯示,Perplexity.ai 生成内容有用性的評分為 4.56 分,排名第二;引文召回率和精确度為 68.7,排名第一;在泛搜索引擎類的體驗中,綜合能力位于最前列。
除了在信息準确、可靠上,Perplexity 在響應速度上也花了很多功夫。比如,Perplexity 通過自研推理堆棧,讓其内容生成速度快于 GPT 類通用模型。在模型側,公司對 GPT-3.5 進行微調,在降低成本的同時進一步提升響應速度。
Perplexity 的成功,也給了那些苦苦探索 AI 大模型落地的創業者一些啓示:比起模型能力,產品本身單點的價值創造和體驗的優化,是一個更為重要的事情。
替代谷歌言之過早
從數據上看,自產品發布以來,Perplexity 的成績着實不錯。
根據 Similar Web 數據,截至 2023 年 10 月 25 日,Perplexity APP 的日度下載量為 14,163 次;2023 年 2 月 1 日至 10 月 25 日,Perplexity 網頁端的周度訪問量由 275 萬增加至 1,113 萬,增長 3 倍,與同類别的 AI 搜索應用 YouChat 相比增長勢頭強勁。
盡管 Perplexity 的表現足夠優秀,但距離真正替代谷歌等傳統搜索引擎還有很長的距離。從定位上看,當下的 Perplexity 更像一個知識平台,用户對其需求大都集中在知識領網域,定位類似于 AI 時代的 Wikipedia 和 Quora。
從 Perplexity 後續的更新動作上,也不難看出這一點。比如,Perplexity 正在嘗試以知識分享為核心,創建相關的内容社群生态,Perplexity 支持用户将搜索問題及答案分享至社區,供其他用户學習讨論。
之所以 Perplexity 選擇以知識平台為切入點,主要基于兩點考慮:
一是 RAG 技術更擅長在開放網域知識問答及生成式問答中發揮作用。Meta 的技術論文對 RAG 技術進行了詳細測評,包括開放網域問答、開放網域問題生成、抽取式問答及分類推理任務。在開放網域問答中,RAG-Token 和 RAG-Seq 得分處于領先地位;在生成任務和分類任務中,RAG 表現優于 BART 模型。
二是谷歌在消費、地圖上積累了大量的數據,這讓 Perplexity 在生活 / 購物等更高頻的場景沒有任何優勢,很難實現場景的泛化。
以知識平台為目标,固然讓 Perplexity 找到了差異化的方向。但同時也意味着,Perplexity 短期内很難成為一款低門檻的大眾化互聯網產品,至于替代谷歌更是無從談起。
不僅如此,與大多數 AI 創業公司一樣,Perplexity 并沒有形成可持續的商業模式。目前,Perplexity 的變現方式主要有兩個:會員訂閲和 API 調用,但尚未形成規模化收入。
雖然收入沒起來,但支出卻一點都不少。根據中金測算,目前 Perplexity 調用 Bing 搜索引擎及 GPT-4 的單個問題成本約為 0.03 美元,年成本約為 6000 萬美元,這還不包括後續 Perplexity 自研模型所產生的成本。
從過去看,搜索向來是個馬太效應極其明顯的市場。盡管用户對百度诟病頗多,也不影響百度在中國搜索引擎的市占率超過 7 成。如果用當下的視角理解產品技術演進的結果,Perplexity 似乎沒有任何機會。
但這事好就好在,新技術對老技術的替代,往往是以颠覆的形式出現的,甚至老玩家固有的 " 習慣 " 還會成為其迭代的最大障礙。就拿搜索這事來説,AI 搜索直接給出關鍵信息的互動方向,天然與谷歌現有競價排名的商業模式相背離。
如何取舍對谷歌來説是一個難題,而對 Perplexity 來説則是一個機會。從這個角度來説,Perplexity 替代谷歌固然言之過早,但也未必沒有可能。