今天小編分享的互聯網經驗:六家“深度搜索”橫評,誰更懂用戶要什麼?,歡迎閱讀。
傳統搜索的時代結束了,而我們正站在新時代的大門前,搜索不再是簡單的信息檢索,而是基于理解和洞察的信息重組與再創造。
撰文|張賀飛
編輯|沈菲菲
兩年多前,Gmail 的創建者之一 Paul Buchheit 在社交媒體上寫道:" 谷歌可能只需要一兩年時間就會被徹底颠覆,AI 将會消滅搜索引擎的結果頁面。"
時間驗證了 Paul Buchheit 的論斷,焦點卻是在中國市場。
過去一個多月裡,百度、誇克、微博、知乎、小紅書等平台陸續接入 DeepSeek,和大模型的深度思考能力融合,重新定義了内容的呈現方式和用戶搜索習慣,悄然開啟了一場 " 深度搜索 " 戰事。
本期内容将圍繞日常生活中經常遇到的一些問題,包括健康、數碼、美妝、遊戲和最新事件,對 DeepSeek R1(聯網搜索)、百度 AI 搜索、誇克、微博智搜、知乎直答、小紅書孵化的 AI 搜索應用 " 點點 " 進行橫向對比,測試下 " 深度搜索 " 能力哪家強?
需要說明的是,由于 " 思考過程 " 比較長,截圖僅展示最終答案。假如對結果的真實性存疑,可自行測試。
第一題:兒童換季過敏有哪些特别注意事項?
因為家裡的寶寶是易過敏體質,就把很多家長正在頭疼的問題作為測試的第一道題,用來驗證内容的權威性和可信度。
先說結論:六個產品都達到了及格線,都提到了常見的過敏原,過敏的主要症狀,日常護理需要注意的事項等等。原先需要查看幾十篇文章或視頻的知識點,現在只需要等待幾十秒的時間。
DeepSeek R1 意外沒有标記内容來源,但輸出的内容和百度、誇克差别不大,并未出現太多 " 幻覺 "。
百度 AI 搜索的答案相對簡潔了不少,聚焦在了花粉、螨蟲等過敏源,然後梳理了對應的應對措施,和 DeepSeek R1 不相上下。
誇克的答案更為詳實,将防護建議進一步細化到了皮膚護理、呼吸道護理,以及飲食調整、藥物治療、中醫調理等建議,在内容的多樣性方面比百度和 DeepSeek R1 有進步。
微博智搜、知乎直答和 " 點點 ",因為本身擁有大量的 UGC 内容,表現出了各自的特色:" 點點 " 沒有太多增量信息,但排版上有着鮮明的小紅書風格,視覺上更加友好。
知乎直答的參考資料全部來自站内,也在某種程度上暴露了知乎在健康類内容上的短板。
微博智搜的答案是讓我們最驚訝的,原因是在搜索結果中給到了更多的增量信息,而且包含了權威媒體和專業健康類博主的原創視頻,幾乎可以直接作為預防手冊使用。
第二題:電腦的内存條是越多越好嗎
這是一個很多人選配電腦時都會糾結的事,看起來比較專業,其實裡面留了一個坑,用來測試不同 AI 搜索的用戶友好性。
單從準确性上看,六個產品沒有拉開明顯差距,均考慮到了不同的使用場景,兼容性和穩定性,很多用戶選購内存條時可能陷入的誤區。比知識本身更重要的是,用戶在提問時想要的答案是什麼呢?
百度和誇克不可避免地出現了搜索引擎的常見弊病,首先介紹通道配置、内存性能等專業知識,最後簡單提了下 " 根據實際場景選擇 "。
猜測症結主要在于數據源,百度和誇克的來源站點都以長篇的圖文介紹為主,不少内容來自内存品牌的官網,看似是從專業的角度切入,卻沒有顧及到 " 小白 " 群體的認知能力。
相比之下,DeepSeek R1、微博智搜、知乎直答和 " 點點 " 都将使用需求放在了最前面,偏向于内容博主講故事的風格,先讓用戶按需求對号入座,再結合專業的知識高速用戶這麼選的原因。
圖:微博智搜第二題答案
圖:知乎直答第二題答案
圖:小紅書點點第二題答案
其中微博智搜和 " 點點 " 都在答案中引用了專業數碼博主的科普視頻。
不同的是,微博智搜在排版上将視頻作為了答案的一部分,契合了小白群體的需求,譬如可以直接點擊觀看視頻,通俗易懂地學習相關知識點。" 點點 " 則将視頻放在最後,僅作為延伸了解。
第三題:含玻色因和視黃醇的護膚品能一起使用嗎?
前面兩個問題中,平台的博主和 UGC 内容在很大程度上左右了輸出内容,于是我們找來了一個和美妝相關的問題。
結果和我們預料中的一樣。因為時尚美妝是内容營銷的 " 重災區 ",AI 搜索能否處理營銷味兒比較重的内容,給出一份客觀的答案呢?
鑑于 DeepSeek R1 從純技術角度進行了回答,将作為判定其他内容是否被營銷污染的 " 佐證 "。
圖:百度 AI 搜索第三題答案
圖:誇克第三題答案
百度和誇克 " 終于扳回了一局 ",盡管内容中出現了珀萊雅逆時光瓶、珀萊雅黑繃帶等扎眼的產品名,整體上依然比較客觀,自動過濾到了一些 " 軟植入 ",且成分介紹、注意事項、使用建議等都相對準确。
" 翻車 " 最嚴重的是 " 點點 ",可以看到平台想要規避營銷類内容的努力,來源中特意增加了有來醫生、百家号等外部内容,但 " 輔助方案 " 和引用的圖片,有着濃濃的營銷味兒。
同樣的問題,微博智搜優先采用的是浙大一院主治醫生的視頻講解,對兩種成分的作用機制進行了通俗易懂的介紹,使用建議和注意事項中也提到了相關產品,但營銷味兒弱了很多。
至于知乎直答,在這個問題下直接 " 擺爛 " 了,原因大概與第一題一樣,和知乎的用戶構成和内容側重有關。
第四題:《王者榮耀》最新版本裡最适合上分的打野英雄是誰?
如果說前面幾道題都有相對确切的答案,我們找了到比較主觀的題目,比如對《王者榮耀》裡打野英雄的排序。
預料之中的,我們看到了六個不同版本的答案,不僅提到的英雄不同,同一英雄的排名也不同。為了盡可能客觀,我們仔細查看了思考過程和來源,看看哪個 AI 在 " 實事求是 ",哪個 AI 在 " 弄虛作假 "。
圖:DeepSeek R1 第四題答案
圖:百度 AI 搜索第四題答案
圖:誇克第四題答案
有意思的是,DeepSeek R1、百度、誇克均采用了 T0、T0.5、T1 的分類方法,滿滿的專業評測範兒,只是英雄的排序全然不同。
在 " 思考過程 " 中可以看到,都注意了 " 網頁 " 的發布時間,并提出查看 " 過去三個月的内容 ",答案裡仍采用了大量 2023 年乃至 2018 年的内容,DeepSeek R1 被網友诟病的 " 幻覺 " 問題,總算是 " 暴露 " 了。
微博智搜和 " 點點 " 主要參考的是 2024 年 12 月份以後的用戶内容,其中微博智搜 " 挖 " 出了二十多篇三天内的相關微博。我們認真查看了引用的每一條微博,發現微博智搜主要借鑑了多位金 V 博主的内容,并且在答案明确提及了英雄的特點和版本适配。
" 點點 " 的回答同樣不乏可圈可點的地方,特别是避坑提醒和上分小技巧,多了幾分真實感,而非僅僅摘述科普文裡的内容。
知乎直答遺憾地再一次 " 拉胯 " 了,猜測原因是同一個問題下有近期的回答,也有兩三年前的回答,知乎直答并未對舊内容進一步按時間過濾,導致答案和其他幾家出入最大。
第五題:平價的蜜雪冰城擁有塌房豁免權嗎?
既然 " 時間線 " 成了某些深度搜索的短板,不妨進一步測試下——能否準确回答或梳理過去一周内發生的焦點事件?
起因是 315 晚會對蜜雪冰城門店使用隔夜檸檬片的報道,在輿論端卻出現了反差,不同于對 " 滬上阿姨 " 的口誅筆伐,網友們再一次 " 寬恕 " 了蜜雪冰城,衍生出了 " 塌房豁免權 " 的說法,吸引不少自媒體進行解讀。
恰恰是這個問題的答案,讓我們對 " 深度搜索 " 有了更深刻的認知,絕非是一場同質化的競賽,而是内容差異化的較量。
圖:DeepSeek R1 第五題答案
圖:誇克第五題答案
圖:百度 AI 搜索第五題答案
DeepSeek R1、誇克和百度主要參考的是新聞報道和自媒體文章,答案裡的措辭有所不同,但有着相似的邏輯。同時也意味着,缺少 UGC 内容的情感和真實體驗,很難拉開實質性的差距。
微博智搜在回答中提到了消費平權、品牌形象的防御性建構和危機傳播的娛樂化消解,讓我們看到了更多的維度,也再一次印證了微博在中文輿論場裡的 " 陣地優勢 ";
" 點點 " 在回答中提到了情感綁架、自我 PUA 式消費等議題,本質上也是對平台用戶價值觀的呈現;
知乎直答的表現中規中矩,但提到了 " 消費降級 ",同樣可以看到平台内容上的差異化……普通用戶分享生活、觀點、經驗等真實感強的内容,才是深度搜索的魅力所在。
寫在最後
由于時間關系,我們只測試了 5 道問題。
單就推理速度而言,百度、誇克位于第一梯隊,無形中印證了百度和阿裡的技術硬實力,點點和知乎直答處于第二梯隊,微博智搜的思考速度稍慢了一些,用時和 DeepSeek R1 不相上下。
對于搜索的結果,暫時無法對幾個深度搜索平台的優劣做出确定性的結論,但不乏一些值得關注洞察:
1、大模型的深度思考能力決定了體驗的下限,但内容決定了體驗的上限。
無論是百度、誇克,還是微博、小紅書、知乎,接入的都是 DeepSeek R1 滿血版,在底層的技術能力上實現了對齊,最大的差異其實在于各個平台所擁有的内容資源。
比如微博以前的搜索體驗差強人意,直接原因就是基于關鍵詞的搜索技術,導致來自權威媒體、行業大 V 的優質内容 " 沉沒 "。接入 DeepSeek R1 後,原本零散、碎片化的優質信息,被高效整合成清晰、邏輯性強且具備參考價值的搜索結果,在用戶體驗上有了極大改善。
2、深度搜索不只是 " 找信息 ",而是 " 找真實、權威、有可信度的信息 "。
大模型本身 " 沒有價值觀 ",影響輸出結果的是數據,社交平台上的 UGC 内容也就成了一把雙刃劍:可能讓答案更有 " 人情味兒 ",也可能 " 污染 " 生成内容的準确性。
就像小紅書裡的美妝廣告,搜索結果中不可避免地夾雜了太多的營銷信息。并非沒有 " 避險方案 ",比如在特定領網域調整 UGC 内容的權重,以外部可信内容為主,UGC 内容為輔;或者像微博那樣引入權威媒體和垂直領網域的專業博主,用大量權威、可信的内容避免信息失真。
3、深度搜索的體驗是不可逆的,将帶來更加有效的商業變現路徑。
俞軍老師提出過一個著名的體驗公式,即用戶體驗 =(新體驗 - 舊體驗)- 遷移成本。鑑于深度搜索相較于傳統搜索的跨時代優勢,用戶體驗在很大程度上是不可逆的。
新範式必然會帶來新的機會。以内容付費為例,用戶更願意為高權威、高可信的内容付費,微博、小紅書、知乎等社交類平台,或許可以在醫療、法律、财經咨詢等垂直領網域,構建信任型内容付費場景,通過搜索結果在專家和用戶間建立信任的紐帶,激勵專家持續生產優質内容。
做一個總結的話:傳統搜索的時代結束了,而我們正站在新時代的大門前,搜索不再是簡單的信息檢索,而是基于理解和洞察的信息重組與再創造,屬于内容平台的下一個春天來了。
主理人 | 張賀飛(Alter)
前媒體人、公關,現專職科技自媒體
钛媒體、36kr、創業邦、福布斯中國等專欄作者
轉載、商務、開白以及讀者交流,請聯系個人微信「imhefei」