今天小編分享的科技經驗:百度搜索接入DeepSeek!打不過就加入?其實意在AI搜索,歡迎閱讀。
搜索引擎要被 DeepSeek 革命?
繼華為、OPPO、TCL、吉利、機械革命等各行各業玩家接連接入 DeepSeek-R1 模型之後,微信、納米 AI 搜索、QQ 浏覽器、百度搜索、騰訊元寶等即時通訊軟體、搜索引擎、AI 工具,也陸續接入了 DeepSeek-R1 模型。2 月 16 日晚,百度搜索官方表示,為豐富多元化搜索體驗,将全面接入 DeepSeek 和文心大模型的最新深度搜索功能。
(圖源:微信公眾号截圖)
DeepSeek-R1 的到來,打破了國内 AI 行業原有的局面,不僅大語言模型領網域積累較弱的手機、家電、PC、汽車廠商接入該模型,就連已經開發出 AI 大模型的騰訊、360 等互聯網企業,也在為自家的 AI 工具接入 DeepSeek-R1,而且在更強算力規模的支持下, 體驗比 DeepSeek 官方平台更勝一籌。
其中尤為引發行業震蕩的是百度搜索,畢竟百度一度被視作中國 AI 產業的 " 扛旗者 ",早在 2013 年甚至更早百度就在探索深度學習 AI,多年來在 AI 技術上持續進行戰略押注,号稱在 AI 上已投資千億。如今百度搜索接入 DeepSeek,是 " 打不過就加入 ",還是另有所圖?
網站流量分析機構 Statcounter 統計數據顯示,2015 年到 2023 年,谷歌在搜索引擎領網域幾乎處于壟斷地位,份額始終維持在 90% 以上,但 2024 年的最後三個月,谷歌的市場份額卻分别為 89.34%、89.99%、89.73%。這種趨勢意味着其他搜索引擎,尤其是正在興起的 AI 搜索工具,已對谷歌造成了不小的壓力。
傳統的搜索引擎在我們查詢信息時,會篩選出相關的網址鏈接,并按照相關性、發布時間等規則排列,但具體内容如何、是否屬于标題黨,還要我們進入網址之後才能得知。
(圖源:百度 AI 搜索截圖)
小雷經常需要搜索某類產品的銷量數據或者查證一些消息的真實性,可許多媒體在報道時會隐去具體來源,導致小雷需要花費大量時間在眾多鏈接中查找有效信息。搜索引擎的廣告付費排名問題,對于用戶更是堪稱折磨,嚴重影響了我們尋找有效信息的效率。
任何帶有聯網功能的 AI 應用,廣義上都屬于 AI 搜索工具。AI 搜索工具可以快速從大量信息中篩選出有效信息,總結歸納後直接展現在用戶眼前,而且基本會告知信息來源,還會附上網址鏈接,便于用戶求證和查看完整信息。相較于傳統搜索引擎,AI 搜索能夠主動總結查詢信息的重點内容,不再需要用戶一個個點開鏈接查看、對比各方信息,大幅提升了查找信息的效率。
為進一步提升用戶的搜索體驗,AI 企業除了投入巨資訓練 AI 大模型,還在嘗試為 AI 搜索工具加入更多技能和高質量信息源。如微信新增的 AI 搜索功能,關聯了公眾号的文章,生成的内容還可以一鍵發送給微信好友或轉發至朋友圈。騰訊元寶同樣加入了該功能,也可以快捷分享至微信好友、朋友圈、QQ 好友、QQ 空間、企業微信。
(左:微信,右:騰訊元寶;圖源:App 截圖)
AI 搜索工具無疑對傳統搜索引擎造成了降維打擊,而身為國内搜索領網域領頭羊的百度,自然率先感受到了壓力,并選擇積極擁抱 AI,于 2024 年 4 月 26 日正式上線了百度 AI 助手,将搜索、大模型、智能體相互連接,以滿足用戶多樣化的搜索需求。
當前我們使用百度搜索引擎查找某些信息時,便能夠看到百度 AI 搜索給出的答案,無需再點進網址查看,減少了一個步驟。百度 AI 搜索也會提供信息來源的網址,方便用戶查看完整内容。
(圖源:百度 AI 搜索)
然而面對 AI 搜索,網友們依然抽成了三個派别,部分網友支持 AI 搜索,認為它讓自己的工作、學習、生活更加方便;另一部分網友聲稱 AI 搜索準确性不佳,可能會出現某些事實性錯誤;最後一部分網友則屬于中立派,使用 AI 搜索功能的同時,也會去驗證 AI 搜索生成信息的準确性。
AI 搜索好用但并不完美,百度為 AI 搜索引入文心和 DeepSeek 的深度搜索功能,目的或許就在于提高生成内容的準确性。
作為一名媒體工作者,小雷經常使用 AI 搜索查找各種數據,遇到 AI 幻覺的情況不在少數。例如小雷打開了聯網搜索功能并搜索 "2024 年中國手機銷量數據 " 時,DeepSeek-R1(騰訊元寶提供的服務)居然告知小雷現在是 2023 年 10 月,所以沒有相關的數據。這種情況通常被稱為 "AI 幻覺 ",指 AI 生成的内容與事實嚴重不符或存在邏輯錯誤。
(圖源:騰訊元寶截圖)
為更直觀展現 AI 幻覺問題,小雷對目前國内使用人數較多的六個 AI 大模型做了一個簡單的 " 草莓測試 ",即向 AI 提問,Strawberry 一詞中有多少個字母 "r"?相信看到這個問題的小夥伴沒有一個會回答錯誤,但 AI 給出的答案卻令小雷瞠目結舌。
在小雷測試的騰訊元寶、豆包、百度 AI 搜索、Kimi、通義千問、納米 AI 搜索等工具中,只有騰訊元寶的混元大模型和 Kimi 的 k1.5 模型回答正确,其他所有大模型全部回答錯誤。最離譜的是豆包生成的答案,雖然指出了 Strawberry 的第三、第八、第九個字母是 "r",給出的答案卻依然是 Strawberry 只有兩個字母 "r"。
(從左到右依次為:騰訊元寶、豆包、百度 AI 搜索、Kimi、通義千問、納米 AI 搜索;圖源:App 截圖)
而小雷将納米 AI 搜索的模型從智腦(360gpt- Pro)切換至 DeepSeek-R1 後,該模型回答出了正确答案,并指出單詞結尾的兩個 "r" 會被誤認為只有一個。
(圖源:納米 AI 搜索截圖)
小雷在多次測試後發現,相較于一個多月前,AI 大模型產生 AI 幻覺的可能性已明顯降低,查詢部分信息時會告知用戶尚無該數據,而非繼續編造數據,但偶爾仍會出現 AI 幻覺。AI 幻覺的存在,讓小雷無法完全相信 AI 搜索給出的數據,因而經常需要進入網址查看,并搜索其他文章,通過對比确定信息的真實性。
AI 企業也在通過各種方案降低產生 AI 幻覺的概率,例如加入 RAG 技術(檢索增強生成技術),讓 AI 大模型與高質量知識庫挂接,在生成内容前先對照知識庫的準确數據。通過架構優化提升 AI 大模型的長序列處理能力,同樣可以達到減少 AI 幻覺的作用。
OpenAI 工作人員提出了一種過程監督機制,在 AI 大模型推理問題時,每個正确步驟均給出自我獎勵,優化思維鏈,而非回答正确結果時才給出自我獎勵。
多個大模型生成的内容互相驗證(模型對模型評估),也是降低 AI 幻覺的有效方法。如納米 AI 搜索就推出了多模型協作方案,通過文心一言、智腦、豆包三個大模型協作,成功計算出了 Strawberry 單詞中字母 "r" 的數量。
總而言之,AI 幻覺暫時只能通過優化訓練方式、思維鏈、大模型架構等方案減少產生的概率,無法徹底消除。AI 幻覺的存在會降低 AI 搜索生成内容的準确性,在生成内容後,用戶最好進入 AI 給出的鏈接,确認信息的可靠度。
百度為 AI 搜索接入 DeepSeek,目的或許就是借助 R1、V3 等模型的能力,通過深度思考,與文心大模型互相驗證,降低產生幻覺的概率。
AI 搜索大勢漸成,将逐漸取代傳統搜索模式。盡管 AI 幻覺依舊存在,可能會出現數據虛假的情況,但 AI 企業正在通過各種方式減少產生 AI 幻覺的可能。而在諸多方案中,多模型互相驗證無疑是最簡單有效的方法之一。
國内搜索引擎領網域的王者百度,将通過 DeepSeek 和文心的深度思考能力,提高 AI 搜索生成内容的準确性,360 同樣打造出了多模型協作功能,以提高推理能力。有百度、360 打頭陣,預計未來會有更多 AI 搜索工具選擇此方案。
(圖源:百度截圖)
采用 MIT 協定及類 OpenRAIL 授權方式開源的 DeepSeek,允許第三方自由使用其代碼,且可以修改、復制、分發,在開源大模型中也是開放性最高的一批。憑借出色的推理能力和開源模式,DeepSeek 已然成為國内 AI 企業合作的主要對象。
當初安卓能夠戰勝 iOS 之外的其他作業系統,開放性正是原因之一。DeepSeek 的開源模式或将讓其成為 AI 領網域的谷歌,将 R1、V3 及未來訓練出的開源模型打造成 AI 領網域的安卓,不僅是家電、手機廠商快速為設備加入 AI 功能的最佳選擇,還将成為其他 AI 企業實現模型對模型評估的首選。
即将免費服務、開源大模型的文心一言,引入 DeepSeek 的深度思考能力之後,能夠提升 AI 搜索生成内容的質量,從而奠定在搜索領網域的地位。百度的影響力也将對 DeepSeek 起到加持效果,增加用戶體驗 DeepSeek-R1 模型的機會。AI 領網域冉冉升起的新星 DeepSeek 與搜索領網域的老牌王者百度,在 AI 搜索時代将互相成就,向成為與谷歌比肩的全球互聯網巨頭邁進。
不過,正如雷科技創始人羅超所言:AI 搜索目前只是 "L3 級自動駕駛 " 的感覺,也就是還是需要人 " 接管 " 的,因為 " 幻覺 " 的存在,AI 搜索給出的答案正确與否未知,用戶往往還需要去搜索引擎裡面再檢驗一下——有不少網友吐槽被 DeepSeek 錯誤答案帶到溝裡了。
只要 AI 搜索準确率沒有幾個 9(比如 99.9999%),傳統搜索引擎就還有存在價值,實際上,在使用傳統搜索引擎中,人的判斷力是至關重要的。人的大腦想要不退化,AI 時代也須還是要去做判斷的,不能什麼都用 AI 給的,否則這跟鹹魚有什麼區别呢?