今天小編分享的互聯網經驗:谷歌的Deep Research效果怎麼樣?,歡迎閲讀。
本文來自微信公眾号:王智遠,作者:王智遠,題圖來自:視覺中國
去年 12 月,谷歌推出了 Gemini Deep Research。
什麼是 Deep Research?它像一個 AI 助理一樣,輸入一個問題,它立馬能搜索、規劃、推理、最後形成一個報告。
一
今年,它做了大更新。更新後能力凸顯在三方面:
1. 它能幫你把一個大問題拆成幾個小問題,一個一個解決;
2. 能從很多不同的地方找到信息,分析幾百個來源;
3. 特别快,幾分鍾就能做出一個詳細的報告,從計劃到總結,全都有。而且,它還能處理超過 45 種語言。
官方説的是,目前免費試用,我用免費賬号折騰半天不行,後來用一個 Gemini Advanced 賬号,一下子就能用了。
體驗地址是:https://gemini.google.com
打開 Gemini 的網頁,登錄後,你可以在左上角切換不同的模型,現在有五種。
2.0 Flash 适合快速回答問題,處理簡單任務;2.0 Flash Thinking 能分析復雜問題;Personalization 會根據你的習慣調整回答;2.0 PRO(Experimental)是還在測試的高級版本,适合專業人士。
最後説説,它的第五個能力:Deep Research。
話不多説,直接在 Gemini Deep Research 裏輸入了一個問題:幫我寫一個關于 Gemini Deep Research 的深度研究報告。
它很快給我拟定了一個方案。這個方案列出 7 條主要内容。每一條都很清晰,具體是這樣的:
第一條,先整理 Gemini Deep Research 的官方資料。
第二條,分析這個工具可以用在哪些場景,還有它的主要特點是什麼。
第三條,去找一些用户對這個工具的評價,看看大家用起來覺得哪裏好、哪裏不好。
第四條,收集一些專業人士的測評和分析,看看專家們是怎麼評價它的。
第五條,它會找一些和 Gemini Deep Research 類似的工具,做一個對比,看看它在競争中有什麼優勢或者不足;第六條,研究一些實際使用過的案例,看看這個工具在解決實際問題時表現如何。
最後一條,也就是第七條,它會深入探讨這個工具的技術原理,評估數據是否可靠、準确;同時,它還會把工具放在更大的學術背景中,看看在整個領網域裏的水平如何,未來發展潛力怎麼樣。
方案列完後,它問我:你覺得這個方案行不行?如果覺得沒問題,可以直接開始研究了。
從整個研究結構來看,它确實比我個人想得更全面。
至少它不僅提供了背景資料,還給出優劣勢分析、專業人士的測評、工具對比,以及最後在更大背景下的表現評估;所以,在我看來,這更像一份簡單而完整的工具測評報告。
二
我确認方案後,它便開始了工作。
一開始,它從 7 個網站中幫我查找資料,這些網站包括 ZDNet、YouTube.com、SearchEngineJournal、Google、播客,以及 WorkspaceUpdates.Google 等。
這些網站可能會提供有關 Google Gemini 的基礎信息、使用教程、新聞報道或者用户支持等内容。
找資料過程中,我發現它把核心功能、關鍵特點、技術亮點都整理得清清楚楚。
接着,它開始了下一步:
從更多地方收集信息。它訪問了 Reddit、How-To Geek、SectionSchool、Google 的官方頁面,以及 SearchEngineJournal。
我覺得,這些網站選擇,它主要為了獲取幾類不同信息。
首先是用户的讨論和評價。它想看看大家實際用起來感覺怎麼樣,我還随機點開了幾個 Reddit 頁面,發現它不僅抓取了博主寫的文章内容,還提取了下面的評論。
這些評論往往是用户的真實感受,特别有參考價值。
第二類是教程和學習資料。像 How-To Geek 和 SectionSchool 這樣的網站,會提供詳細的使用指南或者教學資源。
第三類是官方信息;最後一類是專業分析和評價。SearchEngineJournal 這個網站專注于 SEO 和數字營銷,上面有不少專業人士對工具的深入分析和評測。
所以,我認為,這一步,它想全面收集用户反饋、專業解讀、使用教程和官方的公告;這樣的信息組合,确實能讓人從不同角度了解 Google Gemini。
然後,它總結了三個重點:
它説:我看了用户對產品的評價,發現體驗各不相同。大家普遍贊賞,工具能幫他們節省時間,快速了解主題或者寫個初步報告。
不過,也有人擔心質量問題,工具在判斷信息來源的可靠性上可能不夠好,有時候,生成的信息太泛泛,不夠深入。還有人提到,工具會突然中斷,導致研究失敗。
在比較方面,它説,有些用户把 GEMINI Deep Research 和 Perplexity、DeepSeek 做了對比。
一些人認為 Perplexity 在講故事和挖細節上做得更好,而 DeepSeek 的新模型在研究質量和速度上表現最佳;甚至,ChatGPT 在某些情況下能提供更高質量的研究結果;這些比較顯示,Deep Research 在某些方面可能還有提升的空間。
通過這一步詳細拆解,我認為細節對我幫助很大。畢竟,别人對 Deep Research 的看法,是他們的本地知識,這些有助于做商業分析用。
三
第三步研究中,它開始尋找更專業的知識。
看了看它推薦的 9 個網站,發現網站和第二步裏的不一樣。它們更關注怎麼提高工作效率的工具、人工智能研究,還有戰略和市場分析這些内容。
看起來這些網站挺權威,裏面有技術支持文檔、新聞博客、社交讨論和專業教程,各種信息都有。
我覺得,這些網站是對之前研究的一個補充,之前分析了好壞,現在要找更專業、更深入的信息。
所以,它給我的結論是:Deep Research 功能很強,但在準确性上還得提高;還有,Gemini 2.0 的深度思考模型是個重要的更新。
接下來第四步、第五步和第六步,步驟都差不多。它找的是些專業網站。它主要關注三個方面:
專家怎麼説,怎麼評價;
看看實際用起來怎麼樣,有沒有案例;
再深挖一下技術原理和數據來源。
這個過程,像從不同角度,找問題的答案和評價。
它給出的結論也挺清楚。專家們覺得工具挺有潛力,特别是在更新到 Gemini 2.0 Flash Thinking Experimental 模型後,規劃、搜索、推理和報告的能力都提高了不少。
專家們還説,它免費對所有人開放,這在和 ChatGPT 這些競争對手比起來,是很大優勢。不過,他們也指出了一些不足,比如:信息來源的可靠性、準确性,還有避免生成不符合事實的内容,這些地方還要改進。
但是,我個人有點遺憾的是,在實際案例這部分,它并沒有給出具體的應用例子,只是提了幾個問題。
比如:處理需要專業知識或最新信息的復雜主題時,表現怎麼樣?生成的報告準不準确、深入不深入、有沒有用?
這些問題,它都沒有回答。
還有,技術原理和數據來源這部分,也沒有給出清晰的對比。我點開它給的 9 個網站,發現确實有一些技術對比的内容,但它沒有很好地展示這些信息,感覺有點匆忙。
所以,我理解的是:後面步驟不夠細致,有些草率。
可能因為能力還有局限,特别是專家分析、實際案例部分,它應該做個表格,把幾者的對比都展示出來,這樣可以清楚地展示 Gemini 2.0 深度研究和其他深度研究能力上的對比,這樣更有説服力,也更容易理解。
第七步是:學術信息收集。
我注意到,它對學術研究特别感興趣,它搜了 27 個學術網站,想找些和深度研究有關的文獻,還有 AI 在學術界的應用信息。
但是呢,最後得出的結論太匆忙了。簡單説了兩句:開發團隊訓練的模型能很好地做計劃,還設計了個任務管理器;這些是大家一看就知道,我本來希望能看到更深入的研究結果。
比如説:
怎麼讓模型更準确?有哪些具體的改進方法?需要哪些技術能力?甚至怎麼優化架構等等。
還有,做完學術信息收集後,它突然又來了一句:之前用工具時出了語法錯誤,得修正一下,這樣才能拿到最新信息。
這讓我覺得,它在用搜索工具獲取信息時,可能還有遺漏,不夠完善;換句話説,它的表現還不穩定,甚至因為技術上的小問題,影響了最後的結果質量。
四
最後,我下載了它生成的報告,一看整整 8700 字。
不過,把不太重要的内容去掉,最核心的部分是關于用户體驗和反饋。這部分它确實做得不錯,不僅做了深入研究,還詳細列出了優點和缺點,甚至還用表格進行了對比,非常直觀。
另一部分讓我比較欣賞的是,它把自家工具和其他人工智能研究工具做了詳細的對比分析;這部分内容挺實用,能讓人清楚地看到它的優勢和不足。
至于技術分析和學術研究的部分,寫得有點太理論化了,像在堆砌術語,實際參考價值不大,讀起來像 " 八股文 " 一樣枯燥。
值得一提的是,8700 字的報告裏,一共引用了 28 個鏈接,而鏈接加起來差不多占了 1000 字的篇幅;如果除去這 1000 字,再加上報告開頭和結尾那些常規性的内容,仔細算算,真正有價值的信息還能剩下多少呢?
所以,要我評價的話,主要有三點:
1. 和國内的產品如 Kimi、Qwen、豆包、誇克相比,它絕對是領先的;它能生成這麼長的報告,還能調動多種能力,從用户體驗上來説,國内很多產品目前還做不到這一點。它的綜合表現确實更勝一籌。
2. 記憶能力和處理長文本的能力還是很強的。相比之下,國内一些產品在生成報告時,後半部分會顯得比較随意,有些草率。
當然,Gemini 的深度搜索也存在類似的問題,但沒有國内產品那麼嚴重,整體表現依然更穩定。
3. 和 Manus 相比,它在工具調用方面還有不足。Manus 能生成 PDF,可視化能力也很強。Gemini 深度搜索在這方面就顯得遜色,它最多提供一個類似 Word 文檔的檔案,裏面帶一個非常簡單的表格。
在工具調用和功能擴展上,Gemini 深度搜索顯然還有提升的空間。
值得一提的是,Gemini 本周的密集更新,無疑讓它的地位在生态系統裏變得更重要的,高頻的優化和功能擴展,也讓它在競争中占據了更有利的位置。
今年是 Agent 元年,AI 在 TOC 領網域的這波機會,它自然不能錯過;這種加速,無疑也把壓力傳給了其他競争對手。
本文來自微信公眾号:王智遠,作者:王智遠