大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

谷歌的Deep Research效果怎麼樣?

2025-03-19 简体 HK SG TW

今天小編分享的互聯網經驗:谷歌的Deep Research效果怎麼樣?,歡迎閱讀。

本文來自微信公眾号:王智遠,作者:王智遠,題圖來自:視覺中國

去年 12 月,谷歌推出了 Gemini Deep Research。

什麼是 Deep Research?它像一個 AI 助理一樣,輸入一個問題,它立馬能搜索、規劃、推理、最後形成一個報告。

一

今年,它做了大更新。更新後能力凸顯在三方面:

1. 它能幫你把一個大問題拆成幾個小問題,一個一個解決;

2. 能從很多不同的地方找到信息,分析幾百個來源;

3. 特别快,幾分鍾就能做出一個詳細的報告,從計劃到總結,全都有。而且,它還能處理超過 45 種語言。

官方說的是,目前免費試用,我用免費賬号折騰半天不行,後來用一個 Gemini Advanced 賬号,一下子就能用了。

體驗地址是:https://gemini.google.com

打開 Gemini 的網頁,登錄後,你可以在左上角切換不同的模型,現在有五種。

2.0 Flash 适合快速回答問題,處理簡單任務;2.0 Flash Thinking 能分析復雜問題;Personalization 會根據你的習慣調整回答;2.0 PRO(Experimental)是還在測試的高級版本,适合專業人士。

最後說說,它的第五個能力:Deep Research。

話不多說,直接在 Gemini Deep Research 裡輸入了一個問題:幫我寫一個關于 Gemini Deep Research 的深度研究報告。

它很快給我拟定了一個方案。這個方案列出 7 條主要内容。每一條都很清晰,具體是這樣的:

第一條,先整理 Gemini Deep Research 的官方資料。

第二條,分析這個工具可以用在哪些場景,還有它的主要特點是什麼。

第三條,去找一些用戶對這個工具的評價,看看大家用起來覺得哪裡好、哪裡不好。

第四條,收集一些專業人士的測評和分析,看看專家們是怎麼評價它的。

第五條,它會找一些和 Gemini Deep Research 類似的工具,做一個對比,看看它在競争中有什麼優勢或者不足;第六條,研究一些實際使用過的案例,看看這個工具在解決實際問題時表現如何。

最後一條,也就是第七條,它會深入探讨這個工具的技術原理,評估數據是否可靠、準确;同時,它還會把工具放在更大的學術背景中,看看在整個領網域裡的水平如何,未來發展潛力怎麼樣。

方案列完後,它問我:你覺得這個方案行不行?如果覺得沒問題,可以直接開始研究了。

從整個研究結構來看,它确實比我個人想得更全面。

至少它不僅提供了背景資料,還給出優劣勢分析、專業人士的測評、工具對比,以及最後在更大背景下的表現評估;所以,在我看來,這更像一份簡單而完整的工具測評報告。

二

我确認方案後,它便開始了工作。

一開始,它從 7 個網站中幫我查找資料,這些網站包括 ZDNet、YouTube.com、SearchEngineJournal、Google、播客,以及 WorkspaceUpdates.Google 等。

這些網站可能會提供有關 Google Gemini 的基礎信息、使用教程、新聞報道或者用戶支持等内容。

找資料過程中,我發現它把核心功能、關鍵特點、技術亮點都整理得清清楚楚。

接着,它開始了下一步:

從更多地方收集信息。它訪問了 Reddit、How-To Geek、SectionSchool、Google 的官方頁面,以及 SearchEngineJournal。

我覺得,這些網站選擇,它主要為了獲取幾類不同信息。

首先是用戶的讨論和評價。它想看看大家實際用起來感覺怎麼樣,我還随機點開了幾個 Reddit 頁面,發現它不僅抓取了博主寫的文章内容,還提取了下面的評論。

這些評論往往是用戶的真實感受,特别有參考價值。

第二類是教程和學習資料。像 How-To Geek 和 SectionSchool 這樣的網站,會提供詳細的使用指南或者教學資源。

第三類是官方信息;最後一類是專業分析和評價。SearchEngineJournal 這個網站專注于 SEO 和數字營銷,上面有不少專業人士對工具的深入分析和評測。

所以,我認為,這一步,它想全面收集用戶反饋、專業解讀、使用教程和官方的公告;這樣的信息組合,确實能讓人從不同角度了解 Google Gemini。

然後,它總結了三個重點:

它說:我看了用戶對產品的評價,發現體驗各不相同。大家普遍贊賞,工具能幫他們節省時間,快速了解主題或者寫個初步報告。

不過,也有人擔心質量問題,工具在判斷信息來源的可靠性上可能不夠好,有時候,生成的信息太泛泛,不夠深入。還有人提到,工具會突然中斷,導致研究失敗。

在比較方面,它說,有些用戶把 GEMINI Deep Research 和 Perplexity、DeepSeek 做了對比。

一些人認為 Perplexity 在講故事和挖細節上做得更好,而 DeepSeek 的新模型在研究質量和速度上表現最佳;甚至,ChatGPT 在某些情況下能提供更高質量的研究結果;這些比較顯示,Deep Research 在某些方面可能還有提升的空間。

通過這一步詳細拆解,我認為細節對我幫助很大。畢竟,别人對 Deep Research 的看法,是他們的本地知識,這些有助于做商業分析用。

三

第三步研究中,它開始尋找更專業的知識。

看了看它推薦的 9 個網站,發現網站和第二步裡的不一樣。它們更關注怎麼提高工作效率的工具、人工智能研究,還有戰略和市場分析這些内容。

看起來這些網站挺權威,裡面有技術支持文檔、新聞博客、社交讨論和專業教程,各種信息都有。

我覺得,這些網站是對之前研究的一個補充,之前分析了好壞,現在要找更專業、更深入的信息。

所以,它給我的結論是:Deep Research 功能很強,但在準确性上還得提高;還有,Gemini 2.0 的深度思考模型是個重要的更新。

接下來第四步、第五步和第六步,步驟都差不多。它找的是些專業網站。它主要關注三個方面:

專家怎麼說,怎麼評價;

看看實際用起來怎麼樣,有沒有案例;

再深挖一下技術原理和數據來源。

這個過程,像從不同角度,找問題的答案和評價。

它給出的結論也挺清楚。專家們覺得工具挺有潛力,特别是在更新到 Gemini 2.0 Flash Thinking Experimental 模型後,規劃、搜索、推理和報告的能力都提高了不少。

專家們還說,它免費對所有人開放,這在和 ChatGPT 這些競争對手比起來,是很大優勢。不過,他們也指出了一些不足,比如:信息來源的可靠性、準确性,還有避免生成不符合事實的内容,這些地方還要改進。

但是,我個人有點遺憾的是,在實際案例這部分,它并沒有給出具體的應用例子,只是提了幾個問題。

比如:處理需要專業知識或最新信息的復雜主題時,表現怎麼樣?生成的報告準不準确、深入不深入、有沒有用?

這些問題,它都沒有回答。

還有,技術原理和數據來源這部分,也沒有給出清晰的對比。我點開它給的 9 個網站,發現确實有一些技術對比的内容,但它沒有很好地展示這些信息,感覺有點匆忙。

所以,我理解的是:後面步驟不夠細致,有些草率。

可能因為能力還有局限,特别是專家分析、實際案例部分,它應該做個表格,把幾者的對比都展示出來,這樣可以清楚地展示 Gemini 2.0 深度研究和其他深度研究能力上的對比,這樣更有說服力,也更容易理解。

第七步是:學術信息收集。

我注意到,它對學術研究特别感興趣,它搜了 27 個學術網站,想找些和深度研究有關的文獻,還有 AI 在學術界的應用信息。

但是呢,最後得出的結論太匆忙了。簡單說了兩句:開發團隊訓練的模型能很好地做計劃,還設計了個任務管理器;這些是大家一看就知道,我本來希望能看到更深入的研究結果。

比如說:

怎麼讓模型更準确?有哪些具體的改進方法?需要哪些技術能力?甚至怎麼優化架構等等。

還有,做完學術信息收集後,它突然又來了一句:之前用工具時出了語法錯誤,得修正一下,這樣才能拿到最新信息。

這讓我覺得,它在用搜索工具獲取信息時,可能還有遺漏,不夠完善;換句話說,它的表現還不穩定,甚至因為技術上的小問題,影響了最後的結果質量。

四

最後,我下載了它生成的報告,一看整整 8700 字。

不過,把不太重要的内容去掉,最核心的部分是關于用戶體驗和反饋。這部分它确實做得不錯,不僅做了深入研究,還詳細列出了優點和缺點,甚至還用表格進行了對比,非常直觀。

另一部分讓我比較欣賞的是,它把自家工具和其他人工智能研究工具做了詳細的對比分析;這部分内容挺實用,能讓人清楚地看到它的優勢和不足。

至于技術分析和學術研究的部分,寫得有點太理論化了,像在堆砌術語,實際參考價值不大,讀起來像 " 八股文 " 一樣枯燥。

值得一提的是,8700 字的報告裡,一共引用了 28 個鏈接,而鏈接加起來差不多占了 1000 字的篇幅;如果除去這 1000 字,再加上報告開頭和結尾那些常規性的内容,仔細算算,真正有價值的信息還能剩下多少呢?

所以,要我評價的話,主要有三點:

1. 和國内的產品如 Kimi、Qwen、豆包、誇克相比,它絕對是領先的;它能生成這麼長的報告,還能調動多種能力,從用戶體驗上來說,國内很多產品目前還做不到這一點。它的綜合表現确實更勝一籌。

2. 記憶能力和處理長文本的能力還是很強的。相比之下,國内一些產品在生成報告時,後半部分會顯得比較随意,有些草率。  

當然,Gemini 的深度搜索也存在類似的問題,但沒有國内產品那麼嚴重,整體表現依然更穩定。

3. 和 Manus 相比,它在工具調用方面還有不足。Manus 能生成 PDF,可視化能力也很強。Gemini 深度搜索在這方面就顯得遜色,它最多提供一個類似 Word 文檔的檔案,裡面帶一個非常簡單的表格。

在工具調用和功能擴展上,Gemini 深度搜索顯然還有提升的空間。

值得一提的是,Gemini 本周的密集更新,無疑讓它的地位在生态系統裡變得更重要的,高頻的優化和功能擴展,也讓它在競争中占據了更有利的位置。

今年是 Agent 元年,AI 在 TOC 領網域的這波機會,它自然不能錯過;這種加速,無疑也把壓力傳給了其他競争對手。

本文來自微信公眾号:王智遠,作者:王智遠

熱門排行
  • 王治郅:楊瀚森主要的問題是速度 他的速度跟不上現代籃球的節奏 王治郅:楊瀚森主要的問題是速度 他的速度跟 郟君昊 | 2025-05-05
  • 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 逼好萊塢等回美拍片 貿易戰燒進電影院:特朗普拟重稅打擊外國電影 習又夏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 寸飛蘭 | 2025-05-05
  • 手機電池突破8000mAh?矽碳技術的回旋镖:「折壽」換容量 手機電池突破8000mAh?矽碳技術的回旋镖:「折 衛青柏 | 2025-05-05
  • 貸款追高炒黃金的人後悔了!有人一天虧掉6年工資,賣掉舍不得,不賣扛不住 貸款追高炒黃金的人後悔了!有人一天虧掉6年 繁綺文 | 2025-05-05
  • 任天堂對Genki提起Switch 2商标侵權訴訟,後者回應稱将嚴肅對待 任天堂對Genki提起Switch 2商标侵權訴訟,後 郜萌運 | 2025-05-05
  • 哪吒汽車APP和官網恢復正常 知情人士:之前斷網因流量欠費 哪吒汽車APP和官網恢復正常 知情人士:之前斷 袁曼雁 | 2025-05-05
  • 極越汽車 CEO 夏一平名下青島/義烏兩家公司被列入經營異常 極越汽車 CEO 夏一平名下青島/義烏兩家公司 集玲琳 | 2025-05-05
  • 全國經濟第一大省明确,推動組建農商聯合銀行 全國經濟第一大省明确,推動組建農商聯合銀行 佼昌翰 | 2025-05-05
  • 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩更專注進球&更像C羅 桑保利:亞馬爾有配合意識&有點像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們