大酷樂
  • 汽车
  • 理财
  • 军事
  • 科技
  • 游戏
  • 互联网
  • 娱乐
  • 财经
  • 科学
  • 社会
  • 亲子
  • 电影
  • 健康
  • 教育
  1. 首頁
  2. 互联网

谷歌的Deep Research效果怎么样?

2025-03-19 简体 HK SG TW

今天小编分享的互联网经验:谷歌的Deep Research效果怎么样?,欢迎阅读。

本文来自微信公众号:王智远,作者:王智远,题图来自:视觉中国

去年 12 月,谷歌推出了 Gemini Deep Research。

什么是 Deep Research?它像一个 AI 助理一样,输入一个问题,它立马能搜索、规划、推理、最后形成一个报告。

一

今年,它做了大更新。更新后能力凸显在三方面:

1. 它能帮你把一个大问题拆成几个小问题,一个一个解决;

2. 能从很多不同的地方找到信息,分析几百个来源;

3. 特别快,几分钟就能做出一个详细的报告,从计划到总结,全都有。而且,它还能处理超过 45 种语言。

官方说的是,目前免费试用,我用免费账号折腾半天不行,后来用一个 Gemini Advanced 账号,一下子就能用了。

体验地址是:https://gemini.google.com

打开 Gemini 的网页,登录后,你可以在左上角切换不同的模型,现在有五种。

2.0 Flash 适合快速回答问题,处理简单任务;2.0 Flash Thinking 能分析复杂问题;Personalization 会根据你的习惯调整回答;2.0 PRO(Experimental)是还在测试的高级版本,适合专业人士。

最后说说,它的第五个能力:Deep Research。

话不多说,直接在 Gemini Deep Research 里输入了一个问题:帮我写一个关于 Gemini Deep Research 的深度研究报告。

它很快给我拟定了一个方案。这个方案列出 7 条主要内容。每一条都很清晰,具体是这样的:

第一条,先整理 Gemini Deep Research 的官方资料。

第二条,分析这个工具可以用在哪些场景,还有它的主要特点是什么。

第三条,去找一些用户对这个工具的评价,看看大家用起来觉得哪里好、哪里不好。

第四条,收集一些专业人士的测评和分析,看看专家们是怎么评价它的。

第五条,它会找一些和 Gemini Deep Research 类似的工具,做一个对比,看看它在竞争中有什么优势或者不足;第六条,研究一些实际使用过的案例,看看这个工具在解决实际问题时表现如何。

最后一条,也就是第七条,它会深入探讨这个工具的技术原理,评估数据是否可靠、准确;同时,它还会把工具放在更大的学术背景中,看看在整个领網域里的水平如何,未来发展潜力怎么样。

方案列完后,它问我:你觉得这个方案行不行?如果觉得没问题,可以直接开始研究了。

从整个研究结构来看,它确实比我个人想得更全面。

至少它不仅提供了背景资料,还给出优劣势分析、专业人士的测评、工具对比,以及最后在更大背景下的表现评估;所以,在我看来,这更像一份简单而完整的工具测评报告。

二

我确认方案后,它便开始了工作。

一开始,它从 7 个网站中帮我查找资料,这些网站包括 ZDNet、YouTube.com、SearchEngineJournal、Google、播客,以及 WorkspaceUpdates.Google 等。

这些网站可能会提供有关 Google Gemini 的基础信息、使用教程、新闻报道或者用户支持等内容。

找资料过程中,我发现它把核心功能、关键特点、技术亮点都整理得清清楚楚。

接着,它开始了下一步:

从更多地方收集信息。它访问了 Reddit、How-To Geek、SectionSchool、Google 的官方页面,以及 SearchEngineJournal。

我觉得,这些网站选择,它主要为了获取几类不同信息。

首先是用户的讨论和评价。它想看看大家实际用起来感觉怎么样,我还随机点开了几个 Reddit 页面,发现它不仅抓取了博主写的文章内容,还提取了下面的评论。

这些评论往往是用户的真实感受,特别有参考价值。

第二类是教程和学习资料。像 How-To Geek 和 SectionSchool 这样的网站,会提供详细的使用指南或者教学资源。

第三类是官方信息;最后一类是专业分析和评价。SearchEngineJournal 这个网站专注于 SEO 和数字营销,上面有不少专业人士对工具的深入分析和评测。

所以,我认为,这一步,它想全面收集用户反馈、专业解读、使用教程和官方的公告;这样的信息组合,确实能让人从不同角度了解 Google Gemini。

然后,它总结了三个重点:

它说:我看了用户对产品的评价,发现体验各不相同。大家普遍赞赏,工具能帮他们节省时间,快速了解主题或者写个初步报告。

不过,也有人担心质量问题,工具在判断信息来源的可靠性上可能不够好,有时候,生成的信息太泛泛,不够深入。还有人提到,工具会突然中断,导致研究失败。

在比较方面,它说,有些用户把 GEMINI Deep Research 和 Perplexity、DeepSeek 做了对比。

一些人认为 Perplexity 在讲故事和挖细节上做得更好,而 DeepSeek 的新模型在研究质量和速度上表现最佳;甚至,ChatGPT 在某些情况下能提供更高质量的研究结果;这些比较显示,Deep Research 在某些方面可能还有提升的空间。

通过这一步详细拆解,我认为细节对我帮助很大。毕竟,别人对 Deep Research 的看法,是他们的本地知识,这些有助于做商业分析用。

三

第三步研究中,它开始寻找更专业的知识。

看了看它推荐的 9 个网站,发现网站和第二步里的不一样。它们更关注怎么提高工作效率的工具、人工智能研究,还有战略和市场分析这些内容。

看起来这些网站挺权威,里面有技术支持文档、新闻博客、社交讨论和专业教程,各种信息都有。

我觉得,这些网站是对之前研究的一个补充,之前分析了好坏,现在要找更专业、更深入的信息。

所以,它给我的结论是:Deep Research 功能很强,但在准确性上还得提高;还有,Gemini 2.0 的深度思考模型是个重要的更新。

接下来第四步、第五步和第六步,步骤都差不多。它找的是些专业网站。它主要关注三个方面:

专家怎么说,怎么评价;

看看实际用起来怎么样,有没有案例;

再深挖一下技术原理和数据来源。

这个过程,像从不同角度,找问题的答案和评价。

它给出的结论也挺清楚。专家们觉得工具挺有潜力,特别是在更新到 Gemini 2.0 Flash Thinking Experimental 模型后,规划、搜索、推理和报告的能力都提高了不少。

专家们还说,它免费对所有人开放,这在和 ChatGPT 这些竞争对手比起来,是很大优势。不过,他们也指出了一些不足,比如:信息来源的可靠性、准确性,还有避免生成不符合事实的内容,这些地方还要改进。

但是,我个人有点遗憾的是,在实际案例这部分,它并没有给出具体的应用例子,只是提了几个问题。

比如:处理需要专业知识或最新信息的复杂主题时,表现怎么样?生成的报告准不准确、深入不深入、有没有用?

这些问题,它都没有回答。

还有,技术原理和数据来源这部分,也没有给出清晰的对比。我点开它给的 9 个网站,发现确实有一些技术对比的内容,但它没有很好地展示这些信息,感觉有点匆忙。

所以,我理解的是:后面步骤不够细致,有些草率。

可能因为能力还有局限,特别是专家分析、实际案例部分,它应该做个表格,把几者的对比都展示出来,这样可以清楚地展示 Gemini 2.0 深度研究和其他深度研究能力上的对比,这样更有说服力,也更容易理解。

第七步是:学术信息收集。

我注意到,它对学术研究特别感兴趣,它搜了 27 个学术网站,想找些和深度研究有关的文献,还有 AI 在学术界的应用信息。

但是呢,最后得出的结论太匆忙了。简单说了两句:开发团队训练的模型能很好地做计划,还设计了个任务管理器;这些是大家一看就知道,我本来希望能看到更深入的研究结果。

比如说:

怎么让模型更准确?有哪些具体的改进方法?需要哪些技术能力?甚至怎么优化架构等等。

还有,做完学术信息收集后,它突然又来了一句:之前用工具时出了语法错误,得修正一下,这样才能拿到最新信息。

这让我觉得,它在用搜索工具获取信息时,可能还有遗漏,不够完善;换句话说,它的表现还不稳定,甚至因为技术上的小问题,影响了最后的结果质量。

四

最后,我下载了它生成的报告,一看整整 8700 字。

不过,把不太重要的内容去掉,最核心的部分是关于用户体验和反馈。这部分它确实做得不错,不仅做了深入研究,还详细列出了优点和缺点,甚至还用表格进行了对比,非常直观。

另一部分让我比较欣赏的是,它把自家工具和其他人工智能研究工具做了详细的对比分析;这部分内容挺实用,能让人清楚地看到它的优势和不足。

至于技术分析和学术研究的部分,写得有点太理论化了,像在堆砌术语,实际参考价值不大,读起来像 " 八股文 " 一样枯燥。

值得一提的是,8700 字的报告里,一共引用了 28 个链接,而链接加起来差不多占了 1000 字的篇幅;如果除去这 1000 字,再加上报告开头和结尾那些常规性的内容,仔细算算,真正有价值的信息还能剩下多少呢?

所以,要我评价的话,主要有三点:

1. 和国内的产品如 Kimi、Qwen、豆包、夸克相比,它绝对是领先的;它能生成这么长的报告,还能调动多种能力,从用户体验上来说,国内很多产品目前还做不到这一点。它的综合表现确实更胜一筹。

2. 记忆能力和处理长文本的能力还是很强的。相比之下,国内一些产品在生成报告时,后半部分会显得比较随意,有些草率。  

当然,Gemini 的深度搜索也存在类似的问题,但没有国内产品那么严重,整体表现依然更稳定。

3. 和 Manus 相比,它在工具调用方面还有不足。Manus 能生成 PDF,可视化能力也很强。Gemini 深度搜索在这方面就显得逊色,它最多提供一个类似 Word 文档的檔案,里面带一个非常简单的表格。

在工具调用和功能扩展上,Gemini 深度搜索显然还有提升的空间。

值得一提的是,Gemini 本周的密集更新,无疑让它的地位在生态系统里变得更重要的,高频的优化和功能扩展,也让它在竞争中占据了更有利的位置。

今年是 Agent 元年,AI 在 TOC 领網域的这波机会,它自然不能错过;这种加速,无疑也把压力传给了其他竞争对手。

本文来自微信公众号:王智远,作者:王智远

熱門排行
  • 王治郅:杨瀚森主要的问题是速度 他的速度跟不上现代篮球的节奏 王治郅:杨瀚森主要的问题是速度 他的速度跟 郟君昊 | 2025-05-05
  • 贸易战烧进电影院:特朗普拟重税打击外国电影 逼好莱坞等回美拍片 贸易战烧进电影院:特朗普拟重税打击外国电影 習又夏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 寸飛蘭 | 2025-05-05
  • 手机电池突破8000mAh?硅碳技术的回旋镖:「折寿」换容量 手机电池突破8000mAh?硅碳技术的回旋镖:「折 衛青柏 | 2025-05-05
  • 贷款追高炒黄金的人后悔了!有人一天亏掉6年工资,卖掉舍不得,不卖扛不住 贷款追高炒黄金的人后悔了!有人一天亏掉6年 繁綺文 | 2025-05-05
  • 任天堂对Genki提起Switch 2商标侵权诉讼,后者回应称将严肃对待 任天堂对Genki提起Switch 2商标侵权诉讼,后 郜萌運 | 2025-05-05
  • 哪吒汽车APP和官网恢复正常 知情人士:之前断网因流量欠费 哪吒汽车APP和官网恢复正常 知情人士:之前断 袁曼雁 | 2025-05-05
  • 极越汽车 CEO 夏一平名下青岛/义乌两家公司被列入经营异常 极越汽车 CEO 夏一平名下青岛/义乌两家公司 集玲琳 | 2025-05-05
  • 全国经济第一大省明确,推动组建农商联合银行 全国经济第一大省明确,推动组建农商联合银行 佼昌翰 | 2025-05-05
  • 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩更专注进球&更像C罗 桑保利:亚马尔有配合意识&有点像梅西 姆巴佩 甄正浩 | 2025-05-05
  • 高露现身上海虹桥机场 黑色外套点缀亮色爱心装饰俏皮亮眼 高露现身上海虹桥机场 黑色外套点缀亮色爱 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:处理器更新为天玑9200+ 安卓最强芯 vivo X90S曝光:处理器更新为天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懒癌”发病率上升,定期体检别忽视 “懒癌”发病率上升,定期体检别忽视 幸聽楓 | 2023-05-02
  • 宋慧乔获百想视后 韩素希发图手动加爱心表情庆祝 宋慧乔获百想视后 韩素希发图手动加爱心表 賁芳蕤 | 2023-05-02
  • 曹操墓,里面都有啥? 曹操墓,里面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他们终于要HE! 十年了,他们终于要HE! 惠惠君 | 2023-05-07
  • 中央部署经济工作,释放5大信号 中央部署经济工作,释放5大信号 郜萌運 | 2023-05-02
  • 高德上线手机弯道会车预警功能 高德上线手机弯道会车预警功能 習又夏 | 2023-05-02
  • 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露面 陈自瑶抱病为爱女做蛋糕庆生,王浩信点赞没露 賁芳蕤 | 2023-05-02
  • 等比例长大的童星,李兰迪算一个 等比例长大的童星,李兰迪算一个 郟君昊 | 2023-05-02
  • 这些被抓来做实验的流浪狗,最终拯救了无数糖尿病人 这些被抓来做实验的流浪狗,最终拯救了无数糖 集玲琳 | 2023-05-02
  • 高端国产车:军车血统,目前电动车越野的“天花板”? 高端国产车:军车血统,目前电动车越野的“天花 謝飛揚 | 2023-05-02
  • 《云襄传》终于抬上来啦,男O女A让人好上头! 《云襄传》终于抬上来啦,男O女A让人好上头! 集玲琳 | 2023-05-02
  • 21家A股游戏公司2022年收入651亿 今年“游戏+AI”能否逆风翻盘? 21家A股游戏公司2022年收入651亿 今年“游 衛青柏 | 2023-05-04
  • 信用风险释放趋缓,结构性风险需重点关注 ——2023年一季度债市信用风险回顾与下阶段展望 信用风险释放趋缓,结构性风险需重点关注 — 袁曼雁 | 2023-05-02
  • 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15日 与周立波夫妇闹纠纷成老赖,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 普京签署总统令,批准对俄刑法典相关法条的修正案 普京签署总统令,批准对俄刑法典相关法条的修 集玲琳 | 2023-05-02
  • 解除资格!停止一切合作 解除资格!停止一切合作 佼昌翰 | 2023-05-02
  • 中银证券给予南京银行增持评级 中银证券给予南京银行增持评级 袁曼雁 | 2023-05-03
  • 3699起 联想小新mini主机上架 13代酷睿标压处理器 3699起 联想小新mini主机上架 13代酷睿标压 習又夏 | 2023-05-05
  • 前董事长被免,天山生物全面进入“中植系”时代?股价曾在一月内暴涨超400% 前董事长被免,天山生物全面进入“中植系”时 惠惠君 | 2023-05-02
  • 疯成这样,怎么还能被全网吹捧? 疯成这样,怎么还能被全网吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 狂吼11次“让一下”!交警咆哮开道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收购美国第一共和银行 摩根大通收购美国第一共和银行 謝飛揚 | 2023-05-02
  • 台剧赢麻了,又来一部8.9 台剧赢麻了,又来一部8.9 衛青柏 | 2023-05-02
  • 事关农村土地承包和农民权益,《农村土地承包合同管理办法》5月1日起施行 事关农村土地承包和农民权益,《农村土地承包 郟君昊 | 2023-05-02
  • 下降45分,上涨35分!34所自划线院校复试分数线涨幅汇总 下降45分,上涨35分!34所自划线院校复试分数线 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好这件事是关键 "三高"已盯上青少年,做好这件事是关键 習又夏 | 2023-05-05
  • 五一档没一个能打的 五一档没一个能打的 集玲琳 | 2023-05-05
  • 恐怖韩剧下神坛,这次胆小可入 恐怖韩剧下神坛,这次胆小可入 袁曼雁 | 2023-05-05
  • 这剧是不是用ChatGPT写的呀? 这剧是不是用ChatGPT写的呀? 惠惠君 | 2023-05-02
  • 200户连夜疏散,原因让人愤怒!“损失超一亿”,官方通报 200户连夜疏散,原因让人愤怒!“损失超一亿”, 袁曼雁 | 2023-05-03
  • 性骚扰惯犯,滚出娱乐圈 性骚扰惯犯,滚出娱乐圈 謝飛揚 | 2023-05-05
  • 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的生活》证实将停办 48岁何炅自曝已老花眼,黄磊睡前认老,《向往的 佼昌翰 | 2023-05-02
  • 一个《长月烬明》倒了,《狐妖》《长相思》《与凤行》…在路上了 一个《长月烬明》倒了,《狐妖》《长相思》《 惠惠君 | 2023-05-02
  • 张天爱假期晒“酷”存照 卷发披肩穿黑色吊带裙大秀好身材 张天爱假期晒“酷”存照 卷发披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 当年轻人开始不随份子钱 当年轻人开始不随份子钱 袁曼雁 | 2023-05-02
  • 毕滢用8年时间成功逼宫?曾被传已婚生子的她,不容小觑 毕滢用8年时间成功逼宫?曾被传已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧乔获视后首次晒照,拿奖杯笑容温柔 宋慧乔获视后首次晒照,拿奖杯笑容温柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們