今天小编分享的科技经验:百度搜索接入DeepSeek!打不过就加入?其实意在AI搜索,欢迎阅读。
搜索引擎要被 DeepSeek 革命?
继华为、OPPO、TCL、吉利、机械革命等各行各业玩家接连接入 DeepSeek-R1 模型之后,微信、纳米 AI 搜索、QQ 浏览器、百度搜索、腾讯元宝等即时通讯軟體、搜索引擎、AI 工具,也陆续接入了 DeepSeek-R1 模型。2 月 16 日晚,百度搜索官方表示,为丰富多元化搜索体验,将全面接入 DeepSeek 和文心大模型的最新深度搜索功能。
(图源:微信公众号截图)
DeepSeek-R1 的到来,打破了国内 AI 行业原有的局面,不仅大语言模型领網域积累较弱的手机、家电、PC、汽车厂商接入该模型,就连已经开发出 AI 大模型的腾讯、360 等互联网企业,也在为自家的 AI 工具接入 DeepSeek-R1,而且在更强算力规模的支持下, 体验比 DeepSeek 官方平台更胜一筹。
其中尤为引发行业震荡的是百度搜索,毕竟百度一度被视作中国 AI 产业的 " 扛旗者 ",早在 2013 年甚至更早百度就在探索深度学习 AI,多年来在 AI 技术上持续进行战略押注,号称在 AI 上已投资千亿。如今百度搜索接入 DeepSeek,是 " 打不过就加入 ",还是另有所图?
网站流量分析机构 Statcounter 统计数据显示,2015 年到 2023 年,谷歌在搜索引擎领網域几乎处于垄断地位,份额始终维持在 90% 以上,但 2024 年的最后三个月,谷歌的市场份额却分别为 89.34%、89.99%、89.73%。这种趋势意味着其他搜索引擎,尤其是正在兴起的 AI 搜索工具,已对谷歌造成了不小的压力。
传统的搜索引擎在我们查询信息时,会筛选出相关的网址链接,并按照相关性、发布时间等规则排列,但具体内容如何、是否属于标题党,还要我们进入网址之后才能得知。
(图源:百度 AI 搜索截图)
小雷经常需要搜索某类产品的销量数据或者查证一些消息的真实性,可许多媒体在报道时会隐去具体来源,导致小雷需要花费大量时间在众多链接中查找有效信息。搜索引擎的广告付费排名问题,对于用户更是堪称折磨,严重影响了我们寻找有效信息的效率。
任何带有联网功能的 AI 应用,广义上都属于 AI 搜索工具。AI 搜索工具可以快速从大量信息中筛选出有效信息,总结归纳后直接展现在用户眼前,而且基本会告知信息来源,还会附上网址链接,便于用户求证和查看完整信息。相较于传统搜索引擎,AI 搜索能够主动总结查询信息的重点内容,不再需要用户一个个点开链接查看、对比各方信息,大幅提升了查找信息的效率。
为进一步提升用户的搜索体验,AI 企业除了投入巨资训练 AI 大模型,还在尝试为 AI 搜索工具加入更多技能和高质量信息源。如微信新增的 AI 搜索功能,关联了公众号的文章,生成的内容还可以一键发送给微信好友或转发至朋友圈。腾讯元宝同样加入了该功能,也可以快捷分享至微信好友、朋友圈、QQ 好友、QQ 空间、企业微信。
(左:微信,右:腾讯元宝;图源:App 截图)
AI 搜索工具无疑对传统搜索引擎造成了降维打击,而身为国内搜索领網域领头羊的百度,自然率先感受到了压力,并选择积极拥抱 AI,于 2024 年 4 月 26 日正式上线了百度 AI 助手,将搜索、大模型、智能体相互连接,以满足用户多样化的搜索需求。
当前我们使用百度搜索引擎查找某些信息时,便能够看到百度 AI 搜索给出的答案,无需再点进网址查看,减少了一个步骤。百度 AI 搜索也会提供信息来源的网址,方便用户查看完整内容。
(图源:百度 AI 搜索)
然而面对 AI 搜索,网友们依然抽成了三个派别,部分网友支持 AI 搜索,认为它让自己的工作、学习、生活更加方便;另一部分网友声称 AI 搜索准确性不佳,可能会出现某些事实性错误;最后一部分网友则属于中立派,使用 AI 搜索功能的同时,也会去验证 AI 搜索生成信息的准确性。
AI 搜索好用但并不完美,百度为 AI 搜索引入文心和 DeepSeek 的深度搜索功能,目的或许就在于提高生成内容的准确性。
作为一名媒体工作者,小雷经常使用 AI 搜索查找各种数据,遇到 AI 幻觉的情况不在少数。例如小雷打开了联网搜索功能并搜索 "2024 年中国手机销量数据 " 时,DeepSeek-R1(腾讯元宝提供的服务)居然告知小雷现在是 2023 年 10 月,所以没有相关的数据。这种情况通常被称为 "AI 幻觉 ",指 AI 生成的内容与事实严重不符或存在逻辑错误。
(图源:腾讯元宝截图)
为更直观展现 AI 幻觉问题,小雷对目前国内使用人数较多的六个 AI 大模型做了一个简单的 " 草莓测试 ",即向 AI 提问,Strawberry 一词中有多少个字母 "r"?相信看到这个问题的小伙伴没有一个会回答错误,但 AI 给出的答案却令小雷瞠目结舌。
在小雷测试的腾讯元宝、豆包、百度 AI 搜索、Kimi、通义千问、纳米 AI 搜索等工具中,只有腾讯元宝的混元大模型和 Kimi 的 k1.5 模型回答正确,其他所有大模型全部回答错误。最离谱的是豆包生成的答案,虽然指出了 Strawberry 的第三、第八、第九个字母是 "r",给出的答案却依然是 Strawberry 只有两个字母 "r"。
(从左到右依次为:腾讯元宝、豆包、百度 AI 搜索、Kimi、通义千问、纳米 AI 搜索;图源:App 截图)
而小雷将纳米 AI 搜索的模型从智腦(360gpt- Pro)切换至 DeepSeek-R1 后,该模型回答出了正确答案,并指出单词结尾的两个 "r" 会被误认为只有一个。
(图源:纳米 AI 搜索截图)
小雷在多次测试后发现,相较于一个多月前,AI 大模型产生 AI 幻觉的可能性已明显降低,查询部分信息时会告知用户尚无该数据,而非继续编造数据,但偶尔仍会出现 AI 幻觉。AI 幻觉的存在,让小雷无法完全相信 AI 搜索给出的数据,因而经常需要进入网址查看,并搜索其他文章,通过对比确定信息的真实性。
AI 企业也在通过各种方案降低产生 AI 幻觉的概率,例如加入 RAG 技术(检索增强生成技术),让 AI 大模型与高质量知识库挂接,在生成内容前先对照知识库的准确数据。通过架构优化提升 AI 大模型的长序列处理能力,同样可以达到减少 AI 幻觉的作用。
OpenAI 工作人员提出了一种过程监督机制,在 AI 大模型推理问题时,每个正确步骤均给出自我奖励,优化思维链,而非回答正确结果时才给出自我奖励。
多个大模型生成的内容互相验证(模型对模型评估),也是降低 AI 幻觉的有效方法。如纳米 AI 搜索就推出了多模型协作方案,通过文心一言、智腦、豆包三个大模型协作,成功计算出了 Strawberry 单词中字母 "r" 的数量。
总而言之,AI 幻觉暂时只能通过优化训练方式、思维链、大模型架构等方案减少产生的概率,无法彻底消除。AI 幻觉的存在会降低 AI 搜索生成内容的准确性,在生成内容后,用户最好进入 AI 给出的链接,确认信息的可靠度。
百度为 AI 搜索接入 DeepSeek,目的或许就是借助 R1、V3 等模型的能力,通过深度思考,与文心大模型互相验证,降低产生幻觉的概率。
AI 搜索大势渐成,将逐渐取代传统搜索模式。尽管 AI 幻觉依旧存在,可能会出现数据虚假的情况,但 AI 企业正在通过各种方式减少产生 AI 幻觉的可能。而在诸多方案中,多模型互相验证无疑是最简单有效的方法之一。
国内搜索引擎领網域的王者百度,将通过 DeepSeek 和文心的深度思考能力,提高 AI 搜索生成内容的准确性,360 同样打造出了多模型协作功能,以提高推理能力。有百度、360 打头阵,预计未来会有更多 AI 搜索工具选择此方案。
(图源:百度截图)
采用 MIT 協定及类 OpenRAIL 授权方式开源的 DeepSeek,允许第三方自由使用其代码,且可以修改、复制、分发,在开源大模型中也是开放性最高的一批。凭借出色的推理能力和开源模式,DeepSeek 已然成为国内 AI 企业合作的主要对象。
当初安卓能够战胜 iOS 之外的其他作業系統,开放性正是原因之一。DeepSeek 的开源模式或将让其成为 AI 领網域的谷歌,将 R1、V3 及未来训练出的开源模型打造成 AI 领網域的安卓,不仅是家电、手机厂商快速为设备加入 AI 功能的最佳选择,还将成为其他 AI 企业实现模型对模型评估的首选。
即将免费服务、开源大模型的文心一言,引入 DeepSeek 的深度思考能力之后,能够提升 AI 搜索生成内容的质量,从而奠定在搜索领網域的地位。百度的影响力也将对 DeepSeek 起到加持效果,增加用户体验 DeepSeek-R1 模型的机会。AI 领網域冉冉升起的新星 DeepSeek 与搜索领網域的老牌王者百度,在 AI 搜索时代将互相成就,向成为与谷歌比肩的全球互联网巨头迈进。
不过,正如雷科技创始人罗超所言:AI 搜索目前只是 "L3 级自动驾驶 " 的感觉,也就是还是需要人 " 接管 " 的,因为 " 幻觉 " 的存在,AI 搜索给出的答案正确与否未知,用户往往还需要去搜索引擎里面再检验一下——有不少网友吐槽被 DeepSeek 错误答案带到沟里了。
只要 AI 搜索准确率没有几个 9(比如 99.9999%),传统搜索引擎就还有存在价值,实际上,在使用传统搜索引擎中,人的判断力是至关重要的。人的大腦想要不退化,AI 时代也须还是要去做判断的,不能什么都用 AI 给的,否则这跟咸鱼有什么区别呢?