今天小编分享的互联网经验:成立一年估值5亿,Perplexity如何改变搜索方式?,欢迎阅读。
图片来源 @视觉中国
文 | 读懂财经
曾经,很多人以为,ChatGPT 的横空出世,就几乎等于敲响搜索的丧钟。
这样的说法在当时不在少数。按前谷歌第 23 位员工、Gmail 的创建者之一 Paul Buchheit 的说法,ChatGPT 将摧毁谷歌,就像当年搜索引擎彻底干掉黄页电话簿一样。
一年时间过去了,AI 大模型替代搜索的进程,远没有大家想象的那般顺利。但一切并非毫无意义。随着 Perplexity 等 AI 搜索产品的涌现,也让我们对 AI 给搜索行业带来的变化有了更加清晰的认识:
首先,与传统搜索引擎相比,AI 搜索让信息的颗粒度从网页细化到信息本身,进而提升了信息获取的效率。这是 AI 搜索最大的价值。
其次,作为一款 AI 套壳产品,像 Perplexity 等产品的成功在于,实现了单点的价值创造和体验优化,更是一次 AI 工程化层面的胜利。
第三,像 Perplexity 这样的 AI 搜索,目前更多集中在知识等小众领網域,距离替代谷歌成为通用搜索引擎仍然有很长的距离要走。
尽管当下 AI 搜索替代谷歌几无可能,但长期并非毫无可能。从过去科技的演进看,新技术对老技术的替代,往往是以意想不到的颠覆形式完成的。正如谁能想到如今拥有上亿用户的快手,当初只是一个做 GIF 的工具。变化与未知,就是新技术的魅力。
比搜索更精准是如何做到的?
在 AI 搜索的赛道,Perplexity 是绝对的明星。公司创始人 Aravind Srinivas 来自 OpenAI,2022 年 8 月创立了 Perplexity。2023 年 10 月,公司完成了新一轮融资,估值达到 5 亿美元。
与其说,Perplexity 是一个搜索引擎,倒不如说是答案引擎。当用户向 Perplexity 输入问题并点击搜索后,你能得到一个回答。比如,当你向 Perplexity 提问 " 蜡笔小新是谁 ",会得到 Perplexity 的相应回答。
这个答案是通过网上已有的信息总结提炼而来。在回答栏目的上方,Perplexity 还会给出参考内容的来源,并支持点击。在回答的下方,Perplexity 预测了几个用户可能会追问的问题,点击后页面继续向下展开对于该问题的答案,用户也可以自行进行提问。
此外,在回答栏目的侧边,用户还可以搜索相关主题的图片和视频。
Perplexity 不仅能够回答简单问题,还能理解用户一些比较复杂的问题,比如当用户就 " 生成式 AI 与过去的 AI 相比有哪些不同和特点 " 进行提问时,Perplexity 也能进行回答。
但不足的地方是,在 " 生成式 AI 与过去的 AI 相比有哪些不同和特点 " 问题来说,Perplexity 推荐的视频和主题关系并不大。也就是说,在复杂问题从文字向更多模态转化过程中,搜索内容的效率有比较大的下降。
看上去,AI 搜索更像是传统搜索引擎的一次更新,即从过去的单边的信息查询和 SEO 策略优化,转变成双边的信息互動。
过去的传统搜索引擎的工作流程是,基于用户搜索的内容,对相关内容进行索引并创建搜索索引,所谓的索引,可以理解为内容过滤后,一个与搜索内容有关,且包含页面及其内容和排名信息的数据库。然后再对索引中的页面使用各种算法进行排名,进而给出搜索结果。
相比之下,Perplexity 比搜索引擎额外多做了几件事。在搜索前,Perplexity 会通过大模型,重新理解用户提出的问题,然后解析为一个更清晰的搜索指令。接下来,调用 Google、Bing 等搜索引擎的 API 创建相应的索引库,然后用自有的排序算法,对所有的搜索结果做重新排序,筛选出数量不等且高质量的网页。最后,让大模型阅读筛选出来的内容并输出和问题相关的答案,以及可能用到的问题。
也就是说,相比搜索引擎做的是信息相关度的匹配,而 Perplexity 是在此基础上做了更多理解指令上的工作,进而让搜索结果更接近用户想要的东西。
搜索效率更新的背后,是搜索颗粒度的细化。在互联网时代,搜索引擎将信息以网页为最小粒度为用户进行排序和推荐。而大模型能够学习所有 Google 上能得到的信息,并将知识以词汇为最小粒度生成相应的内容。
Perplexity 破局的启示
听起来,Perplexity 所做的事情很简单,就是在原有搜索引擎基础上加入了大模型的自然语言理解和生成丰富回答能力。那么,是不是意味着所有大模型企业也可以做?
其实并非如此。曾经在很多人看来,生成式 AI 可能会取代传统搜索引擎,但用大模型直接进行搜索也会出现很多问题。
比方说,生成式 AI 无法做到实时更新,且受限于训练数据,可能无法覆盖相对小众、缺乏通用性的长尾知识。同时,生成式 AI 对生成内容的可控性较差,存在 " 幻觉 " 问题,用户也难以对答案进行直接验证。
Perplexity 所做的事情就是,把这些大模型搜索过程中出现的 " 坑 " 一个个都填掉,其中最重要的事情就是信息的实时性和准确性。
实时性方面,与 ChatGPT 等大模型依赖训练时的数据和语料获取信息不同,Perplexity 基于底层传统搜索引擎开发而得,能够及时抓取最新的信息。
准确性方面,Perplexity 做了两件事情:减轻幻觉和内容溯源。为了减少幻觉现象,Perplexity 引入了 RAG 技术(检索增强生成),RAG 的作用好比是给模型提供一本教科书,让它根据特定的问题去查找信息,通过关联外部知识来提高答案的准确性,有效减少了语言模型中出现的虚假信息,使得生成的回答更准确可信。
与此同时,Perplexity 还对生成的每一句话都附有引用链接,在保证可靠性的同时便于用户溯源或深入研究。
不仅如此,Perplexity 还对召回和排序环节的算法做了创新,保证内容的有用性及引用的精确程度。其中," 召回 " 指根据搜索指令从数据库中获取尽可能多的正确结果," 排序 " 指根据用户搜索内容的相关性对召回结果进行排序,决定了搜索引擎的精确程度和性能上限。
来源:中金研究部
这也让 Perplexity 成为当下综合性能最好的 AI 搜索引擎。在 2023 年 4 月的论文中,斯坦福的研究人员对 YouChat、Perplexity.AI、NeevaAI 及 BingChat 四个生成式搜索引擎进行了人工评估。结果显示,Perplexity.ai 生成内容有用性的评分为 4.56 分,排名第二;引文召回率和精确度为 68.7,排名第一;在泛搜索引擎类的体验中,综合能力位于最前列。
除了在信息准确、可靠上,Perplexity 在响应速度上也花了很多功夫。比如,Perplexity 通过自研推理堆栈,让其内容生成速度快于 GPT 类通用模型。在模型侧,公司对 GPT-3.5 进行微调,在降低成本的同时进一步提升响应速度。
Perplexity 的成功,也给了那些苦苦探索 AI 大模型落地的创业者一些启示:比起模型能力,产品本身单点的价值创造和体验的优化,是一个更为重要的事情。
替代谷歌言之过早
从数据上看,自产品发布以来,Perplexity 的成绩着实不错。
根据 Similar Web 数据,截至 2023 年 10 月 25 日,Perplexity APP 的日度下载量为 14,163 次;2023 年 2 月 1 日至 10 月 25 日,Perplexity 网页端的周度访问量由 275 万增加至 1,113 万,增长 3 倍,与同类别的 AI 搜索应用 YouChat 相比增长势头强劲。
尽管 Perplexity 的表现足够优秀,但距离真正替代谷歌等传统搜索引擎还有很长的距离。从定位上看,当下的 Perplexity 更像一个知识平台,用户对其需求大都集中在知识领網域,定位类似于 AI 时代的 Wikipedia 和 Quora。
从 Perplexity 后续的更新动作上,也不难看出这一点。比如,Perplexity 正在尝试以知识分享为核心,创建相关的内容社群生态,Perplexity 支持用户将搜索问题及答案分享至社区,供其他用户学习讨论。
之所以 Perplexity 选择以知识平台为切入点,主要基于两点考虑:
一是 RAG 技术更擅长在开放網域知识问答及生成式问答中发挥作用。Meta 的技术论文对 RAG 技术进行了详细测评,包括开放網域问答、开放網域问题生成、抽取式问答及分类推理任务。在开放網域问答中,RAG-Token 和 RAG-Seq 得分处于领先地位;在生成任务和分类任务中,RAG 表现优于 BART 模型。
二是谷歌在消费、地图上积累了大量的数据,这让 Perplexity 在生活 / 购物等更高频的场景没有任何优势,很难实现场景的泛化。
以知识平台为目标,固然让 Perplexity 找到了差异化的方向。但同时也意味着,Perplexity 短期内很难成为一款低门槛的大众化互联网产品,至于替代谷歌更是无从谈起。
不仅如此,与大多数 AI 创业公司一样,Perplexity 并没有形成可持续的商业模式。目前,Perplexity 的变现方式主要有两个:会员订阅和 API 调用,但尚未形成规模化收入。
虽然收入没起来,但支出却一点都不少。根据中金测算,目前 Perplexity 调用 Bing 搜索引擎及 GPT-4 的单个问题成本约为 0.03 美元,年成本约为 6000 万美元,这还不包括后续 Perplexity 自研模型所产生的成本。
从过去看,搜索向来是个马太效应极其明显的市场。尽管用户对百度诟病颇多,也不影响百度在中国搜索引擎的市占率超过 7 成。如果用当下的视角理解产品技术演进的结果,Perplexity 似乎没有任何机会。
但这事好就好在,新技术对老技术的替代,往往是以颠覆的形式出现的,甚至老玩家固有的 " 习惯 " 还会成为其迭代的最大障碍。就拿搜索这事来说,AI 搜索直接给出关键信息的互動方向,天然与谷歌现有竞价排名的商业模式相背离。
如何取舍对谷歌来说是一个难题,而对 Perplexity 来说则是一个机会。从这个角度来说,Perplexity 替代谷歌固然言之过早,但也未必没有可能。