今天小编分享的科技经验:AI“缝”搜索,欢迎阅读。
大厂要出 " 框 ",小厂要入 " 框 "
下半年,搜索领網域变得热闹起来。
8 月 27 日,夸克发布全新 PC 端,整合 AI 搜索、AI 写作、AI PPT、AI 檔案总结等功能。差不多同一时间,字节继头条搜索、悟空搜索、闪电搜索之后,在移动市场上线 " 抖音搜索 "App,第四次把脚踏入了搜索的 " 河 "。9 月 4 日,百度推出新搜索 " 文小言 ",融合一系列能力后,提供 " 搜创聊 " 的体验。
三家动作各不相同,夸克希望补全在 PC 端的能力,赶上 AIPC 风口;字节则希望完善搜推一体化,巩固自身内容生态;百度则希望让文小言成为探索搜索 4.0 时代的 " 先锋 ",提前卡位。如果把视线放到整个搜索领網域,抖音、视频号在搜索框新增电商入口,这门古早的生意,又变得热闹起来。
百度副总裁、AI 创新业务负责人薛苏认为,传统搜索与 AI 搜索有三个不同。一个是支撑技术上,AI 搜索的底层是生成式大模型;其次是场景与需求差异,传统搜索用排序方式解决需求,而 AI 搜索则是用生成式方法;再次是在产品理念与定位上,存在工具性与人性的差异。
实际上,目前领跑 "AI 搜索 " 的大厂们,对于技术本身要保守得多。由于 RAG 与搜索的亲缘性,主导着当下国内 AI 应用开发。然而,OpenAI 最近发布的新系列模型,为行业提供了新的参考:o1 两个版本专注在推理上,不再通过 prompt 完成 CoT(思维链),而是使用强化学习,执行链式思考。
即便学术界已在今年开始讨论 RAT(RAG+CoT)的可行性,但国内巨头似乎还未将重心放在这里,反而更具现实主义地押注生态。相较而言,初创公司所面对的挑战要艰难得多,没有巨头那么多花式各样的 " 缝补布料 "(生态),有且只有一身蛮力。
移动时代的老巨头们依托于生态优势,试图打通端与端、应用与应用、内容形式的隔阂——试图摆脱搜索框的束缚,从而在下个时代来临前,为通用搜索上竖起 " 盾 "。而 Kimi、智谱、MiniMax,则长袖善舞,想要找到更垂直的领網域,完成数据的输入与输出,比如想尽办法附着在搜索框中。
眼下,搜索框成了钱钟书的 " 围城 ",有人想打破,有人却在死命朝里钻。
构建、补全、重塑
分类目录、文本检索、整合分析、用户中心、生活生态圈,被归类为搜索的五个发展阶段。
五个发展阶段的确存在代际之分,但不是今是昨非。分类目录仍然在各应用中普遍存在,文本检索依然是爱如生古籍库这些文史类专用数据库中最基础的搜索形态,当下主流搜索市场仍以整合分析为主,至于用户中心与生活生态圈,还有待 AI 技术与端侧成熟。
去年以来,百度、阿里(夸克)、字节、360 等传统搜索引擎厂商都推出了各自号称 "AI 搜索 " 的产品,实际上都只是完成了搜索 AI 化改造中的部分环节,包括结果上的智能化排序、推荐、关键词解析等。
无论字节完善搜推一体化,还是夸克补全 PC 端,抑或是百度推出 " 新搜索 ",都表明巨头们视搜索为打开商业生态的一把 " 钥匙 "。这便是字节始终不愿放弃搜索的核心原因,也恰好证明搜索本身在 AI 时代的重要战略价值。毕竟,学习和搜索是唯二的能够无限 scaling 计算能力,简单来说,因为豆包与内容生态的存在,字节不缺学习,缺的只有搜索。
而在搜索的 AI 化改造过程中,通用搜索至少面临着两重挑战,第一个来自端侧。
日前国内一家半导体公司表示,作为新业务板块,今年 AI 芯片市场的需求井喷,且大客户集中在国内互联网巨头。而 Canalys 日前发布的数据显示,处于中游的联想,其 AIPC 第二季度出货量环比增长 228%。PC 端之所以率先起量的核心原因,是办公智能化推动。因此,夸克 8 月末更新后,完成了移动端与 PC 端的布局,并上线了多种面向办公场景的功能,初步坐上了牌桌。
互联网公司推出适配端的产品,并不意味着 AI 搜索往后是一片坦途,在端的调用权限仍然在硬體厂商手中。早前,苹果在 Apple Intelligence 的发布会上,展现了一家硬體厂商如何通过端侧内置全系统调用工具,提供新的用户体验,甚至连第三方应用也得配合,显示出封闭生态下的硬體厂商,会更有主导权。
第二重考验是打破以移动 App 为首的信息孤岛,解决内容、场景、知识垂类间的隔阂。
阿里与腾讯在几个月时间内,先后打通了信息流(微信广告跳转淘宝天猫)与资金流(淘天接入微信支付),巨头间正在拆除藩篱。这一背景,对于通用 AI 搜索而言是一大利好。
百度在 " 文小言 " 的发布会上呈现了多种类搜索的探索,包括对话框式的传统搜索、互動式的 AI 助手、自主专题订阅,以及涉及到图文视频等媒介下的搜索等。传统订阅机制以 App、内容平台为核心,例如微信公众号订阅。而文小言的 " 自由订阅 " 则呈现了 " 需求导向 " 的特点,例如按照关键词订阅,从而可以跨 App 与内容平台。
尽管 " 文小言 " 算得上是目前通用 AI 搜索最大胆的尝试,但从内容、产品、场景等层面来看仍有诸多挑战。
内容上,百度既有生态占比权重非常高,其他巨头的内容权重占比很低。产品方面,经历移动时代规训的用户,能否适应各种 AI 原生的互動形式,还有待观察。前文提到的 " 自由订阅 " 并没有在文小言界面中呈现,而是需要在与 AI 助手对话中才能实现。
追逐、聚合、突围
"AI 时代的超级应用,大概率会是一个 AI 助理 "。诚如月暗杨植麟在最近的采访中所言,比起随时会被超越的大模型,现阶段资本和 AI 巨头更愿意把赌注压在看得见产品和增长的 AI 助手上。
OpenAI 是指引的灯塔,AI 助手成为了各家 " 秀肌肉 " 的視窗,从 Sora 到 GPT-4o,凡是被 OpenAI" 鸽掉 " 的功能都被聚合在了国内的 AI 助手中。于是,在一个看似平平无奇的 App 中,同时可以验收大模型训练、推理、长文本、多模态、Agent 等多项技术成果。
智谱把对话、AI 生图、AI 生视频、AI 视频通话等统统打包进了智谱清言中,Minimax 同样把对话、语音、AI 生图、AI 生视频、AI 生音乐等功能内嵌入海螺 AI 当中。
追逐最前沿的技术,以此与传统的大厂作出区隔,成为了 AI 头部创业公司的选择。毕竟 OpenAI 式的叙事极具诱惑,据媒体报道,OpenAI 正在洽谈新一轮融资,其估值达到了 1500 亿美元,对比中国大模型公司目前 30 亿美元的最高估值,差距相当于 50 个智谱和月暗。
大厂高调谈 AI 搜索,而 AI 公司却缄默不语,只是在其应用内部悄悄上线 " 联网 " 或 "AI 搜索 " 相关功能。一方面,国内的 AI 公司将 AGI 奉为圭臬,不愿意被贴上 "AI 搜索 " 的标签,像 "Perplexity" 一样把路走窄;另一方面,也暴露出其被互联网巨头围剿的困境。
阿里、百度、腾讯之长,恰恰是 AI 公司之劣势。内容、产品、场景、生态,大厂均已提前锁定,反观 AI 公司产品尚未成熟就被迫推向市场,宛如一个个 " 打黑工 " 的童工。智谱、月暗、Minimax 等声称的 " 联网 " 与 "AI 搜索 " 本质上还是在 " 爬数据 ",只不过内化为生成问答的步骤之一。上述的 " 爬 " 绕不过互联网大厂的生态藩篱,这意味着如果某厂拒绝向 AI 公司开放链接,那就有一定概率影响最后回答质量。
这过程中还存在一个问题,即缺乏场景支撑的搜索问答更加容易出现幻觉和泛化问题。假设将 AI 搜索和问答锁定在电商领網域,就会自然划分出种草、交易、售后易等几个细分场景,无论是 AI 搜索还是数据反馈都能更加精准对应,如此迭代下来,远比毫无目的的搜索对话效果更强。当用户打开 Kimi、海螺 AI 时,他们是茫然的,大部分人可能还得思考几秒提什么问题,但打开淘宝,用户的搜索是相对明确的。
为此,市面的 AI 助手都不约而同地弱化了 " 搜索 " 的标签。为了能建立集中获取数据反馈的渠道,在互联网大厂的地盘上,这些 AI 公司也只能低头,双手奉上投流 " 过路费 "。为了解决问答不够垂和专,弥补场景缺陷,AI 公司也在尝试通过专家数据标注和用户数据分类收集、处理等方式来解决。
每一次新技术更新和产品推出都能引发圈内的一次狂欢,帷幕落下,尚未有明确的数据证明带来了直接的用户或商业转化。靠资本去治疗 AI 公司的先天体弱,到底还能支撑多久?
CoT 再次定义 AI 搜索
时至今日,国内市场对 AI 助手的期待经历了 "Copilot 辅助 "" 效率工具 " 再到 "Super App" 的转变,其所承载的意义早已超过了本身。
从上文的描述中不难发现,围绕着 AI 助手和 AI 搜索,互联网大厂的思路是跳出 " 框 ",进而去补足和强化生态体系;AI 公司则在入 " 框 ",把对话框视为与用户互動和反馈最有价值的渠道。
到现在,AI 搜索在技术方面已经没有壁垒,模型推理能力的不足靠 RAG 缝缝补补,大厂和 AI 公司也能交出一份差强人意的答卷。对未来 AI 搜索发展可能会涉及几个方面:跨端、跨场景、跨数据、主动适应、自然语言唤起、多轮对话以及多步推理。
近期,OpenAI 发布 o1,将此前普遍运用于 Agent 训练的 CoT 技术自动化,实现模型的自我理解和进化,标志着大模型推理能力迈上新台阶。
从 RAG 到 CoT,也将开启了 AI 搜索的新时代。CoT 的本质是将复杂问题切分为若干个简单执行任务,重推理而弱化了搜索色彩,最后导向的方向是既垂直又精专。
OpenAI 已经落子,国内大概率要 follow。CoT 就像给 AI 搜索再次开启了 " 加速器 ",会进一步明晰化大厂与 AI 公司的分野。
对强技术而弱搜索生态的 AI 公司不失为一个好消息,从整体上提升模型推理能力,搜索和强化学习机制内化,不过多地展示过程和呈现参考资料,直接解决问题。毕竟,AI 助手内的参考资料引用明为 " 提高准确率 ",实则是给推理能力不足的大模型 " 开外挂 "。
互联网大厂的落地在垂直场景中,"CoT 自动化 +Agent" 也许是下一个 " 黄金拍档 ",先理解、推理与制定计划,再由 Agent 执行。在娱乐、电商、社交等场景,既能简化跳转步骤,减少流程,还能直接替代用户上手操作。
短期内,AI 搜索的产品形式不会有太大变化,但是速度和效果将会提升一个 level,唯一需要考虑的因素是推理成本。
AI 搜索是否需要以一个独立的产品存在值得商榷,毕竟国内已经有无数多的场景和产品可以嵌入。包括新生代的 AI 助手,如何与旧业务和产品融合打通,怎么在新场景中发挥其功能,可能才是众多玩家关注的重点。
本文来自微信公众号 "guangzi0088"(ID:TMTweb),作者:郝鑫 吴先之。