今天小编分享的科学经验:500行代码打造AI搜索引擎!贾扬清周末项目登顶GitHub热榜,欢迎阅读。
只用500 行代码搭出来的AI 搜索引擎,登顶 GitHub 趋势榜。
作者:贾扬清的 LeptonAI 团队。
Lepton Search 耗时一个周末打造,仅作为 Demo 演示而不是正式产品,只为向开发者展示" 天下没有难构建的 AI 应用 "。
△能理解中文但用英文回答
贾扬清事后感慨到:
这件事并没有那么复杂——我们刚开始时确实以为会更难。
另外,围绕这个 Demo 还发生了一些争议。
AI 搜索引擎Perplexity创始人认为其参考了自己产品的 UI 界面,转发评论了一番。
贾扬清也做出回应,称无意进入这个市场,更多的是 Demo 展示以及宣传自家 LeptonAI 云服务,并且一开始就准备开源。
总之,两位大佬 " 友好 " 地一番交锋之后,Lepton Search 修好 bug 后立即开源并且迅速获得社区认可。
目前,已有偏学术的开源 AI 搜索引擎 SciPhi 使用贾扬清的代码完成更新。
要注意,AI 搜索引擎整体上依然是一个复杂的项目。
Lepton Search 之所以 500 行代码就能实现,正如贾扬清想要展示的,是因为今天的应用开发已经高度模块化:
大模型,调用了在自家云上部署的开源 Mixtral-8x7b 模型。
搜索引擎,目前用了必应搜索的 API。
数据存储,用自家 Lepton KV 作为无伺服器存储。
这 500 行代码其实只做到以下几点,就完成一个产品的雏形了:
对大模型和搜索引擎的接口支持
前端 UI 界面
可缓存和可分享的搜索结果
除此之外,贾扬清还分享了开发过程中学到的一些经验:
搜索质量确实非常重要,好的结果片段才能产生好的摘要。
一点 AI 幻觉其实有助于填补片段中未涉及的 " 常识 "。
开源模型在文本摘要任务上已经做的非常好。
在后续与网友讨论过程中,贾扬清还认为"AI 对话式搜索不会取代传统搜索 ",还需要依赖传统搜索引擎的结果。
事实上,AI 搜索目前正是行业的一个大热门方向。
代表公司正是前面提到的Perplexity,刚刚拿到 7360 万美元的 A 轮融资,估值超过 5 亿美元。
投资者中有英伟达、亚马逊,甚至谷歌 AI 大佬 Jeff Dean 和前 YouTube CEO 也不避嫌,以个人名义参与投资。
并且 Perplexity 已和部分浏览器厂商如 Arc 展开合作,成为默认搜索引擎的选项之一。
△Perplexity 网页版
更小一些的创业项目方面,比如面向程式员的devv_,面向学术的Consensus也各自受到垂直用户群体的认可。
国内大厂也是 AI 搜索的积极参与者,百度除了以文心一言插件的形式集成了 AI 搜索之外,还推出了独立的简单搜索App 试水。
360 也推出360AI 搜索独立 APP 版,安卓版刚刚上线还是热乎的,连评分数量都还没够展示门槛。
昆仑万维的天工 AI 搜索则已推出了将近半年,其首页推荐问题通常紧追最新热点,很方便吃瓜。
AI 搜索类产品在设计上大致分为三大类。
谷歌和百度在传统搜索的页面顶部,以卡片形式展示 AI 生成结果。
必应、百度文心一言更偏重对话,搜索结果由 AI 总结提炼后呈现在多轮对话中。
其他产品大多遵循 Perplexity 为代表的新范式:
搜索结果页面分为" 参考链接 -AI 回答 - 相关追问 "几个模块,并可多轮提问。
搜索结果有历史记录,且可以对外分享。
Copilot 增强模式,AI 理解问题后反向提问,引导用户补充搜索条件。
个性化提示词,用于调整 AI 回答的风格以及格式。
正如 Perplexity 的 CEO 所说,他们的产品大获成功后,其模式已成为事实上的行业标准。
除了宏观的界面、功能之外,更细节之处如 " 付费功能的免费使用次数 " 都被一些后来者学走。
参考链接:
[ 1 ] https://github.com/leptonai/search_with_lepton
[ 2 ] https://twitter.com/jiayq/status/1751633905890038232
— 完 —
点这里关注我,记得标星哦~
一键三连「分享」、「点赞」和「在看」
科技前沿进展日日相见 ~
>