今天小編分享的科學經驗:500行代碼打造AI搜索引擎!賈揚清周末項目登頂GitHub熱榜,歡迎閲讀。
只用500 行代碼搭出來的AI 搜索引擎,登頂 GitHub 趨勢榜。
作者:賈揚清的 LeptonAI 團隊。
Lepton Search 耗時一個周末打造,僅作為 Demo 演示而不是正式產品,只為向開發者展示" 天下沒有難構建的 AI 應用 "。
△能理解中文但用英文回答
賈揚清事後感慨到:
這件事并沒有那麼復雜——我們剛開始時确實以為會更難。
另外,圍繞這個 Demo 還發生了一些争議。
AI 搜索引擎Perplexity創始人認為其參考了自己產品的 UI 界面,轉發評論了一番。
賈揚清也做出回應,稱無意進入這個市場,更多的是 Demo 展示以及宣傳自家 LeptonAI 雲服務,并且一開始就準備開源。
總之,兩位大佬 " 友好 " 地一番交鋒之後,Lepton Search 修好 bug 後立即開源并且迅速獲得社區認可。
目前,已有偏學術的開源 AI 搜索引擎 SciPhi 使用賈揚清的代碼完成更新。
要注意,AI 搜索引擎整體上依然是一個復雜的項目。
Lepton Search 之所以 500 行代碼就能實現,正如賈揚清想要展示的,是因為今天的應用開發已經高度模塊化:
大模型,調用了在自家雲上部署的開源 Mixtral-8x7b 模型。
搜索引擎,目前用了必應搜索的 API。
數據存儲,用自家 Lepton KV 作為無伺服器存儲。
這 500 行代碼其實只做到以下幾點,就完成一個產品的雛形了:
對大模型和搜索引擎的接口支持
前端 UI 界面
可緩存和可分享的搜索結果
除此之外,賈揚清還分享了開發過程中學到的一些經驗:
搜索質量确實非常重要,好的結果片段才能產生好的摘要。
一點 AI 幻覺其實有助于填補片段中未涉及的 " 常識 "。
開源模型在文本摘要任務上已經做的非常好。
在後續與網友讨論過程中,賈揚清還認為"AI 對話式搜索不會取代傳統搜索 ",還需要依賴傳統搜索引擎的結果。
事實上,AI 搜索目前正是行業的一個大熱門方向。
代表公司正是前面提到的Perplexity,剛剛拿到 7360 萬美元的 A 輪融資,估值超過 5 億美元。
投資者中有英偉達、亞馬遜,甚至谷歌 AI 大佬 Jeff Dean 和前 YouTube CEO 也不避嫌,以個人名義參與投資。
并且 Perplexity 已和部分浏覽器廠商如 Arc 展開合作,成為默認搜索引擎的選項之一。
△Perplexity 網頁版
更小一些的創業項目方面,比如面向程式員的devv_,面向學術的Consensus也各自受到垂直用户群體的認可。
國内大廠也是 AI 搜索的積極參與者,百度除了以文心一言插件的形式集成了 AI 搜索之外,還推出了獨立的簡單搜索App 試水。
360 也推出360AI 搜索獨立 APP 版,安卓版剛剛上線還是熱乎的,連評分數量都還沒夠展示門檻。
昆侖萬維的天工 AI 搜索則已推出了将近半年,其首頁推薦問題通常緊追最新熱點,很方便吃瓜。
AI 搜索類產品在設計上大致分為三大類。
谷歌和百度在傳統搜索的頁面頂部,以卡片形式展示 AI 生成結果。
必應、百度文心一言更偏重對話,搜索結果由 AI 總結提煉後呈現在多輪對話中。
其他產品大多遵循 Perplexity 為代表的新範式:
搜索結果頁面分為" 參考鏈接 -AI 回答 - 相關追問 "幾個模塊,并可多輪提問。
搜索結果有歷史記錄,且可以對外分享。
Copilot 增強模式,AI 理解問題後反向提問,引導用户補充搜索條件。
個性化提示詞,用于調整 AI 回答的風格以及格式。
正如 Perplexity 的 CEO 所説,他們的產品大獲成功後,其模式已成為事實上的行業标準。
除了宏觀的界面、功能之外,更細節之處如 " 付費功能的免費使用次數 " 都被一些後來者學走。
參考鏈接:
[ 1 ] https://github.com/leptonai/search_with_lepton
[ 2 ] https://twitter.com/jiayq/status/1751633905890038232
— 完 —
點這裏關注我,記得标星哦~
一鍵三連「分享」、「點贊」和「在看」
科技前沿進展日日相見 ~
>