大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 科學

人生搜索引擎免費用,開源版哈利波特“冥想盆”登GitHub熱榜,支持中文

2024-11-21 简体 HK SG TW

今天小編分享的科學經驗:人生搜索引擎免費用,開源版哈利波特“冥想盆”登GitHub熱榜,支持中文,歡迎閱讀。

天啦撸!回溯你在網上看過、做過的一切,也有免費軟體可用了!

簡單說,針對任何" 之前好像在哪看過 "的電腦檔案,只需輸入相關搜索詞,這個軟體都能幫你一鍵輕松回憶了。

打開方式 be like(沒錯,也有中文版):

你品,你細品。這像不像《黑鏡》中 " 你的全部歷史 " 那一集,描述了一種人人都植入芯片、能随時讀取過去記憶的未來生活。

更有意思的是,發明這個軟體的朋友将其命名為Pensieve (冥想盆),它是指 " 哈利波特中提取和回顧記憶的那個大水盆子 "。

笑死,你别說還真貼切!事實上,這個項目大量借鑑了之前就很火的 " 記憶助手軟體 "Rewind 和微軟的 Windows Recall 功能。

但是,這兩個 emmm …… Rewind 要收費(基礎版 12 美元 / 月),微軟的延期了。

所以,既免費、又立即可用的 Pensieve 是真香了!

這不,代碼更新後迅速登上了 GitHub 熱榜 ~

記住并回憶電腦螢幕上的所有内容

我們先來看 GitHub 頁面上 Pensieve(原名為 Memos)的官方介紹:

一個以隐私為中心的被動錄制項目。它可以自動記錄螢幕内容,構建智能索引,并提供方便的網頁界面以檢索歷史記錄。

是不是聽起來還是有點抽象?

别急,我們馬上拿 Rewind 和 Windows Recall 來一波回憶殺(doge)。

先說微軟畫了很久的大餅——Windows Recall。這個功能是今年 5 月首次被提出的,當時微軟計劃将其作為 Copilot + PC 的一項旗艦功能推出。

當時主打,任何檔案或網頁浏覽記錄都可以用自然語言搜索,輕松回憶任何東西。

然而,由于安全方面的擔憂,該功能的發布被一再推遲,且至今仍未上線。

細數一下,微軟最初計劃于 6 月 18 日發布,但由于安全問題,到了時間點卻未能按時上線。

後來微軟對其進行了改進,加入了高級加密和 Windows Hello 認證,數據被保存在 VBS 安全區中,第三方應用和用戶無法訪問,而且截圖将自動排除諸如密碼和信用卡信息等敏感内容。

一番改造後,微軟又計劃在 10 月底開始測試新版本的 Windows Recall。

直到今日,該功能仍未上線,微軟還在改改改……

此外,對于 " 記憶助手 "Rewind,雖然幹得熱火朝天,但奈何它是收費滴。

Rewind 成立于 2020 年,主打通過 AI 技術捕捉和整理用戶的全部生活内容。

具體功能和 Windows Recall 類似,也是幫助用戶記錄并回溯在手機或電腦上看過的所有信息。

不過除了走到 " 回憶起 " 這一步,Rewind 走得更遠了一點。

它還接入了 GPT-4,能夠對這些 " 記憶 " 進行更深一步的操作,使得用戶可以通過提出問題、創建摘要等方式與系統進行互動。

而就在 Rewind 功能更加完備的過程中,它也收獲了資本的青睐。

截至今年初,Rewind 已經完成了兩輪融資,共計 2790 萬美元,估值約為 3.5 億美元(25.34 億人民币),而且兩輪中都有 OpenAI CEO Sam Altman 和 a16z 的身影。

相比之下,根據項目作者的說法,Pensieve 的最大特點在于:

允許用戶完全控制自己的數據,避免将數據傳輸到不可信的數據中心。

具體而言,Pensieve 擁有以下幾個特點:

簡單安裝,只需通過 pip 安裝依賴項即可開始;

所有數據均本地存儲,允許完全本地操作和自主數據管理;

實現全文和向量搜索;

與 Ollama(一個支持本地部署 LLM 的開源框架)集成,增強搜索能力;

支持 Mac 和 Windows(Linux 支持正在開發中);

兼容任何 OpenAI API 模型(例如,OpenAI、Azure OpenAI、vLLM 等);

允許用戶選擇和設定語言模型(包括中文和英文);

允許通過插件擴展功能;

下面重點介紹大家關心的幾個問題。

第一,需要占用多少存儲。

作者貼心預估了一下,每月按20 個工作日計算,產生的截圖檔案約 8GB。截圖會進行去重,如果連續截圖内容變化不大,那麼只會保留一張截圖。

SQLite 數據庫大小取決于索引的截圖數量,10 萬張截圖索引後約占用2.2GB存儲空間。

第二,關于功耗和硬體設備。

Pensieve 默認需要兩個計算密集型任務:1)一個是 OCR 任務,用于從截圖提取文本;2)另一個是嵌入任務,用于提取語義信息和構建向量索引;

對于前者,作者使用 CPU 執行,并針對不同的作業系統優化以最小化 CPU 使用。

而對于後者,作者認為可以按照自己的設備進行選擇:

NVIDIA GPU 設備優先使用 GPU;

蘋果設備優先使用 Metal GPU;

其他設備使用 CPU;

當然,為了避免影響用戶日常使用,Pensieve 還采取了優化措施。

一方面,Pensieve 能夠根據用戶的活動模式動态調整索引構建的頻率。也就是說,在用戶使用電腦時,它會降低索引構建的優先級,以減少系統資源的占用。

另一方面,Pensieve 在設計時考慮了電池使用壽命,通過監控電池狀态,當電池電量低于某個阈值時,會自動減少資源消耗,以延長電池使用時間。

第三,隐私安全如何保證。

Pensieve 作者提出了 4 點措施來保證用戶隐私,包括:

1、代碼是完全開源且易于理解的 Python 代碼,允許任何人審查以确保沒有後門或惡意軟體。

2、本地化數據存儲。Pensieve 将所有數據存儲在用戶的本地設備上,而不是上傳到雲端伺服器。

3、易于解除安裝:Pensieve 提供了簡單的解除安裝過程,用戶可以輕松地從系統中移除。

4、數據處理完全由用戶控制。用戶可以自由選擇何時啟動或停止記錄,以及如何管理和查詢自己的數據。

另外,作為一個獨立項目,Pensieve 所使用的機器學習模型(包括 VLM 和嵌入模型)都允許由用戶選擇。

這就上手安裝試試

概括而言,使用 Pensieve 大致包括以下幾個步驟:

安裝 Pensieve

初始化 pensieve 配置檔案和 sqlite 數據庫

使用兩行命令啟動服務

打開浏覽器并訪問 Web 界面

BTW,Pensieve 作者也貼心奉上了 " 食用指南 ",簡單概括如下:

1、選擇适當的嵌入模型

由于 Pensieve 使用嵌入模型提取語義信息并構建向量索引,故選擇合适的嵌入模型至關重要。

根據用戶習慣的語言,作者提供了中英兩種模型。

2、使用 Ollama 進行視覺搜索

默認情況下,Pensieve 僅啟用 OCR 插件從截圖提取文本并構建索引。然而,這種方法極大限制了沒有文本的影像的搜索效果。

對此,我們需要一個與 OpenAI API 兼容的多模态影像理解服務,剛好 Ollama 可以勝任。

需要提醒的是,在啟動 VLM 功能之前,對硬體有一定要求:

推薦配置:至少 8GB VRAM 的 NVIDIA 顯卡或搭載 M 系列芯片的 Mac;

CPU 模式不推薦,因為它會導致系統嚴重卡頓;

3、全文索引

由于 Pensieve 默認情況下并非所有截圖都會立即索引,因此,需要以下命令行,才能實現全文索引功能。

更多安裝細節可參見原項目庫,地址也給大家放上了 ~

GitHub:

https://github.com/arkohut/pensieve?tab=readme-ov-file

熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們