大酷樂
  • 汽車
  • 理财
  • 軍事
  • 科技
  • 遊戲
  • 互聯網
  • 娛樂
  • 财經
  • 科學
  • 社會
  • 親子
  • 電影
  • 健康
  • 教育
  1. 首頁
  2. 互聯網

李開復創立的零一萬物宣稱,自研向量數據庫領先原榜單第一名的286%

2024-03-12 简体 HK SG TW

今天小編分享的互聯網經驗:李開復創立的零一萬物宣稱,自研向量數據庫領先原榜單第一名的286%,歡迎閱讀。

钛媒體 App 3 月 11 日消息,李開復博士創立的零一萬物宣布,公司成功研發出基于全導航圖的新型向量數據庫 " 笛卡爾(Descartes)",并已包攬權威榜單 ANN-Benchmarks 6 項數據集評測第一名。

零一萬物表示,在國際權威評測平台 ANN-Benchmarks 離線測試中,零一萬物笛卡爾向量數據庫比之前榜單上同業第一名有顯著性能提升,部分數據集上的性能提升甚至超過 2 倍以上,在 gist-960-euclidean 數據集維度更大幅領先榜單原 TOP1 286%。

零一萬物強調,笛卡爾向量數據庫将應用于公司即将正式發布的 AI 產品中,未來還将結合工具提供給廣大開發者。

據悉,零一萬物(01.AI)成立于 2023 年 5 月 16 日,致力于打造全新的 AI 2.0 平台與 AI-first 生產力應用的全球化公司,由創新工場董事長兼 CEO 李開復博士親自挂帥,擔任零一萬物 CEO。

2023 年中關村論壇上,李開復就對钛媒體 App 等表示,以 GPT-4 等大模型為代表的生成式 AI 熱度在全球蔓延,意味着 AI 2.0 時代已經到來,它将帶來比移動互聯網時代大十倍的機會,穿透各行各業極大地提振生產力。" 我們預測,全新的 AI 2.0 平台将能有效幫助提升人類生產力,創造巨大的經濟價值及社會價值。"

2023 年 11 月,零一萬物發布首款研發的最強開源 AI 大模型系列 "Yi",包括 Yi-6B(數據參數量為 60 億)、Yi-34B(340 億)兩款,均是雙語(英文 / 中文)、支持開源。

其中,Yi-34B 模型在多項評測基準中全球領跑,基于超強 Infra 下模型訓練成本實測下降 40%,模拟千億規模訓練成本可下降多達 50%,并以更小模型尺寸的基準結果超過 LLaMA2-34B/70B、Falcon-180B 等大尺寸開源模型,以及百川智能(王小川創立)的 Baichuan2-13B。

" 随着團隊到位,2023 年 6、7 月份開始寫第一行代碼,短短四個月做了非常自豪的產品。我們是‘不鳴則已,一鳴驚人’。所以‘一鳴驚人’之後,如果我們過半年甚至過一年回頭看,今天對我們來說只是剛剛開始,我們還會不斷的去開發、推動、宣布更多令人驚豔的成果。" 李開復當時表示。

此次公布的向量數據庫,又被稱為 AI 時代的信息檢索技術,是檢索增強生成(RAG)内核技術之一。随着大模型為代表的 AI 2.0 時代到來,圖片、視頻、自然語言等多模态的非結構化數據量陡增。區别于傳統數據庫,向量數據庫專門用來存儲、管理、查詢和檢索向量化的非結構化數據,而 ChatGPT 模型進一步強化了向量數據庫的作用。

截至目前,Google、微軟、Met 等大廠的相關向量大模型產品先後問世,Zilliz、Pinecone、Weaviate、Qdrant 等創業公司也異軍突起。2023 年,OpenAI 的向量數據庫合作方 Pinecone 完成了 B 輪 1.38 億美元融資,國内初創企業 Fabarta ArcNeural 也完成了上億元 Pre-A 輪融資。

如今,李開復帶領的團隊也自主研發出全新的向量數據庫。

具體來說,零一萬物笛卡爾主要聚焦于高性能向量數據庫,采用領先的全導航圖技術、首創自适應鄰居選擇策略等新功能,以及采用了兩級量化方案增強 RAG,在處理復雜查詢、提高檢索效率、優化數據存儲方面相比業界擁有顯著的比較優勢。另外,零一萬物還采用索引結構優化、連通性保障等全棧向量技術方案,從而提高笛卡爾向量數據庫的性能。

以電商推薦場景為例。上架商品數量可能千萬級,每個商品可以由一個向量表達,即使庫中向量數不算很大,如果電商用戶基數非常龐大,高峰時每秒用戶請求數非常大,可能達到幾十萬甚至上百萬的吞吐量 QPS(每秒内處理的請求數),使用高性能向量數據庫可以有效提升電商場景裡面搜索、廣告業務的推薦效果,促進銷售額增長。

零一萬物表示,笛卡爾擁有超高精度、超高性能兩個優點:一、超高精度,基于多層縮略圖和坐标系實現層間導航和圖上方位導航,以及圖連通性保障,實現精度大于 99%,相同性能下,精度大幅領先業内水平;二、超高性能,高效的邊選擇和裁剪技術,千萬數據庫 ms(秒級)響應。

該公司指出,在兩級量化降低計算復雜方面,相比傳統 PQ 查表,笛卡爾向量數據庫的性能得到大幅提升到 2-3 倍;目标向量層面,笛卡爾讓 RAG 向量檢索性能提高 15%-30%,從而幫助企業客戶構建私網域知識庫、智能客服系統;在自動駕駛領網域,使用高性能向量數據庫可來加速自動駕駛模型訓練等。

基準測試層面,在 glove-25-angular、glove-100-angular、sift-128-euclidean、nytimes-256-angular、fashion-mnist-784-euclidean、gist-960-euclidean 六大數據集中,零一萬物笛卡爾向量數據庫在 6 項數據集評測中都處于最高位。

零一萬物強調,笛卡爾向量數據庫是團隊基于 RAG 的初步嘗試,将在近期發布的 AI 生產力產品中得到有效應用。未來各家大模型優化到一定程度後,向量數據庫的能力可能決定各家大模型的天花板。零一萬物後續會持續專注研發和分享,為用戶帶來更好的技術和體驗。

" 零一萬物的數據處理管線、算法研究、實驗平台、GPU 資源和 AI Infra 都已經準備好,我們的動作會越來越快 "。李開復表示,零一萬物希望有更多的開發者使用 Yi 系列模型,打造自己場景中的 "ChatGPT",引領下一代前沿創新和商業模型,探索走向通用 AI 時代。

钛媒體 App 了解到,零一萬物即将推出基于 AI 2.0 的超級應用產品。

(本文首發钛媒體 App,作者|林志佳)

熱門排行
  • 高露現身上海虹橋機場 黑色外套點綴亮色愛心裝飾俏皮亮眼 高露現身上海虹橋機場 黑色外套點綴亮色愛 惠惠君 | 2023-05-02
  • 《歧路旅人2》:向光而生 《歧路旅人2》:向光而生 衛青柏 | 2023-05-02
  • vivo X90S曝光:處理器更新為天玑9200+ 安卓最強芯 vivo X90S曝光:處理器更新為天玑9200+ 安卓最 袁曼雁 | 2023-05-05
  • “懶癌”發病率上升,定期體檢别忽視 “懶癌”發病率上升,定期體檢别忽視 幸聽楓 | 2023-05-02
  • 宋慧喬獲百想視後 韓素希發圖手動加愛心表情慶祝 宋慧喬獲百想視後 韓素希發圖手動加愛心表 賁芳蕤 | 2023-05-02
  • 曹操墓,裡面都有啥? 曹操墓,裡面都有啥? 衛青柏 | 2023-05-02
  • 十年了,他們終于要HE! 十年了,他們終于要HE! 惠惠君 | 2023-05-07
  • 中央部署經濟工作,釋放5大信号 中央部署經濟工作,釋放5大信号 郜萌運 | 2023-05-02
  • 高德上線手機彎道會車預警功能 高德上線手機彎道會車預警功能 習又夏 | 2023-05-02
  • 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 《雲襄傳》終于抬上來啦,男O女A讓人好上頭! 集玲琳 | 2023-05-02
  • 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露面 陳自瑤抱病為愛女做蛋糕慶生,王浩信點贊沒露 賁芳蕤 | 2023-05-02
  • 等比例長大的童星,李蘭迪算一個 等比例長大的童星,李蘭迪算一個 郟君昊 | 2023-05-02
  • 21家A股遊戲公司2022年收入651億 今年“遊戲+AI”能否逆風翻盤? 21家A股遊戲公司2022年收入651億 今年“遊 衛青柏 | 2023-05-04
  • 普京籤署總統令,批準對俄刑法典相關法條的修正案 普京籤署總統令,批準對俄刑法典相關法條的修 集玲琳 | 2023-05-02
  • 這些被抓來做實驗的流浪狗,最終拯救了無數糖尿病人 這些被抓來做實驗的流浪狗,最終拯救了無數糖 集玲琳 | 2023-05-02
  • 信用風險釋放趨緩,結構性風險需重點關注 ——2023年一季度債市信用風險回顧與下階段展望 信用風險釋放趨緩,結構性風險需重點關注 — 袁曼雁 | 2023-05-02
  • 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15日 與周立波夫婦鬧糾紛成老賴,唐爽被司法拘留15 寸飛蘭 | 2023-05-05
  • 高端國產車:軍車血統,目前電動車越野的“天花板”? 高端國產車:軍車血統,目前電動車越野的“天花 謝飛揚 | 2023-05-02
  • 解除資格!停止一切合作 解除資格!停止一切合作 佼昌翰 | 2023-05-02
  • 3699起 聯想小新mini主機上架 13代酷睿标壓處理器 3699起 聯想小新mini主機上架 13代酷睿标壓 習又夏 | 2023-05-05
  • 中銀證券給予南京銀行增持評級 中銀證券給予南京銀行增持評級 袁曼雁 | 2023-05-03
  • 前董事長被免,天山生物全面進入“中植系”時代?股價曾在一月内暴漲超400% 前董事長被免,天山生物全面進入“中植系”時 惠惠君 | 2023-05-02
  • 瘋成這樣,怎麼還能被全網吹捧? 瘋成這樣,怎麼還能被全網吹捧? 郜萌運 | 2023-05-02
  • 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 狂吼11次“讓一下”!交警咆哮開道嘶吼到吐 寸飛蘭 | 2023-05-03
  • 摩根大通收購美國第一共和銀行 摩根大通收購美國第一共和銀行 謝飛揚 | 2023-05-02
  • 事關農村土地承包和農民權益,《農村土地承包合同管理辦法》5月1日起施行 事關農村土地承包和農民權益,《農村土地承包 郟君昊 | 2023-05-02
  • 台劇赢麻了,又來一部8.9 台劇赢麻了,又來一部8.9 衛青柏 | 2023-05-02
  • 下降45分,上漲35分!34所自劃線院校復試分數線漲幅匯總 下降45分,上漲35分!34所自劃線院校復試分數線 袁曼雁 | 2023-05-07
  • "三高"已盯上青少年,做好這件事是關鍵 "三高"已盯上青少年,做好這件事是關鍵 習又夏 | 2023-05-05
  • 五一檔沒一個能打的 五一檔沒一個能打的 集玲琳 | 2023-05-05
  • 200戶連夜疏散,原因讓人憤怒!“損失超一億”,官方通報 200戶連夜疏散,原因讓人憤怒!“損失超一億”, 袁曼雁 | 2023-05-03
  • 恐怖韓劇下神壇,這次膽小可入 恐怖韓劇下神壇,這次膽小可入 袁曼雁 | 2023-05-05
  • 這劇是不是用ChatGPT寫的呀? 這劇是不是用ChatGPT寫的呀? 惠惠君 | 2023-05-02
  • 性騷擾慣犯,滾出娛樂圈 性騷擾慣犯,滾出娛樂圈 謝飛揚 | 2023-05-05
  • 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的生活》證實将停辦 48歲何炅自曝已老花眼,黃磊睡前認老,《向往的 佼昌翰 | 2023-05-02
  • 一個《長月燼明》倒了,《狐妖》《長相思》《與鳳行》…在路上了 一個《長月燼明》倒了,《狐妖》《長相思》《 惠惠君 | 2023-05-02
  • 當年輕人開始不随份子錢 當年輕人開始不随份子錢 袁曼雁 | 2023-05-02
  • 張天愛假期曬“酷”存照 卷發披肩穿黑色吊帶裙大秀好身材 張天愛假期曬“酷”存照 卷發披肩穿黑色吊 嬴覓晴 | 2023-05-02
  • 畢滢用8年時間成功逼宮?曾被傳已婚生子的她,不容小觑 畢滢用8年時間成功逼宮?曾被傳已婚生子的她, 幸聽楓 | 2023-05-03
  • 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 宋慧喬獲視後首次曬照,拿獎杯笑容溫柔 郜萌運 | 2023-05-02

©2022 大酷樂 版權所有

隱私政策 | 服務條款 | 聯繫我們