今天小編分享的互聯網經驗:騰訊雲發布向量數據庫產品,AI Native成關鍵詞,歡迎閲讀。
各行各業布局大模型的勁頭,牽動着底層 IT 鏈條一并發生變化,向量數據庫就是其中一環。
36 氪獲悉,在 7 月 4 日舉行的騰訊雲發布會上,騰訊正式對外發布了向量數據庫產品 Tencent Cloud VectorDB。騰訊雲表示,這一數據庫是 AI 原生(AI Native)的向量數據庫,能廣泛應用于大模型的訓練、推理和知識庫補充等場景。
從應用場景看,過去的向量數據庫常和推薦、反欺詐等關系緊密。而如今随着更新模型數據、幫助模型推理等需求的出現,向量數據庫正體現出新價值。
在模型訓練環節,騰訊雲數據庫副總經理羅雲介紹,向量數據庫可以用于大模型預訓練數據的分類、去重和清洗環節。從效果上,羅雲表示,向量數據庫相比傳統的數據準備方式可以實現 10 倍效率的提升。另在推理環節,如果将騰訊雲的向量數據庫作為外部知識庫使用,則能将成本降低 2-4 個數量級。
需求在前,不少新興向量數據庫的面孔也随之出現。對比同業,騰訊雲強調,自身的向量數據庫在騰訊業務内長期打磨,不僅性能穩定,還具備 AI Native 特點。
具體來説,Tencent Cloud VectorDB 提供了接入層、計算層、存儲層的 AI 化解決方案,使用户使用向量數據庫的全過程都能應用到 AI 能力。羅雲進一步介紹,Tencent Cloud VectorDB 可以在接入層使用自然語言查詢,在計算層的算法和存儲層的索引上同樣疊加 AI 能力,不僅讓互動更自然,計算結果、效率、成本也能一并得到優化。
羅雲對 36 氪等機構表示,不久後向量數據庫的比拼會按階段體現在三個維度上:
首先在第一階段:廠商需要把產品打磨成一個真正的向量數據庫,提供向量存儲、檢索、擴容等功能。這一能力騰訊早已具備。
在第二階段:單 QPS 的成本成為指标。對此羅雲表示,騰訊雲的向量數據庫基于騰訊集團每日處理千億次檢索的向量引擎(OLAMA),經騰訊内部騰訊視頻、QQ 浏覽器、QQ 音樂等多個業務 " 檢驗 ",持續為各類業務需求調優性能,具備先發優勢。
在第三階段:數據庫使用的便捷性成為關鍵點。羅雲解釋,當前客户使用向量數據庫的流程較多,而騰訊可以通過 AI 的方式,整體打包這類能力,提升易用性。
羅雲表示,第三階段,也就是經 AI 加持的 " 易用性 " 能力是騰訊近期打磨的重點。從效果上,企業原先接入一個大模型需要花 1 個月左右時間,而現在使用疊加了 AI 能力的騰訊雲向量數據庫只需要 3 天。"AI 時代,向量數據庫也可以受益于 AI。" 羅雲總結。