向量搜索技術：基於Elasticsearch/PostgreSQL/Redis擴展的向量搜索數據庫或獨立向量搜索引擎方案參考

原創

2023-09-03 14:28

理論基礎與研究

　　向量數據庫用於非結構化文本、圖片、音頻、視頻搜索、推薦，將他們轉換爲數字向量表示來進行相似性(ANN)搜索。存儲和搜索高維向量是其特徵之一，通常採用高級索引技術和算法如HNSW, Annoy, 或Faiss來實現。不同於SQL數據庫，向量數據庫更像nosql，用戶接受使用sdk/API來執行搜索（雖然這個聲明式不如SQL強大）。

　　向量數據庫使用的底層搜索、索引技術和推薦系統中的向量召回是高度重合的。

向量數據庫內核面臨的技術挑戰及應對措施

百億級向量檢索的向量數據庫是如何構建的？

星環科技向量數據庫從 0 到 1 技術實踐：提升數據處理的精確度是重中之重

深入理解搜索引擎-搜索召回

推薦系統之召回

「向量召回」相似檢索算法——HNSW（pg_embedding使用的就是HNSW算法）

使用向量召回的一些經驗

深入淺出推薦系統（四）：召回：向量化的潮流（重點講embedding）

向量檢索：提升召回場景下的信息檢索精度

向量嵌入(vector embeddings)

推薦策略產品經理必讀系列—第五講推薦系統的向量召回

【推薦系統】向量召回算法 HNSW

搜索召回 | Facebook: 億級向量相似度檢索庫Faiss原理+應用

Faiss向量召回引擎如何做到快速查找最近鄰

向量檢索速度慢？看看這個Faiss索引實操

向量數據庫應用場景

向量數據庫個人筆記

向量數據庫在大模型中扮演什麼角色

AI行業專題報告：向量數據庫，AI時代的Killer App

What is a Vector Database?

GPT成功背後的祕密--向量數據庫簡介

langchain(3)—向量數據庫調研及簡單性能測試（包括測試數據集，建模方法）

向量數據庫排名

https://byby.dev/vector-databases

https://github.com/topics/vector-database

https://press.ai/best-vector-databases/#

綜合github/國外排名/國內分析來看，開源中基於es，faiss，milvus的方案比較有較大競爭力。

基於ElasticSearch的方案參考

使用向量檢索插件（aliyun-knn）

向量數據庫：使用Elasticsearch實現向量數據存儲與搜索

高維向量搜索：在 Elasticsearch 8.X 中利用 dense_vector 的實戰探索

什麼？！Elasticsearch也可以用作向量數據庫？

基於postgresql的方案參考

https://github.com/pgvector/pgvector

https://neon.tech/blog/pg-embedding-extension-for-vector-search（採用HNSW算法）

https://access.crunchydata.com/documentation/pgvector/latest/pdf/pgvector.pdf

AI大模型與向量數據庫 PGVECTOR

https://github.com/yoshioterada/PostgreSQL-Vector-Search-pgvector--for-PDF-file-on-Blob-Storage-english

比 pgvector 快 20 倍的 Postgres 向量運算插件：pg_embedding

PASE: PostgreSQL Ultra-High-Dimensional Approximate Nearest Neighbor Search Extension

基於 PostgreSQL 構建 AI 電商產品圖片相似度搜索方案

談論AI 時被經常提及的“嵌入（embedding）”和“向量（Vector）”到底是個啥？

一文帶您瞭解向量數據庫：大模型場景下知識管理新方式

基於redis的參考方案

將Redis向量相似性搜索應用於文檔搜索和檢索的用例】'Redis arXiv Search - Vector search demo with the arXiv paper dataset, HuggingFace, OpenAI, FastAPI, React, and Redis as the vector database.' Redis Ventures GitHub: github.com/RedisVentures/redis-arXiv-search

Redis arXiv Search

Redis 7.2 里程碑版本發佈，向量搜索速度提高 16 倍

利用Redis實現向量相似度搜索：解決文本、圖像和音頻之間的相似度匹配問題

milvus方案

是什麼推動了Milvus向量數據庫中的相似性搜索

召回技術(向量檢索工具faiss篇) milvus基於faiss庫

Milvus 系統設計理念的再次思考

Introduction to Milvus

Milvus探究與壓測分析

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

京東面試：如何進行JVM調優？

JVM 調優是一個很大的話題，在回答“如何進行 JVM 調優？”之前，首先我們要回答一個更爲關鍵的問題，那就是，我們爲什麼要進行 JVM 調優？只有知道了爲什麼要進行 JVM 調優之後，你才能準確的回答出來如何進行 JVM 調優？要進行

Java中文社羣

2024-05-21 14:43:06

WinSW——將.exe文件註冊爲服務的一個工具

https://github.com/winsw/winsw

2024-05-21 14:34:55

Azure Service Principals ----- Azure 上最好保守的祕密的服務

一，引言　　Azure Service Principals 是 Azure Active Directory (AAD) 中的一種標識，代表應用程序，服務，自動化流程。Service Principals 支持各種 Azure 服務和資

2024-05-21 14:34:25

程序設計思路-球連球組成的羣

　　編碼設計有很多思路，都是在簡化映射實際問題時遇到的問題。　　之前和別人交流，得到一句“把它放在同一個地方好維護”，相同的功能只出現在一個地方。就會出現代碼的聚合設計，也就是一種通用的功能索引，或者說面向對象的思想。　　首先程序可以被

2024-05-21 14:32:55

Flink內存模型

之前聊Flink的slot時簡單提到過內存，Flink計算框架的內存大致分爲Flink使用的內存、Jvm使用的內存。Flink爲什麼不全使用JVM內存的原因是顯而易見的，作爲實時計算框架，JVM內存依賴GC自動回收一旦稍微慢一點，就會對

人不瘋狂枉一生

2024-05-21 14:32:45

Flink富函數

富函數是DataStream API提供的函數接口，Flink的函數都有它的Rich版本，它與其他函數不同的是，富函數可以獲取到運行環境上下文，初始化參數，擁有生命週期方法等，可通過它進行自定義複雜功能。我們常見的如RichMapFu

人不瘋狂枉一生

2024-05-21 14:32:45

YiShaAdmin：一款基於.NET Core Web + Bootstrap的企業級快速開發框架

前言今天大姚給大家分享一款基於.NET Core Web + Bootstrap的企業級快速後臺開發框架、權限管理系統，代碼簡單易懂、界面簡潔美觀（基於MIT License開源，免費可商用）：YiShaAdmin。項目官方介紹 YiS

2024-05-21 14:31:45

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

大家好，我是R哥。最近做 Java 面試輔導，有個兄弟面試美團，遇到一個特別有意思的問題：一萬個 if else 如何優化，有好的解決方案嗎？我看到這問題都有點懵逼，現實項目中怎麼可能會有 10000 個 if else 的代碼

2024-05-21 14:31:14

一種精度更高的hopf直線檢測策略, 一種高精度邊緣檢測方法.

#aaa是cv.read圖片. img = aaaa.copy() gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) ret, binary = cv2.threshold(gray, 0, 25

張博的博客

2024-05-21 14:29:34

深入瞭解安全工具Vault、Vault根令牌和解封密鑰，詳細整理部署Vault的詳細步驟

一、深入瞭解安全工具Vault Vault是一種開源工具，用於安全地存儲、管理和控制訪問各種機密信息，如密碼、API令牌、安全配置和其他敏感數據。Vault使用強大的加密和安全管理技術來保護這些機密信息，併爲應用程序和服務提供安全的訪問

2024-05-21 14:23:34

keycloak~作爲第三方登錄的對接標準

當某些合作商希望把你的keycloak作爲他們的一種第三方登錄方式時，就像微信，google，github，使用你的keycloak上的賬戶資源時，你就需要考慮如何做一個開放的，標準的文檔了。一基本角色認證提供者：keycloak服

2024-05-21 14:22:24

hdu4027（線段樹區間操作）

Problem - 4027 (hdu.edu.cn)許多邪惡的戰艦在戰鬥前排成一排。我們的指揮官決定使用我們的祕密武器來消滅戰列艦。每艘戰列艦都可以標記爲耐力值。對於我們祕密武器的每一次攻擊，它都可能降低連續部分戰列艦的續航能力，使它們

2024-05-21 14:20:03

Python 將PowerPoint (PPT/PPTX) 轉爲HTML

PPT是傳遞信息、進行彙報和推廣產品的重要工具。然而，有時我們需要將這些精心設計的PPT演示文稿發佈到網絡上，以便於更廣泛的訪問和分享。本文將介紹如何使用Python將PowerPoint文檔轉換爲網頁友好的HTML格式。包含兩個簡單示例：

2024-05-21 14:19:53

如何構建一個系統

假設有要處理的數據 A1 A2 A3 ... 你想要設計一個功能 F，這個F應該處理數據 Ai，那麼你需要編寫程序P=F，是的： O1 = F(A1) O2 = F(A2) O3 = F(A3) ... 如果寫了個F，一次就解決了，那就萬事

2024-05-21 14:18:13

172.22.56.0/22

172.22.56.0/22 56對應的二進制是00111000, 16+6=22。所以第三個byte的後面2位bit可以使用。 The IP address and subnet mask you provided, 172.22.5

2024-05-21 14:16:52

24小時熱門文章

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

最新文章

最新評論文章