基於內容的圖像檢索技術:從特徵到檢索

基於內容的圖像檢索(CBIR, Content Based Image Retrieval)是相對成熟的技術領域,在工業界也有廣泛的應用場景,如搜索引擎(Google、百度)的以圖搜圖功能,各電商網站(淘寶、Amazon、ebay)的相似商品搜索,社交平臺(Pinterest)的相似內容推薦等。本文從圖像檢索流程出發,結合我們團隊在社交應用中的相似圖片、視頻檢索中的實踐經驗,介紹構建基於內容的圖像檢索系統所涉及的算法技術,包括特徵提取、索引構建、近鄰搜索等技術,供相關領域研發人員參考。

在介紹視覺內容檢索流程前,先來回顧下文本檢索流程。

一、相似文本檢索

相似文本檢索可以分成構建詞庫、構建索引和檢索三部分,如下圖所示。

#知乎打大括號好難,所以此處用'僞僞代碼',湊合看吧
if q(x) == q(y) && h(b(x), b(y))<= h_t:
  f(x,y) = tfidf(q(x))
else:
  f(x,y) = 0


參考文獻

[1]. Video google: a text retrieval approach to object matching in videos, 2003.

[2]. Aggregating local descriptors in to a compact image representation, 2010

[3]. Large scale image retrieval with compressed Fisher Vectors, 2010

[4]. Triangular embedding, 2014

[5]. Nueral codes for image retrieval, 2014

[6]. Aggregating deep convolutional features for image retrieval, 2015

[7]. Spectral hashing, 2018

[8]. Deep hashing with category mast for fast video retrieval, http://cn.arxiv.org/abs/1712.08315

[9]. Deep learning of binary hash codes for fast image retrieval, 2015.

[10]. p-stable LSH: locality-sensitive hashing scheme based on p-stable distributions, 2004.

[11]. Hamming embedding and weak geometric consistency for large scale image search, 2008.

[12]. https://blog.csdn.net/icvpr/article/details/12342159

[13]. The inverted multi-index, 2012.

[14]. Efficient indexing of billion-scale datasets of deep descriptors, 2016.

[15]. Product quantization for nearest neighbor search, 2011.

[16]. Visual search at ebay, 2017.

[17]. Visual search at Pinterest, 2017.

[18]. https://github.com/facebookresearch/faiss

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章