原创 方案六 阿里商品搜索

圖像搜索技術主要分爲五個算法模塊: 類目預測:僅通過圖片特徵進行圖片的區分是有限制的,所以可以通過類目的預測進行目標判斷,這樣就無需對整個圖像庫進行全局搜索,只需搜索相應的某個類目圖片。類目搜索不但可以提升搜索的效率,也可以提升搜索的

原创 模型壓縮概述

前言自從AlexNet一舉奪得ILSVRC 2012 ImageNet圖像分類競賽的冠軍後,卷積神經網絡(CNN)的熱潮便席捲了整個計算機視覺領域。CNN模型火速替代了傳統人工設計(hand-crafted)特徵和分類器,不僅提供了一種端

原创 極大似然估計與貝葉斯的理解

轉自http://blog.csdn.net/zengxiantao1994/article/details/72787849 極大似然估計         以前多次接觸過極大似然估計,但一直都不太明白到底什麼原理,最近在看貝葉斯

原创 方案八 CNN PQ

中科院2016年的專利 本發明公開了一種基於CNN(卷積神經網絡)的快速圖像檢索方法,第一階段是利用CNN網絡對要檢索的圖像進行特徵提取,得到代表圖像的矢量特徵。第二階段是在特徵數據庫中對此矢量特徵進行k近鄰檢索。本發明選擇基於GOOGL

原创 方案九 閒魚 hessian-affine 特徵點檢測 + sift 描述子

數據集準備: 1.圖片庫:取線上1000個視頻,對每個視頻每隔1秒抽一張視頻幀圖片,作爲總圖片庫。 2.待查詢圖片:定義7種圖片變換方式:旋轉、拉伸、調整亮度、裁剪、加字幕、無處理,每種變換生成100個樣本。每個樣本的生成方式爲:從100

原创 方案二 phash

phash具體的實現可以很多地方都有了,可以搜到很多差不多的內容,在這我也就簡單的記錄下,具體可以去谷歌或者百度搜下。 縮小尺寸 爲了後邊的步驟計算簡單些 簡化色彩 將圖片轉化成灰度圖像,進一步簡化計算量 計算DCT 計算圖片的

原创 方案三 感知哈希&局部不變特徵

思路:先把已標位正牌的圖標特徵(dhash,ahash,phash等)收集起來形成一個特徵庫,新圖標來了則提取其特徵去特徵庫裏匹配,如果匹配到了相似度極高的則直接認定其爲仿冒圖標;如果匹配到了相似度較高的則轉入sift,gist高級特徵

原创 CNN_模型壓縮加速&移動端部署_蒸餾算法

 總結:離線蒸餾重點在使用小網絡獲得大網絡的能力,在線蒸餾在於提升模型的精度和訓練時間。 現有的加速庫有:Intel的Neural Network Distiller和騰訊的PocketFlow。 一 、離線蒸餾     2014 年Hi

原创 方案六 V3 阿里商品搜索最新版(2018paper)

阿里巴巴視覺搜索研發團隊結合目前最先進的深度學習技術和自身的業務特點,經過4年的迭代研發,其目前視覺搜索系統的主要技術特點: 1.結合分類建模與近鄰搜索技術的精準有效的類別預測方法; 2.通過弱監督學習實現目標檢測和特徵表示的CNN架構的

原创 方案一 感知哈希

第一步,縮小尺寸。 將圖片縮小到8x8的尺寸,總共64個像素。這一步的作用是去除圖片的細節,只保留結構、明暗等基本信息,摒棄不同尺寸、比例帶來的圖片差異。 第二步,簡化色彩。 將縮小後的圖片,轉爲64級灰度。也就是說,所有像素點總共只有6

原创 方案十 百度識圖 宏觀直觀分析

百度分爲通用和細粒度識別 通用識別如下 細粒度識別如下

原创 方案五 CNN&cdvs

博雲視覺 20161208    目前百度識圖中相似結果是百度IDL通過深度學習提供,而識別結果則是先由深度學習進行語義分類,再由CDVS做精準搜索。 之後,自己又在上面的過程中細化很多種具體是實施方案,並撰寫相關的專利,網頁鏈接: ht

原创 方案四 orb&顏色直方圖&hog

攜程技術方案 對於酒店中的相同/相似圖像,大部分全局特徵(比如顏色、紋理和HOG)不能很好地解決圖像裁剪殘缺和旋轉變化等問題;一些局部特徵(比如SIFT和SURF)與基於深度學習的特徵雖然表達效果較好,但是由於特徵提取複雜,計算速度過於

原创 方案七 bag of word

鏈接:https://cloud.tencent.com/developer/news/293017

原创 方案六 V2 阿里拍照購方案 分級類目+triplet 多任務學習、one pass k_means聚類

20170808 拍立淘的技術框架 拍立淘存在典型的技術驅動,在過去的三年多時間,我們不斷得通過技術的突破,來實驗了業務的增長。 拍立淘流程主要分爲離線流程和在線流程,主要步驟如下: 離線流程:主要是指拍立淘每天離線構建索引庫的整個流