原创 傳統人臉檢測算法 論文閱讀筆記

梳理: A Convolutional Neural Network Cascade for Face Detection是CNN與級聯思想在檢測的應用 From Facial Parts Responses to Face Detect

原创 人臉集數據庫

數據集 圖片數量 人臉數量 關鍵點數量 主要用途 優點 缺點 適用方法 AFLW 16k 25k 21(點不全)/85 (點全,但無側臉) 人臉檢測/ 人臉矯正 包含各種自然情況下的人臉(多角度、年齡、

原创 論文《FDDB: A Benchmark for Face Detection in Unconstrained Settings》導讀

  說到人臉檢測,就要談一談FDDB,FDDB提供了人臉檢測的一個標準,其檢測結果可以作爲業界內的一個標杆,關於FDDB的具體標準,在該論文中有詳細敘述,在此記錄下我的解讀。 該論文共有八個章節和倆個附錄,結構明晰內容清楚,接下來分章

原创 Joint Cascade Face Detection and Alignment(JDA)文檔

地址:https://github.com/luoyetx/JDA 一、算法流程圖: 訓練過程: 檢測過程: 二、類圖: 從上圖可以看出整個系統主要分爲兩大模塊,數據存儲模塊與CART模塊,兩個模塊集中於JDA分類器上,整個系統只實

原创 論文《Face Alignment at 3000 FPS via Regressing Local Binary Features》筆記

論文:Face Alignment at 3000 FPS via Regressing Local Binary Features.pdf 實現:https://github.com/luoyetx/face-alignment-

原创 shape-indexed特徵

shape-indexed特徵被用於關鍵點檢測,在論文Face Alignment by Explicit Shape Regression.pdf有對該特徵的說明,本篇wiki主要介紹該特徵的方方面面。 shape-indexed

原创 論文《A Convolutional Neural Network Cascade for Face Detection》筆記

論文:A Convolutional Neural Network Cascade for Face Detection.pdf 實現:https://github.com/anson0910/CNN_face_detection

原创 論文《From Facial Parts Responses to Face Detection: A Deep Learning Approach》筆記

論文:From Facial Parts Responses to Face Detection A Deep Learning Approach.pdf 實現:暫無 這篇論文發表於ICCV2015,很有借鑑意義,論文提出了一個新

原创 論文《Joint Cascade Face Detection and Alignment》筆記

論文:Joint Cascade Face Detection and Alignment.pdf 實現:https://github.com/FaceDetect/jointCascade_py 部分內容引用自:http://w

原创 tf1.7+cuda9.0+cudnn7.0.3+tensorRT3.0.4編譯

cuda和cudnn的安裝沒有什麼特別的, tensorflow和tensorRT按照官方的文檔步驟裝就可以。 這裏主要有幾個坑需要注意: 1、tf編譯時候會有大量undeference 到cudnn和cublas的報錯,導致編譯失敗,需

原创 《Query-dependent Aesthetic Model with Deep Learning for Photo Quality Assessment》 論文學習筆記

論文提出了一種“上下文相關”的美學質量評價模型,與以前所不同在於 1)放棄手寫特徵 2)不適用統一模型評價所有圖片 3)不依賴其他輔助信息,不針對特定類別 網絡設計: 網絡有三個卷積層,倆個全連接層,設計的十分簡單,但效果要比複雜的網絡

原创 視頻黑邊去除算法(python+opencv)

黑邊是指視頻中存在的黑色或白色邊框,這類邊框存在於很多視頻中,由於黑邊的存在,哈希值的提取收到了它的干擾,尤其對於dhash來說,影響非常大,容易造成誤判。在v1.0排重算法中,採用的黑邊去除方法是opencv自帶的函數,該函數對於包含l

原创 視頻分類算法(《《Learnable pooling with Context Gating for video classification》)

一般的視頻理解方法通常對一段視頻的間隔幀提取特徵,取它們的極大值或均值來代表整段視頻的特徵,這是一種很簡單的視頻表示方法,但是容易陷入局部最優解,論文爲此探索了一種可學習的池化技巧(learnable pooling techniques

原创 "NetVLAD"場景識別模型解讀

c論文: NetVLAD: CNN architecture for weakly supervised place recognition 來源:CVPR 2016 應用:NetVLAD是一種場景識別算法,但實際上其不僅僅能應用於場景識

原创 BOF、FV、VLAD算法淺析

BOF、FV、VLAD等算法都是基於特徵描述算子的特徵編碼算法,關於特徵描述算子是以SIFT爲基礎的一類算法,該類算法能得到圖片的一系列局部特徵,該類特徵對旋轉、縮放、亮度變化保持不變性,對視角變化、仿射變換、噪聲也保持一定程度的穩定性,