原创 這就是神經網絡 7:深度學習-目標檢測-超詳細圖解Faster R-CNN

本文動機 說實話,介紹Faster R-CNN的文章我看了很多,論文的英文原文和翻譯都看過,我知道two-statge和anchor的主要思想,可是我腦子裏始終沒法建立一個完整的Faster R-CNN的框架,有太多的細節沒有搞清

原创 這就是神經網絡 6:SqueezeNet和Xception

概述 之前也寫博客介紹過輕量化神經網絡架構:《集異璧-神經網絡結構 5:輕量化神經網絡–MobileNet V1、MobileNet V2、ShuffleNet V1、ShuffleNet V2》。 但是那篇文章沒有包含Squee

原创 這就是神經網絡 9:深度學習-語義分割-FCN、U-Net、SegNet

FCN 簡介 FCN全稱是‘Fully Convolutional Networks’,也就是全卷積網絡。這個網絡去掉了全連接層,網絡結構裏只有卷積(池化和反捲積)操作。本文的FCN特指這個語義分割網絡,而非廣義的全卷積網絡。 作

原创 這就是神經網絡 8:深度學習-目標檢測-SSD和DSSD

前言 最近有一篇綜述目標檢測的論文《Deep Learning for Generic Object Detection: A Survey》,來自首爾國立大學的 Lee hoseong 在近期開源了「deep learning

原创 行人(客流)計數的一些底層技術

概述 自己之前寫過一篇文章介紹自己做的行人(客流)計數的工作:基於檢測和多目標跟蹤的客流統計功能小結 這篇文章利用行人檢測及多目標跟蹤技術,對過邊線的人數進行計數。檢測和多目標跟蹤我就不多說了,這裏說一下如何進行過線檢測。 基本思

原创 項目實踐中對語義分割網絡DeepLabV3+的改進

概述 最近用DeepLabV3+做了一些語義分割的工作,從github上下載了別人實現的tensorflow實現。發現速度不能滿足需求,所以本人對DeepLabV3+做了一些改進。 原始的網絡結構 下圖左側是DeepLabV3的結

原创 這就是神經網絡 18:深度學習-文字識別OCR-CRNN

概述 在之前項目中用過CRNN做OCR,我在這裏記錄一下我對這個算法的理解,我沒有對比代碼去看,主要結合別人的博客略讀論文。 聲明一下,主要參考了文末的《一文讀懂CRNN+CTC文字識別》這篇文章,基本講的非常易懂。另外,本算法的

原创 基於語義分割的身份證部件解析和文字檢測

概述 這個工作主要是利用之前項目的語義分割算法,順便探索一下身份證部件解析的功能。安排實習生利用合成的身份證照片進行了語義分割的標註。 我的目的有兩個:1.檢測身份證上的信息是否齊全;2.確定身份證各文字信息的位置,把文字摳出來給OC

原创 tensorflow 23:從ckpt文件導出固化PB文件

概述 需要從ckpt文件生成固化的PB文件,給生成現場用。現在我探索下不依賴代碼裏的網絡結構、僅僅用CKPT文件來生成PB文件。 轉化 訓練生成的ckpt文件目錄如下: $ ls ./ckpt0507/ checkpoint

原创 這就是神經網絡 17:深度學習-評價指標_ROC_mAP

概述 本文主要講述目標檢測指標mAP。主要也是自己做這塊有段時間,但是這個指標一直沒弄的特別清楚。而且網上很多博客寫的並不準確,會給人不少舞蹈,希望自己的文章能幫到別人。 基礎知識 true positive, false posit

原创 自制人臉分割/解析數據集:helen_small4seg(附網盤下載地址)

概述 我用原始的helen數據,挑選了部分標註比較好的圖片,生成了一個規模較小的人臉解析/分割數據集,放在網盤上供大家下載。 原始helen數據集介紹 關於helen數據集的介紹,請參考我之前的博客:《人臉解析(Face Parsin

原创 目標檢測中的檢測框合併策略:NMS和Soft-NMS

概述 目標檢測中的Region Proposal動輒上千,會形成大量有重合的檢測框,需要使用某些算法對檢測框去重。 常用的兩種算法是NMS和Soft-NMS。 NMS 全稱‘非極大值抑制(non maximum suppression

原创 這就是神經網絡 14:深度學習-目標檢測-YOLOv1、YOLOv2、YOLOv3

YOLO YOLO是與SSD齊名的one_stage目標檢測算法代表。SSD系列有比較多的變體,大部分都不是SSD作者做的工作。而YOLO目前已經進化到V3,據我所知都是yolo作者自己做的工作。 網絡結構 由於yolo屬於one_s

原创 這就是神經網絡 13:語義分割loss函數和評價指標

序 最近剛剛完成自己規劃的語義分割部分論文閱讀,算是一個小結吧。 語義分割的LOSS函數 語義分割對像素的分類,可以用交叉熵作爲loss函數。 但是語義分割也有自己的特殊性,整個環面中前景物體有時會有較小的佔比(比如醫學圖像中的病竈)

原创 這就是神經網絡 12:深度學習-語義分割-DeepLabV1、V2、V3和V3+

概述 說到語義分割,谷歌的DeepLab系列都是一個無法繞過的話題。目前這個系列共出了4個版本:V1、V2、V3和V3+。 本文主要關注DeepLabV3+和DeepLabV3。V1、V2作爲前作,有一定的參考價值,但是我精力有限,這