原创 slam第六講(視覺里程計1_1)

VO按是否需要提取特徵,分爲特徵點法的前端和不提特徵的前端。這一章講的是基於特徵點法的前端,分爲以下內容。 特徵點法:找到兩張2D圖像上的匹配點。 對極幾何:根據2D-2D特徵點對求解R,t。 三角測量:根據2D-2D特徵點求深度。 P

原创 yolo_v3

一.概述 YOLO算法的基本思想是:首先通過特徵提取網絡對輸入圖像提取特徵,得到一定size的feature map,比如13*13,然後將輸入圖像分成13*13個grid cell,接着如果ground truth中某個object的中

原创 BN、LN、IN、GN

常用的Normalization方法主要有:Batch Normalization(BN,2015年)、Layer Normalization(LN,2016年)、Instance Normalization(IN,2017年)、Gro

原创 roidb.py

roidb是比較複雜的數據結構,存放了數據集的roi信息。原始的roidb來自數據集,在trian.py的get_training_roidb(imdb)函數進行了水平翻轉擴充數量,然後prepare_roidb(imdb)【定義在roi

原创 soft nms

一.動機 非最大抑制(Non-maximum suppression, NMS)是物體檢測流程中重要的組成部分(如下圖劃線部分)。NMS算法首先按照得分從高到低對建議框進行排序,然後分數最高的檢測框M被選中,其他框與被選中建議框有明顯重疊

原创 ctpn詳解

一.概述 對於複雜場景的文字識別,首先要定位文字的位置,即文字檢測。這一直是一個研究熱點。 文本檢測可以看成特殊的目標檢測,但它有別於通用目標檢測.在通用目標檢測中,每個目標都有定義好的邊界框,檢測出的bbox與當前目標的groundtr

原创 anchor_target_layer.py

這層並不會被用在測試中,只會在訓練中起作用,用於cls和reg的loss的回傳 bbox inside weights 用來設置正樣本回歸loss的權重,默認爲1(負樣本爲0)(負樣本爲0,即可以區分正負樣本是否計算 loss) 原文中

原创 yolo_v1

一.yolo概述 作者在YOLO算法中把物體檢測(object detection)問題處理成迴歸問題,用一個卷積神經網絡結構就可以從輸入圖像直接預測bounding box和類別概率。 YOLO算法的優點:1、YOLO的速度非常快。在T

原创 CRNN詳解

一.概述 常用文字識別算法主要有兩個框架:                  CNN+RNN+CTC(CRNN+CTC) CNN+Seq2Seq+Attention 本文介紹第一種方法。 CRNN是一種卷積循環神經網絡結構,用於解決基於圖

原创 MobileNet_v2

一.概述 MobileNetV1網絡是一條路的單通道結構,沒有feature map的複用。ResNet和DenseNet等網絡的提出,也驗證了feature map複用對提升網絡性能的有效性,MobileNetV2便應運而生。Mobil

原创 east文本檢測

一.簡介  近年來,提取和理解在自然場景中的文本信息變得越來越重要和普遍,ICDAR系列競賽的參與者的數量以及NIST發起的TRAIT 2016評估都證明了這一點。文本檢測作爲文本識別、機器翻譯等後續過程的前提條件,其核心是區分文本和背景

原创 Inception系列

一.Inception V1 Inception v1的原始Inception module如下所示:                          首先解釋一下這種Inception module的好處,從Alexnet到VGG,網

原创 ROI Pooling和ROI Aligen

ROI Pooling可以在Faster RCNN中使用以便使生成的候選框region proposal映射產生固定大小的feature map。 ROI Align 是在Mask-RCNN這篇論文裏提出的一種區域特徵聚集方式, 很好地

原创 MobileNet_v1

一.概述 深度學習能夠很好解決部分計算機視覺相關的問題,但是其需要依靠強大的計算能力作爲支撐。深度學習在能耗有限,計算資源有限和存儲空間有限的移動端部署困難重重。 在不改變網絡結構的前提下,網絡稀疏化,量化是加速和壓縮深度神經網絡模型的重

原创 馬爾可夫鏈蒙特卡羅算法(MCMC)-(一)

作爲一種隨機採樣方法,馬爾科夫鏈蒙特卡羅(Markov Chain Monte Carlo,以下簡稱MCMC)在機器學習,深度學習以及自然語言處理等領域都有廣泛的應用,是很多複雜算法求解的基礎。比如分解機(Factorization M