原创 圖說卡爾曼濾波(正在進行時)

什麼是卡爾曼濾波? 你可以在任何含有不確定信息的動態系統中使用卡爾曼濾波器來對系統的下一步做出有根據的預測。即使有噪聲信息的干擾,卡爾曼濾波器也能弄清楚真實發生的事情。 卡爾曼濾波器非常適合持續變化的系統。它運行速度快,佔用內存小(只需記

原创 NVCaffe訓練過程中設置多個test文件

    多test,what?通常我們在使用caffe訓練模型的時候會設定一個測試間隔(test_interval),也就是每test_interval次迭代就跑一次驗證集,觀察一下loss的變化情況。最近在訓練一個睜閉眼檢測的小模型,爲

原创 【NVCaffe源碼分析】AnnotatedDataLayer(2)

LayerSetUp     上一篇講了 AnnotatedDataLayer 的構造函數部分,在完成對象的初始化後緊接着會調用每一層的 LayerSetUp(...)函數來對各層進行相應的設置。注意到 AnnotatedDataLaye

原创 NVCaffe中detection_output_layer多卡訓練過程中保存測試結果的問題

    我們通常在訓練過程會設置每隔一定的迭代次數(test_interval)就跑一次valid,如果你使用的是多卡,查看訓練日誌你會發現有多條測試結果,他們出來不同的solver。最近在用caffe-jacinto跑ssd的時候突然想

原创 【NVCaffe源碼分析】AnnotatedDataLayer(3)

load_batch 在上一篇文章中談到 BasePrefetchingDataLayer 中的線程函數借助 load_batch 函數從 data reader 中取得數據並進行一系列操作。現在就來看看 AnnotatedDataLay

原创 【NVCaffe源碼分析】數據增量之batch_sampler

    batch_sampler是生產隨機樣本patch的方法,是一種常用的數據增量(DataAugment)策略。具體說來,它從訓練數據圖像中隨機選取一個滿足限制條件的區域。這裏有兩點,一個是隨機選取,另一個就是得滿足限制條件。限制條

原创 TextBoxes++在 ubuntu16.04上的編譯及訓練

    論文地址:https://arxiv.org/abs/1801.02765,發表於 AAAI2018     Github地址:https://github.com/MhLiao/TextBoxes_plusplus.git  

原创 【NVCaffe源碼分析】SigmoidCrossEntropyLossLayer

    交叉熵 loss 用於度量兩個概率分佈之間的相似性(度量兩個概率分佈之間相似性的方法有很多,交叉熵是其中之一),放在我現在所做的深度學習具體項目中來說就是要度量模型預測出來的概率分佈與gt分佈之間的相似性。 其中爲預測概率分佈,

原创 【NVCaffe源碼分析】AnnotatedDataLayer(1)

    對NVCaffe數據讀取與處理部分的解讀並不像直接解讀某個 layer 一樣結構清晰,需要撥開幾層迷霧才能見到真相。我對數據部分的瞭解直接從解讀 AnnotatedDataLayer這一 層的源代碼開始,並以下面這份參數配置作爲參

原创 記一種車牌矯正或精修方法

        最近在做一個車牌識別的小項目,之前也沒這方面的經驗,我大概也就是按照一般步驟:1). 車牌檢測;2).車牌校正;3).車牌文字識別這麼個三步走的策略來弄。在現實場景中,檢測出來的車牌通常都不是那麼正規正矩,帶有一定的傾斜角

原创 【論文解讀】ZFNet中的特徵可視化

    這篇文章通過對特徵圖進行可視化,使得神經網絡這個黑盒不再那麼黑。ZFNet的網絡結構是基於AlexNet改的,如下圖所示,比較清晰明瞭。 從上圖注意到,ZFNet含5個卷積層Layer1~Layer5以及2個fc層Layer6、

原创 【論文解讀】特徵金字塔網絡-FPN

題目:《Feature Pyramid Networks for Object Detection》 介紹          圖1(a)表示使用圖像金字塔來構造特徵金字塔,每一張圖像都會獨立地計算出它的特徵。(b)表示利用單一尺度的特徵圖

原创 【論文解讀】DetNet

  題目:《A Backbone network for Object Detection》 介紹        基於CNN的目標檢測器可以分爲兩類:單階段(one-stage)檢測器,如YOLO、SSD、RetinaNet,以及雙階段(

原创 MaskRCNN-Benchmark框架Assertion 't ** 0 && t ** n_classes' failed可能的原因

        Mask R-CNN Benchmark是一個完全由PyTorch 1.0寫成,快速、模塊化的Faster R-CNN和Mask R-CNN組件。該項目旨在讓用戶更容易地創建一種模塊,實現對圖片中物品的識別與分割。具有以下

原创 【OpenCV實戰】讀取並處理視頻文件幀

    爲什麼要有這個小例子,因爲在做目標檢測的時候經常要讀取視頻幀,並在訪幀上進行目標檢測再播放出來以觀察效果。 # coding: utf-8 import numpy as np import cv2 import os # V