原创 Faster RCNN交替訓練法詳解

對Faster RCNN的詳解類文章實在是數都數不過來,這些詳解類的文章大多是從網絡結構角度出發,對於Faster RCNN的訓練流程介紹的比較少。從我個人的經歷來看,感覺單純的理解網絡結構對Faster RCNN理解的還不夠透徹,尤其是

原创 Faster RCNN AnchorTargetLayer ProposalLayer ProposalTargetLayer詳細對比

Faster RCNN中三個比較重要的層,其作用位置、功能詳細對比如下。三種層的出現順序依次爲AnchorTargetLayer、ProposalLayer、ProposalTargetLayer:   Alt trainging End

原创 Faster RCNN近似端到端法詳解

有了交替訓練法的基礎,近似端到端的訓練方法就非常好理解了。 相比於交替訓練法,端到端訓練主要有兩點不一樣: 1)網絡結構: RPN的輸出個數:此處的輸出個數不是指損失函數,而是指RPN的輸出不僅送入AnchorTargetLayer層計算

原创 對numpy axis(軸)的理解

之前對numpy函數中axis參數所指向的數據一直無法完全理解,但是接觸過跨度的概念之後,對axis參數所指向的數據纔有所理解。 以numpy.sum函數爲例,初始化一個維度爲2*3*4維的全一矩陣,代碼如下: arr = np.one

原创 keras.utils.Sequence使用注意事項

1)在實現自己的DataLoader過程中一般都是繼承自keras.utils.Sequence,繼承該類必須要實現__len__與__getitem__兩個函數。 2)在調用fit_generator進行訓練時,如果設置了step_pe

原创 opencv 圖片旋轉截斷問題解決方法

在使用opencv對圖片進行旋轉縮放的過程中會出現原圖截斷的問題,這個問題其實可以直接通過設置參數解決。 一般使用opencv對圖片進行旋轉縮放的流程是首先調用“getRotationMatrix2D”獲得仿射變換矩陣,然後調用“warp

原创 TypeError: Layout of the output array image is incompatible 問題解決

本週在使用findContours的過程中遇到了以下問題: TypeError: Layout of the output array image is incompatible with cv::Mat (step[ndims-1] !

原创 sourcetree本地分支無法顯示問題解決方法

在sourcetree使用過程中出現推送對話框裏面本地、遠程分支什麼都不顯示的問題。 https://community.atlassian.com/t5/Sourcetree-questions/Sourcetree-Push-dial

原创 圖片仿射變換原理與實現

圖像仿射變換共有“旋轉”、“平移”、“錯切(shear)”、“縮放”、“翻轉”5種。本文結合keras-retinanet的實現進行分析。之所以採用keras-retinanet進行分析,是因爲該實現較爲典型,比較容易理解。 keras-

原创 卷積神經網絡相關內容總結

1)ResNet (1)Deeper Bottleneck Architectures bottleneck架構設計的目的就在於減少參數數量,進而縮短訓練時間。注意bottleneck只在resnet50、resnet101、resnet

原创 對於ssd對小目標檢測效果的思考

對於ssd模型對於小目標檢測效果不好的問題,我認爲可以結合.prototxt文件進行分析,以conv4_3_norm_mbox_priorbox爲例: prior_box_param { min_size: 30.0

原创 darknet源碼剖析(六) 模型訓練初探

終於到了最核心的部分了,模型訓練的過程由兩個部分組成,分別是正向傳播與反向傳播的過程。 首先來看模型的正向傳播過程,還是根據函數的調用過程。 (1)train_network(network.c) int batch = net

原创 記一次git排故過程

1)今天在git clone過程中首先遇到如下問題: RPC failed; curl 56 SSL read: error:00000000:lib(0):func(0):reason(0), errno 10054 核心內容就是er

原创 pytorch學習(一)

1)pytorch tensor初始化方法: (1)使用empty構造空tensor x = torch.empty(5,3) (2)使用rand構造均勻分佈的tensor,使用randn構造標準分佈的tensor x = torch

原创 Focal loss分析

1)Class imbalance問題的提出 Focal loss的提出就是問了解決Class imbalance問題,在兩階段目標檢測算法中,這一問題是通過兩階段級聯與啓發式採樣策略解決的(Class imbalance is addr