原创 Faster RCNN roi_pooling_layer.cpp roi_pooling_layer.cu

主要定義了一個 ROIPoolingLayer 類 ROIPoolingLayer的受保護數據成員有: int channels_; int height_; int width_; int pooled_height_; //

原创 Faster RCNN pascal_voc.py

主要定義了一個pascal_voc類,在類的內部定義了它的一些屬性和方法。 def _init_(self, image_set, year, devkit_path=None) 構造器方法 def __init__(self,

原创 Faster RCNN layer.py

def setup(self, bottom, top)方法: 該方法主要是在創建RoIDataLayer的時候調用,初始化self._name_to_top_map(從blobname 到 blobid的一個映射)。結合_caf

原创 Faster RCNN train.py

定義了一個類:class SolverWrapper class SolverWrapper(object): """A simple wrapper around Caffe's solver. This wr

原创 Faster RCNN imdb.py

def create_roidb_from_box_list(self, box_list, gt_roidb): 從box_list 中讀取每張圖像的boxes def create_roidb_from_box_list(s

原创 Faster RCNN minibatch.py

minibatch.py 的功能是: Compute minibatch blobs for training a Fast R-CNN network. 與roidb不同的是, minibatch中存儲的並不是完整的整張圖像

原创 Dlib 學習過程中遇到的坑

在使用Dlib的時候遇到兩個錯誤: 1. ‘deque’ is not a member of ‘std’ 2. ‘running_stats’ was not declared in this scope 這兩個錯誤都是

原创 Faster RCNN roidb.py

1. self.roidb返回一個列表,列表元素爲字典,每張圖片對應一個字典(包括flipped的圖像) 2. prepare_roidb 函數 def prepare_roidb(imdb): """Enrich t

原创 linux 下 修改/etc/fstab文件後進不了系統解決辦法

./etc/fstab是linux系統的文件系統表。在進入系統前是通過檢查此文件來加載相應的分區文件系統(被記錄到本文件中的所有文件分區都是在開機之後自動加載)。如果安裝的是雙系統的話,想在linux系統中加載windows系統的

原创 Faster RCNN generate.py

該模塊的功能主要是生成rpn proposals。 + cv2.imread讀取的圖像的存儲格式爲H W K,且三通道的順序爲BGR + PIL.Image.open讀取圖片的存儲格式爲:W H (此時的數據爲PIL庫的某

原创 Faster RCNN anchor_target_layer.py

幾個Faster RCNN中重要的變量信息說明一下: + anchor [w1, h1, w2, h2] + im_info [[H, W, Scale]] + bbox_target [cls, tx, ty, tw,

原创 matlab 讀取圖片的格式

在matlab中讀取圖像數據用imread函數:img = imread(‘******png’) 其中img的格式爲:height x width x channels x num ; 3通道的順序爲RGB 所以如果需要在m

原创 Faster RCNN blob.py

def im_list_to_blob(ims):將圖像轉換成適合caffe輸入的blob數據結構(但是本質上還是python的np.ndarray), 也就是N * C * H * W的四維結構 def im_list_to_b

原创 Faster RCNN proposal_layer.py

定義了一個 ProposalLayer 類, 在rpn_test.pt中會用到。 class ProposalLayer(caffe.Layer): """ Outputs object detection pro

原创 Dlib:shape_predictor 與 full_object_detection

dlib::shape_predictor , dlib::full_object_detection 是dlib裏面的兩個兩個類,最近在做一個人臉的項目的時候需要用到它們,也是第一次使用Dlib,感覺這是一個比較新的一個開源機器