原创 【代碼】CenterNet的使用

一、數據集的準備(PASCOL VOC) 首先將src/tools/get_pascal_voc.sh中涉及的數據集和工具都下載下來,之後在tools中建立voc文件夾,將數據集和工具放入到voc中,運行修改後的腳本: cd voc t

原创 【代碼】CenterNet使用(Detection)(demo.py)

一、運行demo.py 按照readme裏頭的創建一個新環境,按照要求安裝即可,中間也遇到了不少的問題,比如說一開始裝上了torch0.4.1,之後不能安裝torchvision,所以又升到了torch1.0,安裝完torchvison之

原创 【實驗】COCO數據集上的實驗

1.MMdetection上的實驗 1.1 cascade_rcnn_x101 CUDA_VISIBLE_DEVICES=3 python ./tools/test.py ./configs/cascade_rcnn_x101_6

原创 【代碼】CenterNet代碼解析

這篇文章主要就是介紹一些用到的重要的函數,只介紹detection部分。 0.網站 https://github.com/xingyizhou/CenterNet install: https://github.com/xingyizho

原创 【論文】SNIP - An Analysis of Scale Invariance in Object Detection

0.總結 SNIP提出了一種適用於2-stage檢測器的Image Pyramid訓練方法。該訓練方法能夠做到: 提供多尺度的物體信息,豐富語義信息,也是爲了彌補2中篩選造成的信息缺失 限制檢測器在每個Scale上的訓練(篩選A

原创 【代碼】CenterNet使用(續)(對五六七部分詳解)(七)

接上面部分,對五六七部分進行詳解,這篇介紹第七部分。 一、回顧 第七部分進行最後的後處理: results = self.merge_outputs(detections) torch.cuda.synchronize(

原创 【代碼】CenterNet使用(續)(對五六七部分詳解)(五)

接上面部分,對五六七部分進行詳解,這篇介紹第五部分,也就是model從建立到測試,數據從images到output、dets的詳細過程。 一、回顧 第五部分放入網絡中測試,產生輸出: output, dets, forwar

原创 【代碼】mmdetection源碼解讀(從score獲得bboxes)

0. 簡介 anchor_head中的get_bboxes如何將score變成bboxes。 1. get_bboxes assert len(cls_scores) == len(bbox_preds)

原创 【代碼】mmdetection框架

0.前言 這篇文章是使用mmdetection的一些記錄,記錄對於代碼、設計理念的個人理解。 1.train 使用tools.train進行訓練。添加如下代碼來使用debug模式: import os os.env

原创 【代碼】mmdetection中的mmdet.datasets

1.collate 用來拼接batch中的數據。與標準的pytorch中的default_collate不同,這裏的collate返回的是一個列表,每個列表中的元素是一個minibatch,應該是爲了用於多個gpu,每個gpu上運

原创 【代碼】CenterNet使用(續)(對五六七部分詳解)(六)

接上面部分,對五六七部分進行詳解,這篇介紹第六部分。 一、回顧 第六部分對得到得dets進行後處理: dets = self.post_process(dets, meta, scale) torch.cuda.

原创 【其他】【思考】目標檢測的目標以及mAp(0)

一、簡介 目標檢測(object detection)是一個CV中一個經典的問題,相對於物體識別任務而言,它更加的複雜,應用也更加的廣泛。目標檢測(以下指general object detection)的任務是在場景中檢測出給定的一組類

原创 【論文】Cascade R-CNN總結

一、簡介 Cascade R-CNN是爲了解決訓練時用來定義FP和TP的IOU值選取的問題,並且提出了一種結構來利用該IOU值不同所帶來的好處,貢獻體現在對於定位能力的改進上,也就是IOU值。一般而言,這個值定爲了0.5,那麼其他的值呢?

原创 【論文】OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks總結

趁熱打鐵,把OverFeat總結了。 一、簡介 這個文章中提出了一種較爲通用的結構,並將其應用在了識別(classification)、定位(localization,只有一個物體,要給出位置)、檢測(detection,可能有0到多個物

原创 【論文】YOLOv1

YOLOv1的結構很簡單,和一般的分類網絡差別不大。主要是損失函數的設計以及對於訓練過程的設計,還有就是網絡輸出代表的含義。 YOLOv1的輸出是一個7*7的矩陣,它假設網絡相應index的輸出對應於輸入圖片相應的grid,每個inde