我的AI之路(50)--用Darknet訓練YOLOv3和YOLOv3 Tiny

首先獲得darknet的官方源碼並做配置修改並編譯:

git clone  https://github.com/pjreddie/darknet.git

cd darknet

vi Makefile

修改如下項目:

GPU=1
CUDNN=1
OPENCV=1
OPENMP=0
DEBUG=0

ARCH= -gencode arch=compute_30,code=sm_30 \
      -gencode arch=compute_35,code=sm_35 \
      -gencode arch=compute_50,code=[sm_50,compute_50] \
      -gencode arch=compute_52,code=[sm_52,compute_52] \
      -gencode arch=compute_70,code=[sm_70,compute_70]

算力根據你所使用的GPU卡的類型定,我使用的是Tesla v100,各種GPU的具體算力值參考https://developer.nvidia.com/cuda-gpus

然後執行:

make

如果編譯過程中報錯說: No package 'opencv' found,安裝libopencv-dev即可:
    sudo apt install libopencv-dev 

編譯完後darknet二進制文件就生成了,下面下載訓練所需weights文件和根據數據集格式(例如我使用VOC2007格式)做配置:

1. YOLOv3

    1)wget https://pjreddie.com/media/files/darknet53.conv.74

    2)vi cfg/yolov3-voc.cfg

      將Testing部分註釋掉,將Trainning部分打開:

        [net]
         # Testing
         # batch=1
         # subdivisions=1
         # Training
         batch=64
         subdivisions=16

      將所有[yolo]裏面classes修改爲你的class的數量,例如我的是11;

      對所有[yolo]的前一個[convolutional]中的filters進行修改, 其取值爲filters = 3 * ( classes + 5 ),由於上一步中classes=11所以這裏filters取48.  另外酌情將所有.ignore_threshold的由0.7改成需要的值,例如 0.5(optional).

    3)獲取voc_label.py並做修改:

       cd data

       wget https://pjreddie.com/media/files/voc_label.py

       vi voc_label.py

       #sets=[('2012', 'train'), ('2012', 'val'), ('2007', 'train'), ('2007', 'val'), ('2007', 'test')]
       sets=[('2007', 'train'), ('2007', 'val')]
      #classes = ["aeroplane", "bicycle", "bird", "boat", "bottle", "bus", "car", "cat", "chair", "cow", "diningtable", "dog", "horse",  "motorbike", "person", "pottedplant", "sheep", "sofa", "train", "tvmonitor"]
      classes =  ['person','wm','dr', ...]    #總共有11個class
      if cls not in classes: #or int(difficult) == 1:

    4) 確認數據集在darknet/data/VOCdevkit/VOC2007下,voc_label.py在darknet/data/下,在 darknet/data/下執行

         python voc_label.py     #生成2007_train.txt, 2007_val.txt以及VOCdevkit/VOC2007/labels/下多個文件

    5)然後修改data/voc.names和cfg/voc.data的內容:

       cd ..

       vi data/voc.names

            person

            wm

            dr

            ...

       vi cfg/voc.data

        classes= 11
        train  = data/2007_train.txt
        valid  = data/2007_val.txt
        names = data/voc.names
        backup = backup                 #設置保存weights文件的目錄
 6)執行訓練:

    nohup ./darknet detector train cfg/voc.data cfg/yolov3-voc.cfg darknet53.conv.74 &

   #測試訓練結果

     ./darknet detector test cfg/voc.data cfg/yolov3-voc.cfg backup/yolov3-tvoc_20000.weights data/VOCdevkit/VOC2007/JPEGImages/v521-20-05-00400.jpg

此外,如果直接使用yolov3的預訓練weights文件做測試:

   wget https://pjreddie.com/media/files/yolov3.weights
   ./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg
   ./darknet detector test cfg/coco.data cfg/yolov3.cfg yolov3.weights data/dog.jpg

 

2. YOLOv3 Tiny

   對於Tiny版本, 首先需要用weights文件生成一個tiny版網絡的預訓練模型:

   wget https://pjreddie.com/media/files/yolov3-tiny.weights

   ./darknet partial ./cfg/yolov3-tiny.cfg ./yolov3-tiny.weights ./yolov3-tiny.conv.15 15

   對於yolov3 tiny配置文件的修改:

       cp yolov3-tiny.cfg yolov3-tiny-voc.cfg

   然後做和上面YOLOv3的yolov3-voc.cfg裏一樣的修改,同樣對data/voc.names和cfg/voc.data做同樣的修改,也需要執行python voc_label.py生成list文件,然後訓練:

    nohup ./darknet detector train cfg/voc.data cfg/yolov3-tiny-voc.cfg yolov3-tiny.conv.15  &

 

   #測試訓練結果

  ./darknet detector test cfg/voc.data cfg/yolov3-tiny-voc.cfg backup/yolov3-tiny-voc_1000.weights data/VOCdevkit/VOC2007/JPEGImages/v521-20-05-00400.jpg

 

訓練輸出信息解釋:

   

網絡結構裏三個yolo layer

  • Region Avg IOU: 0.941626: 表示在當前subdivision(16張)圖片的Avg IOU,代表預測的矩形框和gt的交集與並集之比,這裏是94.16%。
  • Class: 0.999746: Obj分類的正確率,期望該值趨近於1。
  • Obj: 0.999993: 是Obj(前景)的可能性,越接近1越好。
  • No Obj: 0.003447: 是背景的可能性,期望該值越來越小,但不爲零。
  • .5R: 1.000000: IOU閾值爲0.5時的召回率。
  • 0.75R: 1.000000: IOU閾值爲0.75時的召回率。
  • count: 4:count後的值是所有的當前subdivision圖片(共16張)中包含正樣本的圖片的數量。
  • 50200: 當前的迭代次數
  • 0.016317: 總體的Loss
  • 0.018192 avg: 平均Loss,這個數值應該越低越好。
  • 0.000010 rate: 當前的學習率。
  • 4.247365 seconds: 當前批次訓練花費的總時間。
  • 3212800 images: 這個數值是50200*64的大小,表示到目前爲止,參與訓練的圖片的總數。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章