SSD+Tensorflow

參考:

http://blog.csdn.net/liuyan20062010/article/details/78905517


1.  搭建SSD框架,下載解壓即可

下載SSD-tensorflow並解壓

https://github.com/balancap/SSD-Tensorflow

2. 下載官方數據

下載VOC2007和VOC2012數據集, 放在/imagedata目錄下:

cd imagedata
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar
wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar

tar -xvf VOCtrainval_11-May-2012.tar
tar -xvf VOCtrainval_06-Nov-2007.tar
tar -xvf VOCtest_06-Nov-2007.tar

     下載pascalvoc數據,解壓後生成三個文件夾,主要是利用訓練集測試的文件夾,VOCtrainval用來訓練,VOCtest用來測試。

    VOCtrainval 中JPEGImage文件夾中僅是訓練和驗證的圖片,Main文件夾中僅是trainval.txt,  train.txt,   val.txt

    VOCtest中JPEGImage文件夾中僅是測試圖片,Main文件夾中僅是test.txt

  


3. 自己的圖片

自己的數據根據voc格式改寫(圖片的名稱,不用拘泥於6位數字,其他命名也可以)

圖片數據重命名爲6位數字的代碼如下:

   python代碼

[html] view plain copy
  1. import os    
  2.         
  3. class BatchRename():    
  4.       #  '''''   
  5.      #   批量重命名文件夾中的圖片文件   
  6.        
  7.        # '''    
  8.         def __init__(self):    
  9.             #我的圖片文件夾路徑horse    
  10.             self.path = '/home/xxx/imagedata/image_xml'    
  11.         
  12.         def rename(self):    
  13.             filelist = os.listdir(self.path)    
  14.             total_num = len(filelist)    
  15.             i = 1    
  16.             n = 6    
  17.             for item in filelist:    
  18.                 if item.endswith('.jpg'):    
  19.                     n = 6 - len(str(i))    
  20.                     src = os.path.join(os.path.abspath(self.path), item)    
  21.                     dst = os.path.join(os.path.abspath(self.path), str(0)*n + str(i) + '.jpg')    
  22.                     try:    
  23.                         os.rename(src, dst)    
  24.                         print 'converting %s to %s ...' % (src, dst)    
  25.                         i = i + 1    
  26.                     
  27.                     except:    
  28.                         continue    
  29.             print 'total %d to rename & converted %d jpgs' % (total_num, i)    
  30.         
  31. if __name__ == '__main__':    
  32.         demo = BatchRename()    
  33.         demo.rename()    

4.標記數據  標註工具:windows_v1.5.0

5.生成txt文件,train.txt, trainval.txt, test.txt, val.txt

python代碼

[html] view plain copy
  1. import os    
  2. import random     
  3.     
  4. xmlfilepath=r'/home/xxx/subimage_xml_xiao'    
  5. saveBasePath=r"/home/xxx/txt"    
  6.     
  7. trainval_percent=0.7   
  8. train_percent=0.7    
  9. total_xml = os.listdir(xmlfilepath)    
  10. num=len(total_xml)      
  11. list=range(num)      
  12. tv=int(num*trainval_percent)      
  13. tr=int(tv*train_percent)      
  14. trainvalrandom.sample(list,tv)      
  15. train=random.sample(trainval,tr)      
  16.     
  17. print("train and val size",tv)    
  18. print("traub suze",tr)    
  19. ftrainval = open(os.path.join(saveBasePath,'Main/trainval.txt'), 'w')      
  20. ftest = open(os.path.join(saveBasePath,'Main/test.txt'), 'w')      
  21. ftrain = open(os.path.join(saveBasePath,'Main/train.txt'), 'w')      
  22. fval = open(os.path.join(saveBasePath,'Main/val.txt'), 'w')      
  23.     
  24. for i  in list:      
  25.     name=total_xml[i][:-4]+'\n'      
  26.     if i in trainval:      
  27.         ftrainval.write(name)      
  28.         if i in train:      
  29.             ftrain.write(name)      
  30.         else:      
  31.             fval.write(name)      
  32.     else:      
  33.         ftest.write(name)      
  34.       
  35. ftrainval.close()      
  36. ftrain.close()      
  37. fval.close()      
  38. ftest .close()   

6.  將訓練類別修改爲和自己一樣的

   SSD-Tensorflow-master—>datasets—>pascalvoc_common.py

  根據實際情況進行修改

[html] view plain copy
  1. VOC_LABELS = {   
  2.     'none': (0, 'Background'),   
  3.     'aeroplane': (1, 'Vehicle'),   
  4.     'bicycle': (2, 'Vehicle'),   
  5.     'bird': (3, 'Animal'),   
  6.     'boat': (4, 'Vehicle'),   
  7.     'bottle': (5, 'Indoor'),   
  8.     'bus': (6, 'Vehicle'),   
  9.     'car': (7, 'Vehicle'),   
  10.     'cat': (8, 'Animal'),   
  11.     'chair': (9, 'Indoor'),   
  12.     'cow': (10, 'Animal'),   
  13.     'diningtable': (11, 'Indoor'),   
  14.     'dog': (12, 'Animal'),   
  15.     'horse': (13, 'Animal'),   
  16.     'motorbike': (14, 'Vehicle'),   
  17.     'Person': (15, 'Person'),   
  18.     'pottedplant': (16, 'Indoor'),   
  19.     'sheep': (17, 'Animal'),   
  20.     'sofa': (18, 'Indoor'),   
  21.     'train': (19, 'Vehicle'),   
  22.     'tvmonitor': (20, 'Indoor'),   
  23. }   

7.  將圖像數據轉換爲tfrecods格式

   SSD-Tensorflow-master—>datasets—>pascalvoc_to_tfrecords.py 。。。然後更改文件的83行讀取方式爲’rb’)

    修改67行,可以修改幾張圖片轉爲一個tfrecords,如下圖

     

    在SSD-Tensorflow-master文件夾下創建tf_conver_data.sh   (vi tf_conver_data.sh)

注意:tab鍵和空格鍵不能混合用。

[html] view plain copy
  1.   1 #!/bin/bash  
  2.   2 #this is a shell script to convert pascal VOC datasets into tf-records only  
  3.   3 #directory where the original dataset is stored   
  4.   4   
  5.   5 DATASET_DIR=/home/xxx/imagedata/VOCdevkit/VOC2007/     #VOC數據保存的文件夾(VOC的目錄格式未改變)  
  6.   6   
  7.   7 #output directory where to store TFRecords files  
  8.   8 OUTPUT_DIR=/home/xxx/imagedata/tf_records  #自己建立的保存tfrecords數據的文件夾  
  9.   9     
  10.  10 python ./tf_convert_data.py \  
  11.  11        --dataset_name=pascalvoc \  
  12.  12        --dataset_dir=${DATASET_DIR} \  
  13.  13        --output_name=voc_2007_train \  
  14.  14        --output_dir=${OUTPUT_DIR}  
  15. ~  
8. 訓練模型

train_ssd_network.py修改第154行的最大訓練步數,將None改爲比如50000。(tf.contrib.slim.learning.training函數中max-step爲None時訓練會無限進行。)

   train_ssd_network.py:

網絡參數配置,若需要改,在此文件中進行修改,因爲不知道爲啥修改後面的sh文件沒有效。如果訓練時loss爲nan,則把該學習率改小0.1倍。網絡內存不夠訓練時,把batch_size(32->16)和最大訓練步數(50000->5000)改小。

  修改如下圖中的數字600,可以改變訓練多長時間保存一次模型

   

 
需要修改的地方:

         a.   nets/ssd_vgg_300.py  (因爲使用此網絡結構) ,修改87 和88行的類別              

[html] view plain copy
  1. default_params = SSDParams(  
  2.        img_shape=(300, 300),  
  3.        num_classes=21,   #根據自己的數據修改爲類別+1  
  4.        no_annotation_label=21, #根據自己的數據修改爲類別+1  
  5.        feat_layers=['block4', 'block7', 'block8', 'block9', 'block10', 'block11'],  
  6.        feat_shapes=[(38, 38), (19, 19), (10, 10), (5, 5), (3, 3), (1, 1)],  
  7.        anchor_size_bounds=[0.15, 0.90],  
  8.        # anchor_size_bounds=[0.20, 0.90],  
          b.    train_ssd_network.py,修改類別120行,GPU佔用量,學習率,batch_size等
[html] view plain copy
  1. tf.app.flags.DEFINE_integer(  
  2.     'num_classes', 21, 'Number of classes to use in the dataset.')      
  3.   
  4.     #根據自己的數據修改爲類別+1  

     c.   eval_ssd_network.py 修改類別,66行

[html] view plain copy
  1. # =========================================================================== #  
  2. # Main evaluation flags.  
  3. # =========================================================================== #  
  4. tf.app.flags.DEFINE_integer(  
  5. 'num_classes', 21, 'Number of classes to use in the dataset.')    
  6.   
  7.   #根據自己的數據修改爲類別+1  

d.   datasets/pascalvoc_2007.py 根據自己的訓練數據修改整個文件

[html] view plain copy
  1. TRAIN_STATISTICS = {  
  2.     'none': (0, 0),  
  3.     'aeroplane': (238, 306),  #238圖片書, 306目標總數  
  4.     'bicycle': (243, 353),  
  5.     'bird': (330, 486),  
  6.     'boat': (181, 290),  
  7.     'bottle': (244, 505),  
  8.     'bus': (186, 229),  
  9.     'car': (713, 1250),  
  10.     'cat': (337, 376),  
  11.     'chair': (445, 798),  
  12.     'cow': (141, 259),  
  13.     'diningtable': (200, 215),  
  14.     'dog': (421, 510),  
  15.     'horse': (287, 362),  
  16.     'motorbike': (245, 339),  
  17.     'person': (2008, 4690),  
  18.     'pottedplant': (245, 514),  
  19.     'sheep': (96, 257),  
  20.     'sofa': (229, 248),  
  21.     'train': (261, 297),  
  22.     'tvmonitor': (256, 324),  
  23.     'total': (5011, 12608),    //5011 爲訓練的圖片書,12608爲目標總數  
  24. }  
  25. TEST_STATISTICS = {  
  26.     'none': (0, 0),  
  27.     'aeroplane': (1, 1),  
  28.     'bicycle': (1, 1),  
  29.     'bird': (1, 1),  
  30.     'boat': (1, 1),  
  31.     'bottle': (1, 1),  
  32.     'bus': (1, 1),  
  33.     'car': (1, 1),  
  34.     'cat': (1, 1),  
  35.     'chair': (1, 1),  
  36.     'cow': (1, 1),  
  37.     'diningtable': (1, 1),  
  38.     'dog': (1, 1),  
  39.     'horse': (1, 1),  
  40.     'motorbike': (1, 1),  
  41.     'person': (1, 1),  
  42.     'pottedplant': (1, 1),  
  43.     'sheep': (1, 1),  
  44.     'sofa': (1, 1),  
  45.     'train': (1, 1),  
  46.     'tvmonitor': (1, 1),  
  47.     'total': (20, 20),  
  48. }  
  49. SPLITS_TO_SIZES = {  
  50.     'train': 5011,        #訓練數據量  
  51.     'test': 4952,         #測試數據量  
  52. }  
  53. SPLITS_TO_STATISTICS = {  
  54.     'train': TRAIN_STATISTICS,  
  55.     'test': TEST_STATISTICS,  
  56. }  
  57. NUM_CLASSES = 20    #類別,根據自己數據的實際類別修改(不包含背景)  


方案1 從vgg開始訓練其中某些層的參數:

ssd_300_vgg中的300是指把圖片歸一化爲300*300,所以如果要用ssd_512_vgg來fineturn的話,就只需要重新訓練受圖片分辨率影響的層即可。

[html] view plain copy
  1. # 通過加載預訓練好的vgg16模型,對“voc07trainval+voc2012”進行訓練  
  2. # 通過checkpoint_exclude_scopes指定哪些層的參數不需要從vgg16模型裏面加載進來  
  3. # 通過trainable_scopes指定哪些層的參數是需要訓練的,未指定的參數保持不變,<strong>若註釋掉此命令,所有的參數均需要訓練</strong>  
  4. DATASET_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/dataset/VOC0712/  
  5. TRAIN_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/voc0712_model/  
  6. CHECKPOINT_PATH=../checkpoints/vgg_16.ckpt  
  7.   
  8. python ../train_ssd_network.py \  
  9.     --train_dir=${TRAIN_DIR} \      #訓練生成模型的存放路徑  
  10.     --dataset_dir=${DATASET_DIR} \  #數據存放路徑  
  11.     --dataset_name=pascalvoc_2007 \ #數據名的前綴  
  12.     --dataset_split_name=train \  
  13.     --model_name=ssd_300_vgg \      #加載的模型的名字  
  14.     --checkpoint_path=${CHECKPOINT_PATH} \  #所加載模型的路徑  
  15.     --checkpoint_model_scope=vgg_16 \   #所加載模型裏面的作用域名  
  16.     --checkpoint_exclude_scopes=ssd_300_vgg/conv6,ssd_300_vgg/conv7,ssd_300_vgg/block8,ssd_300_vgg/block9,ssd_300_vgg/block10,ssd_300_vgg/block11,ssd_300_vgg/block4_box,ssd_300_vgg/block7_box,ssd_300_vgg/block8_box,ssd_300_vgg/block9_box,ssd_300_vgg/block10_box,ssd_300_vgg/block11_box \  
  17.     --trainable_scopes=ssd_300_vgg/conv6,ssd_300_vgg/conv7,ssd_300_vgg/block8,ssd_300_vgg/block9,ssd_300_vgg/block10,ssd_300_vgg/block11,ssd_300_vgg/block4_box,ssd_300_vgg/block7_box,ssd_300_vgg/block8_box,ssd_300_vgg/block9_box,ssd_300_vgg/block10_box,ssd_300_vgg/block11_box \  
  18.     --save_summaries_secs=60 \  #每60s保存一下日誌  
  19.     --save_interval_secs=600 \  #每600s保存一下模型  
  20.     --weight_decay=0.0005 \     #正則化的權值衰減的係數  
  21.     --optimizer=adam \          #選取的最優化函數  
  22.     --learning_rate=0.001 \     #學習率  
  23.     --learning_rate_decay_factor=0.94 \ #學習率的衰減因子  
  24.     --batch_size=24 \     
  25.     --gpu_memory_fraction=0.9   #指定佔用gpu內存的百分比  


方案2 : 從自己預訓練好的模型開始訓練(依然可以指定要訓練哪些層)



[html] view plain copy
  1. (當你的模型通過vgg訓練的模型收斂到大概o.5mAP的時候,可以進行這一步的fine-tune)  
  2.   
  3.   
  4. # 通過加載預訓練好的vgg16模型,對“voc07trainval+voc2012”進行訓練  
  5. # 通過checkpoint_exclude_scopes指定哪些層的參數不需要從vgg16模型裏面加載進來  
  6. # 通過trainable_scopes指定哪些層的參數是需要訓練的,未指定的參數保持不變  
  7. DATASET_DIR=/home/doctorimage/kindlehe/common/dataset/VOC0712/  
  8. TRAIN_DIR=.././log_files/log_finetune/train_voc0712_20170816_1654_VGG16/  
  9. CHECKPOINT_PATH=./log_files/log_finetune/train_voc0712_20170712_1741_VGG16/model.ckpt-253287  
  10.   
  11. python3 ../train_ssd_network.py \  
  12.     --train_dir=${TRAIN_DIR} \      #訓練生成模型的存放路徑  
  13.     --dataset_dir=${DATASET_DIR} \  #數據存放路徑  
  14.     --dataset_name=pascalvoc_2007 \ #數據名的前綴  
  15.     --dataset_split_name=train \  
  16.     --model_name=ssd_300_vgg \      #加載的模型的名字  
  17.     --checkpoint_path=${CHECKPOINT_PATH} \  #所加載模型的路徑  
  18.     --checkpoint_model_scope=vgg_16 \   #所加載模型裏面的作用域名  
  19.     --checkpoint_exclude_scopes=ssd_300_vgg/conv6,ssd_300_vgg/conv7,ssd_300_vgg/block8,ssd_300_vgg/block9,ssd_300_vgg/block10,ssd_300_vgg/block11,ssd_300_vgg/block4_box,ssd_300_vgg/block7_box,ssd_300_vgg/block8_box,ssd_300_vgg/block9_box,ssd_300_vgg/block10_box,ssd_300_vgg/block11_box \  
  20.     --trainable_scopes=ssd_300_vgg/conv6,ssd_300_vgg/conv7,ssd_300_vgg/block8,ssd_300_vgg/block9,ssd_300_vgg/block10,ssd_300_vgg/block11,ssd_300_vgg/block4_box,ssd_300_vgg/block7_box,ssd_300_vgg/block8_box,ssd_300_vgg/block9_box,ssd_300_vgg/block10_box,ssd_300_vgg/block11_box \  
  21.     --save_summaries_secs=60 \  #每60s保存一下日誌  
  22.     --save_interval_secs=600 \  #每600s保存一下模型  
  23.     --weight_decay=0.0005 \     #正則化的權值衰減的係數  
  24.     --optimizer=adam \          #選取的最優化函數  
  25.     --learning_rate=0.001 \     #學習率  
  26.     --learning_rate_decay_factor=0.94 \ #學習率的衰減因子  
  27.     --batch_size=24 \     
  28.     --gpu_memory_fraction=0.9   #指定佔用gpu內存的百分比  


從自己訓練的ssd_300_vgg模型開始訓練ssd_512_vgg的模型

      因此ssd_300_vgg中沒有block12,又因爲block7,block8,block9,block10,block11,中的參數張量兩個網絡模型中不匹配,因此ssd_512_vgg中這幾個模塊的參數不從ssd_300_vgg模型中繼承,因此使用checkpoint_exclude_scopes命令指出。

         因爲所有的參數均需要訓練,因此不使用命令--trainable_scopes

[html] view plain copy
  1. 1 #/bin/bash  
  2.  2 DATASET_DIR=/home/data/xxx/imagedata/xing_tf/train_tf/  
  3.  3 TRAIN_DIR=/home/data/xxx/model/xing300512_model/  
  4.  4 CHECKPOINT_PATH=/home/data/xxx/model/xing300_model/model.ckpt-60000   #加載的ssd_300_vgg模型  
  5.  5 python3 ./train_ssd_network.py \  
  6.  6        --train_dir=${TRAIN_DIR} \  
  7.  7        --dataset_dir=${DATASET_DIR} \  
  8.  8        --dataset_name=pascalvoc_2007 \  
  9.  9        --dataset_split_name=train \  
  10. 10        --model_name=ssd_512_vgg \  
  11. 11        --checkpoint_path=${CHECKPOINT_PATH} \  
  12. 12        --checkpoint_model_scope=ssd_300_vgg \  
  13. 13        --checkpoint_exclude_scopes=ssd_512_vgg/block7,ssd_512_vgg/block7_box,ssd_512_vgg/block8,ssd_512_vgg/block8_box,    ssd_512_vgg/block9,ssd_512_vgg/block9_box,ssd_512_vgg/block10,ssd_512_vgg/block10_box,ssd_512_vgg/block11,ssd_512_vgg/b    lock11_box,ssd_512_vgg/block12,ssd_512_vgg/block12_box \  
  14. 14        #--trainable_scopes=ssd_300_vgg/conv6,ssd_300_vgg/conv7,ssd_300_vgg/block8,ssd_300_vgg/block9,ssd_300_vgg/block1    0,ssd_300_vgg/block11,ssd_300_vgg/block4_box,ssd_300_vgg/block7_box,ssd_300_vgg/block8_box,ssd_300_vgg/block9_box,ssd_3    00_vgg/block10_box,ssd_300_vgg/block11_box \  
  15. 15        --save_summaries_secs=28800 \  
  16. 16        --save_interval_secs=28800 \  
  17. 17        --weight_decay=0.0005 \  
  18. 18        --optimizer=adam \  
  19. 19        --learning_rate_decay_factor=0.94 \  
  20. 20        --batch_size=16 \  
  21. 21        --num_classes=4 \  
  22. 22        -gpu_memory_fraction=0.8 \  
  23. 23   

方案3:從頭開始訓練自己的模型 

[html] view plain copy
  1. # 註釋掉CHECKPOINT_PATH,不提供初始化模型,讓模型自己隨機初始化權重,從頭訓練  
  2. # 刪除checkpoint_exclude_scopes和trainable_scopes,因爲是從頭開始訓練  
  3.   #/bin/bash
      2 DATASET_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/imagedata/VOCtrainval_06-Nov-2007/tfrecords/
      3 TRAIN_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/VOC2007_model/
      4 #CHECKPOINT_PATH=/home/data/liuyan/model/xingshizheng512_model/model.ckpt-60000
      5 CUDA_VISIBLE_DEVICES=0 python ./train_ssd_network.py \
      6        --train_dir=${TRAIN_DIR} \
      7        --dataset_dir=${DATASET_DIR} \
      8        --dataset_name=pascalvoc_2007 \
      9        --dataset_split_name=train \
     10        --model_name=ssd_300_vgg \
     11        #--checkpoint_path=${CHECKPOINT_PATH} \
     12        #--checkpoint_model_scope=ssd_512_vgg \
     13        #--checkpoint_exclude_scopes=ssd_300_vgg/block10,ssd_300_vgg/block10_box,ssd_300_vgg/block11,ssd_300_vgg/block11_bo    x \ 
     14        #--checkpoint_exclude_scopes=ssd_512_vgg/conv6,ssd_512_vgg/conv7,ssd_512_vgg/block8,ssd_512_vgg/block9,ssd_512_vgg/    block10,ssd_512_vgg/block11,ssd_512_vgg/block4_box,ssd_512_vgg/block7_box,ssd_512_vgg/block8_box,ssd_512_vgg/block9_box,ss    d_512_vgg/block10_box,ssd_512_vgg/block11_box \
     15        #--trainable_scopes=ssd_300_vgg/conv6,ssd_300_vgg/conv7,ssd_300_vgg/block8,ssd_300_vgg/block9,ssd_300_vgg/block10,s    sd_300_vgg/block11,ssd_300_vgg/block4_box,ssd_300_vgg/block7_box,ssd_300_vgg/block8_box,ssd_300_vgg/block9_box,ssd_300_vgg    /block10_box,ssd_300_vgg/block11_box \
     16        --save_summaries_secs=600 \
     17        --save_interval_secs=600 \
     18        --optimizer=adam \
     19        --learning_rate_decay_factor=0.94 \
     20        --batch_size=32 \
     21        --num_classes=20 \

8. 測試或驗證

    首先將測試數據轉換爲tfrecords

[html] view plain copy
  1.   1 #!/bin/bash
      2 #this is a shell script to convert pascal VOC datasets into tf-records only
      3 #directory where the original dataset is stored
      4 DATASET_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/imagedata/VOCtest_06-Nov-2007/VOCdevkit/VOC2007/
      5 #OUTPUT directory where to store TFRecords files
      6 OUTPUT_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/imagedata/VOCtest_06-Nov-2007/tfrecords
      7 python ./tf_convert_data.py \
      8        --dataset_name=pascalvoc \
      9        --dataset_dir=${DATASET_DIR} \
     10        --output_name=voc_2007_test \
     11        --output_dir=${OUTPUT_DIR}

         在SSD-Tensorflow-master文件夾下建立一個sh文件


  1.   1 DATASET_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/imagedata/VOCtest_06-Nov-2007/tfrecords/
      2 EVAL_DIR=/home/data/liangxiaoyun/SSD-Tensorflow-master/ssd_eval_log/
      3 CHECKPOINT_PATH=/home/data/liangxiaoyun/SSD-Tensorflow-master/VOC2007_model/model.ckpt-5000
      4 python ./eval_ssd_network.py \
      5        --eval_dir=${EVAL_DIR} \
      6        --dataset_dir=${DATASET_DIR} \
      7        --dataset_name=pascalvoc_2007 \
      8        --dataset_split_name=test \
      9        --model_name=ssd_300_vgg \
     10        --checkpoint_path=${CHECKPOINT_PATH} \
     11        --batch_size=1 \

測試結果如下:MAP值太低,至少得0.5才能準確檢測。增加迭代次數。

9.    利用在notebooks下的ssd_notebook.ipy來查看模型標註的圖片。ssd_notebook.ipynb顯示訓練測試模型的結果

      修改紅框標註的位置,一個是修改爲自己的模型所在的路徑,另一個是修改爲自己圖片所在的路徑

   



      

10. 注意

[html] view plain copy
  1. <pre name="code" class="html"><blockquote><ol><li>dataset_name=pascalvoc_2007 、–dataset_split_name=train、–model_name=ssd_300_vgg這三個參數不要自己隨便取,在代碼裏,這三個參數是if…else…語句,有固定的判斷值,所以要根據實際情況取選擇</li><li>TypeError: expected bytes, NoneType found   
  2. SystemError: returned a result with an error set   
  3. 這是由於CHECKPOINT_PATH定義的時候不小心多了個#號鍵,將輸入給註釋掉了,如果不想使用預訓練的模型,需要將<code>--checkpoint_path=${CHECKPOINT_PATH} \</code>註釋掉即可</li><li>SSD有在VOC07+12的訓練集上一起訓練的,用一個笨一點的辦法:   
  4. pascalvoc_to_tfrecords.py文件中,改變SAMPLES_PER_FILES,減少輸出tfrecord文件的個數,再修改tf_convert_data.py的dataset參數,記得將前後兩次的輸出名改變一下,前後兩次轉換的tfrecords放在同一個文件夾下,然後手工重命名。(這裏由於只是驗證論文的訓練方法是否有效,所以沒必要寫這些自動化代碼實現合併,以後要用自己的數據集訓練的時候就可以寫一些自動化腳本)</li><li>有時候運行腳本會報錯,可能是之前依次運行導致顯存佔滿。</li><li>從pyCharm運行時,如果模型保存路徑裏之前的模型未刪除,將會報錯,必須保證該文件夾爲空。</li><li>在TRAIN_DIR路徑下會產生四中文件:   
  5. 1. checkpoint :文本文件,包含所有model.ckpt-xxxx,相當於是不同時間節點生成的所有ckpt文件的一個索引。   
  6. 2. model.ckpt-2124.data-000000-of-000001:模型文件,保存模型的權重   
  7. 3. model.ckpt-2124.meta: 圖文件,保存模型的網絡圖   
  8. 4. model.ckpt-2124.index : 這個沒搞太清楚   
  9. 5. graph.pbtxt: 用protobuf格式保存的模型的圖   
  10. </li></ol></blockquote></pre>  
  11. <pre></pre>  
  12. <pre></pre>  
  13. <pre></pre>  
  14. <pre></pre>  
  15. <pre></pre>  
  16. <pre></pre>  
  17. <pre></pre>  
  18. <pre></pre>  
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章