在測試 Github 上 malin9402 大神的代碼時,開始有很多不懂的地方,現已解決,故留此紀錄,對代碼的內容在之後的文章中會進行解析。
首先,我們要在這裏下載作者給出的 yymnist 數據集。下載完畢後,我們發現其中 mnist 文件夾下的圖片都是 .pgm 格式。此時,我們需要運行這個文件夾下的 make_data.py 文件,之後將會有1000張 .jpg 圖片被存在 ./yymnist/Images 文件夾中(自己創建);另外,還有一個 label.txt 文件會被創建到 ./yymnist/ 文件夾,這個 .txt 文件中包含着每張圖片的路徑、上面的數字分類以及真實框的位置(左上角和右下角)。
之後,我們需要在 cmd 中運行:
$ python yymnist/make_data.py --images_num 1000 --images_path ./data/dataset/train --labels_txt ./data/dataset/yymnist_train.txt
$ python yymnist/make_data.py --images_num 200 --images_path ./data/dataset/test --labels_txt ./data/dataset/yymnist_test.txt
之後在 ./data/dataset/train 文件夾和 ./data/dataset/test 文件夾中分別會出現 1000 張和 200 張圖片作爲訓練集和測試集,所有圖片樣本的路徑及圖片信息會被寫到 ./data/dataset/yymnist_train.txt 和 ./data/dataset/yymnist_test.txt 中。
最後,下載完作者提供的網絡權重文件之後,我們就可以正常運行程序了。如果用 jupyter notebook 第二次運行 demo.py 文件時可能會出現一些錯誤,這時我們只需要結束程序重新運行即可。