yolov--8--Tensorflow實現YOLO v3

Tensorflow實現YOLO v3

TensorFlow實現,包含了以下部分:

· YOLOv3架構

· 權重轉換器 (Weight Converter)

· 基礎版Demo

· GPU和CPU上都支持非極大抑制 (Non-Maximum Suppression)

· 訓練pipeline

· COCO mAP計算

 來自YOLOv3原作者

快速開始--4步

四個步驟,速速上車。

1.複製這個文件:

1$ git clone https://github.com/YunYang1994/tensorflow-yolov3.git

2.在食用代碼前,先安裝一些依賴項:

1$ cd tensorflow-yolov3
2$ pip install -r ./docs/requirements.txt

3.把加載好的COCO權重導出爲TF checkpoint (yolov3.ckpt) 和 frozen graph (yolov3_gpu_nms.pb) 。

如果你沒有yolov3.weights的話,去下載,然後放到./checkpoint目錄下。下載地址是:

https://github.com/YunYang1994/tensorflow-yolov3/releases/download/v1.0/yolov3.weights

$ python convert_weight.py --convert --freeze

4.然後,./checkpoint目錄下就會出現一些.pb文件。現在可以跑Demo腳本了:

$ python nms_demo.py
$ python video_demo.py # if use camera, set video_path = 0

 

 來自YOLOv3原作者

拿自己的數據集訓練

快速訓練

這個Demo就是給大家一個粗略的感受,感受YOLOv3的訓練過程到底是怎樣的。

用python core/convert_tfrecord.py把你的圖集轉成TFRecords。

1$ python core/convert_tfrecord.py --dataset /data/train_data/quick_train_data/quick_train_data.txt  --tfrecord_path_prefix /data/train_data/quick_train_data/tfrecords/quick_train_data
2$ python quick_train.py  # start training

訓練COCO數據集

如果還沒下載COCO2017數據集,請前往:

http://cocodataset.org/

再把數據集放到./data/train_data/COCO裏面。

1$ cd data/train_data/COCO
2$ wget http://images.cocodataset.org/zips/train2017.zip
3$ unzip train2017.zip
4$ wget http://images.cocodataset.org/annotations/annotations_trainval2017.zip
5$ unzip annotations_trainval2017.zip

然後,就要從數據集裏提取一些有用的信息了,比如邊界框,拿這些信息生成你自己的.txt文件。

$ python core/extract_coco.py --dataset_info_path ./data/train_data/COCO/train2017.txt

 來自YOLOv3原作者

上面這步得到的文件是./data/train_data/COCO/train2017.txt。拿一張圖舉慄,應該長這樣:

1As a result, you will get ./data/train_data/COCO/train2017.txt. Here is an example row for one image:
2
3/home/yang/test/tensorflow-yolov3/data/train_data/train2017/000000458533.jpg 20 18.19 6.32 424.13 421.83 20 323.86 2.65 640.0 421.94
4/home/yang/test/tensorflow-yolov3/data/train_data/train2017/000000514915.jpg 16 55.38 132.63 519.84 380.4
5# image_path, category_id, x_min, y_min, x_max, y_max, category_id, x_min, y_min, ...

接下來,要把圖像數據集轉成.tfrecord,就是用二進制來保存數據。最後,可以訓練啦。

$ python core/convert_tfrecord.py --dataset ./data/train_data/COCO/train2017.txt  --tfrecord_path_prefix ./data/train_data/COCO/tfrecords/coco --num_tfrecords 100
$ python train.py

COCO評估

如果要看一下模型在COCO上的表現,就這樣做:


 

1$ cd data/train_data/COCO
2$ wget http://images.cocodataset.org/zips/test2017.zip
3$ wget http://images.cocodataset.org/annotations/image_info_test2017.zip 
4$ unzip test2017.zip
5$ unzip image_info_test2017.zip

 來自YOLOv3原作者

“我今年沒幹啥”

YOLO系列的作者,是華盛頓大學兩位畫風奇崛的研究人員,一個叫Joseph Redmon,一個叫Ali Farhadi。

去年3月YOLOv3發佈,兩位在論文裏是這樣描述這項成果的:

我今年基本沒做啥研究,淨刷推特了,也玩了一小會兒GAN。去年還剩一點動力沒用完,就給YOLO更了個新。沒什麼特別有意思的東西,一些細小的改動而已。

 

 Introduction滿分

但嚴肅地說,速度是v3最主要的提升。一般來講,YOLOv3比R-CNN快1000倍,比Fast R-CNN快100倍。

 

YOLOv3 TensorFlow實現傳送門:
https://github.com/YunYang1994/tensorflow-yolov3

(早就出了的) YOLO v3 PyTorch教程傳送門:
https://github.com/ayooshkathuria/YOLO_v3_tutorial_from_scratch

 

 

 

 

參考:

https://mp.weixin.qq.com/s/cq7g1-4oFTftLbmKcpi_aQ

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章