python實戰—CITY/KITTI數據集處理

聲明：部分代碼參考https://blog.csdn.net/Jesse_Mx/article/details/65634482
本文側重於通過處理數據集來鍛鍊python的應用能力
本文所有代碼已進行開源，讀者可以前往：https://download.csdn.net/download/tanghong1996/10596440進行下載

下載數據集

博主打算將SSD算法用於檢測車載視頻，用到的是CITY數據集。

讀者可以採用KITTI數據集，內容相似，本文主要針對數據進行前期處理，關於該數據集的說明本文就不進行介紹了。

進入官網，找到object一欄，準備下載數據集：

根據下載情況（博主把前四個都下載了，點開看過），進行SSD訓練只需要下載第1個圖片集 Download left color images of object data set (12 GB)和標註文件 Download training labels of object data set (5 MB) 就夠了。然後將其解壓，發現其中7481張訓練圖片有標註信息，而測試圖片沒有，這就是本次訓練所使用的圖片數量。由於SSD中訓練腳本是基於VOC數據集格式的，所以我們需要把KITTI數據集做成PASCAL VOC的格式，其基本架構可以參看這篇博客：PASCAL VOC數據集分析。根據SSD訓練要求，博主在/home/th/data/中目錄中建立一系列文件夾存放所需數據集和工具文件，具體如下：

PS.參看截圖，數據要放在home目錄下的data文件夾，不是caffe中的data文件夾，這個要注意，否則後續腳本出錯。

（截圖來源於小規模試驗，圖片只有400張，本人實際測試了2萬張）

轉換數據集

爲了方便SSD進行訓練，我們需要將KITTI數據集轉換成PASCAL VOC的格式，細心的朋友可能已經發現，KITTI官網提供了一個工具： code to convert from KITTI to PASCAL VOC file format ，爲啥不用呢？因爲我覺得很難用，缺乏靈活性，還不如自己的Python轉換工具好使。

轉換KITTI類別

KITTI數據集總共20個類別，如果用於特定場景，20個類別確實多了。此次博主爲數據集設置1個類別 ‘Car’，只不過標註信息中還有其他類型的車和人，直接略過有點浪費，博主希望將 ‘Van’, ‘Truck’, ‘Tram’ 合併到 ‘Car’ 類別中去，將 ‘Person_sitting’，’Cyclist’，’Pedestrian’ 合併到 ‘Pedestrian’ 類別中去，並刪除Pedestrian類。這裏使用的是modify_annotations_txt.py工具，源碼如下：

# modify_annotations_txt.py
import glob
import string

txt_list = glob.glob('./Labels/*.txt') # 存儲Labels文件夾所有txt文件路徑
def show_category(txt_list):
    category_list= []
    for item in txt_list:
        try:
            with open(item) as tdf:
                for each_line in tdf:
                    labeldata = each_line.strip().split(' ') # 去掉前後多餘的字符並把其分開
                    category_list.append(labeldata[0]) # 只要第一個字段，即類別
        except IOError as ioerr:
            print('File error:'+str(ioerr))
    print(set(category_list)) # 輸出集合

def merge(line):
    each_line=''
    for i in range(len(line)):
        if i!= (len(line)-1):
            each_line=each_line+line[i]+' '
        else:
            each_line=each_line+line[i] # 最後一條字段後面不加空格
    each_line=each_line+'\n'
    return (each_line)

print('before modify categories are:\n')
show_category(txt_list)

for item in txt_list:
    new_txt=[]
    try:
        with open(item, 'r') as r_tdf:
            for each_line in r_tdf:
                labeldata = each_line.strip().split(' ')
                if labeldata[0] in ['Truck','Van','Tram']: # 合併汽車類
                    labeldata[0] = labeldata[0].replace(labeldata[0],'Car')
                if labeldata[0] in ['Cyclist','Person_sitting']: # 合併行人類
                    labeldata[0] = labeldata[0].replace(labeldata[0],'Pedestrian')
                if labeldata[0] == 'DontCare': # 忽略Dontcare類
                    continue
                if labeldata[0] == 'Misc': # 忽略Misc類
                    continue
                new_txt.append(merge(labeldata)) # 重新寫入新的txt文件
        with open(item,'w+') as w_tdf: # w+是打開原文件將內容刪除，另寫新內容進去
            for temp in new_txt:
                w_tdf.write(temp)

    except IOError as ioerr:
        print('File error:'+str(ioerr))

# 刪除 Pedestrian行
for item in txt_list:
    try:
        with open(item, 'r') as r_tdf:
            lines = r_tdf.readlines()
        with open(item,'w+') as w_tdf: # w+是打開原文件將內容刪除，另寫新內容進去
            for line in lines:
                if "trian" in line:
                    continue
                w_tdf.write(line)     
    except IOError as ioerr:
        print('File error:'+str(ioerr))

print('\nafter modify categories are:\n')
show_category(txt_list)

博主申明：刪除Pedestrian行運行時間較慢，應該有更好的思路，歡迎各位提出意見。

不過執行上述文件後，有些文件只有Pedestrian類，刪除後就成爲了空txt文件，此時需要刪除txt文件以及對應的image圖片，採用check_label_0.py，源代碼如下：

# check_label_0.py
# -*- coding: utf-8 -*-
import os
import re

txt_path = "/home/th/data/CITYdevkit/CITY/Labels"
jpg_path = "/home/th/data/CITYdevkit/CITY/JPEGImages"
files = os.listdir(txt_path)
jpg_files = os.listdir(jpg_path)
f = open("/home/th/data/CITYdevkit/CITY/out.txt", 'w+')
i=1
os.chdir(txt_path)
for filename in files:
    # # print(portion[0])
    # 將文件名和綴名分成倆部分
    if os.path.isfile(filename):
        if filename.endswith('txt'):
            size = os.path.getsize(filename)
            if size == 0:
                portion = os.path.splitext(filename)
                os.remove(txt_path + '/' + filename)
                os.remove(jpg_path + '/' + str(portion[0]) + '.jpg')
                print(str(i) + '  ' + str(filename),file = f)
                i = i+1

執行命令：python check_label_0.py 來運行py程序

博主採用的CITY數據集，圖片與txt的命名不是規範，例如1478019973687625979.txt或者11478019973687625979.jpg。因此，需要重新命名txt和jpg名字，改成000001.txt…對應的圖片改成000001.jpg。這裏採用的Label-jpg_rename.py，源代碼如下：

# -*- coding: utf-8 -*-
import os
import re

txt_path = "/home/th/data/CITYdevkit/CITY/Labels"
jpg_path = "/home/th/data/CITYdevkit/CITY/JPEGImages"
files = os.listdir(txt_path)
jpg_files = os.listdir(jpg_path)

f = open("/home/th/data/CITYdevkit/CITY/all_out.txt", 'w+')
i=1

os.chdir(txt_path)
for filename in files:
    # print(portion[0])
    # 將文件名和綴名分成倆部分
    if os.path.isfile(filename):
        if filename.endswith('txt'):
            portion = os.path.splitext(filename)
            jpg_newname = jpg_path + '/' + str(i).zfill(6) + '.jpg'
            jpg_filename = jpg_path + '/' + str(portion[0]) + '.jpg'
            if os.path.exists(jpg_filename):
                os.rename(jpg_filename, jpg_newname)
                newname = str(i).zfill(6) + '.txt'
                # os.chdir(txt_path)
                os.rename(filename, newname)
                i = i + 1
            else:
                os.remove(filename)

博主申明：
因爲txt文件多一個，所以應該沒有找到對應的圖片時，相應地應該刪除txt文件。這裏博主有個思考，若存在000002.txt，此時會原文件進行覆蓋，因此，爲了增強代碼的魯棒性，讀者可以思考該問題，博主能力有限，讀者不信，可以再次運行該.py會發現文件少了一半。同時，當重命名的文件達到10萬以上，如果高效的完成數據及的處理也是一個難點。

執行命令：python3 Label-jpg_rename.py 來運行py程序

以下內容爲轉載內容，讀者可根據自身需求修改文件路徑以及修改jpg或者png格式
轉載鏈接：https://blog.csdn.net/Jesse_Mx/article/details/65634482

轉換txt標註信息爲xml格式

對原始txt文件進行上述處理後，接下來需要將標註文件從txt轉化爲xml，並去掉標註信息中用不上的部分，只留下3類，還有把座標值從float型轉化爲int型，最後所有生成的xml文件要存放在Annotations文件夾中。這裏使用的是txt_to_xml.py工具，此處是由 KITTI_SSD 的代碼修改而來，感謝作者的貢獻。

# txt_to_xml.py
# encoding:utf-8
# 根據一個給定的XML Schema，使用DOM樹的形式從空白文件生成一個XML
from xml.dom.minidom import Document
import cv2
import os

def generate_xml(name,split_lines,img_size,class_ind):
    doc = Document()  # 創建DOM文檔對象

    annotation = doc.createElement('annotation')
    doc.appendChild(annotation)

    title = doc.createElement('folder')
    title_text = doc.createTextNode('KITTI')
    title.appendChild(title_text)
    annotation.appendChild(title)

    img_name=name+'.png'# 可修改爲jpg

    title = doc.createElement('filename')
    title_text = doc.createTextNode(img_name)
    title.appendChild(title_text)
    annotation.appendChild(title)

    source = doc.createElement('source')
    annotation.appendChild(source)

    title = doc.createElement('database')
    title_text = doc.createTextNode('The KITTI Database')
    title.appendChild(title_text)
    source.appendChild(title)

    title = doc.createElement('annotation')
    title_text = doc.createTextNode('KITTI')
    title.appendChild(title_text)
    source.appendChild(title)

    size = doc.createElement('size')
    annotation.appendChild(size)

    title = doc.createElement('width')
    title_text = doc.createTextNode(str(img_size[1]))
    title.appendChild(title_text)
    size.appendChild(title)

    title = doc.createElement('height')
    title_text = doc.createTextNode(str(img_size[0]))
    title.appendChild(title_text)
    size.appendChild(title)

    title = doc.createElement('depth')
    title_text = doc.createTextNode(str(img_size[2]))
    title.appendChild(title_text)
    size.appendChild(title)

    for split_line in split_lines:
        line=split_line.strip().split()
        if line[0] in class_ind:
            object = doc.createElement('object')
            annotation.appendChild(object)

            title = doc.createElement('name')
            title_text = doc.createTextNode(line[0])
            title.appendChild(title_text)
            object.appendChild(title)

            bndbox = doc.createElement('bndbox')
            object.appendChild(bndbox)
            title = doc.createElement('xmin')
            title_text = doc.createTextNode(str(int(float(line[4]))))
            title.appendChild(title_text)
            bndbox.appendChild(title)
            title = doc.createElement('ymin')
            title_text = doc.createTextNode(str(int(float(line[5]))))
            title.appendChild(title_text)
            bndbox.appendChild(title)
            title = doc.createElement('xmax')
            title_text = doc.createTextNode(str(int(float(line[6]))))
            title.appendChild(title_text)
            bndbox.appendChild(title)
            title = doc.createElement('ymax')
            title_text = doc.createTextNode(str(int(float(line[7]))))
            title.appendChild(title_text)
            bndbox.appendChild(title)

    # 將DOM對象doc寫入文件
    f = open('Annotations/'+name+'.xml','w')
    f.write(doc.toprettyxml(indent = ''))
    f.close()

if __name__ == '__main__':
    class_ind=('Pedestrian', 'Car', 'Cyclist')
    cur_dir=os.getcwd()
    labels_dir=os.path.join(cur_dir,'Labels')
    for parent, dirnames, filenames in os.walk(labels_dir): # 分別得到根目錄，子目錄和根目錄下文件   
        for file_name in filenames:
            full_path=os.path.join(parent, file_name) # 獲取文件全路徑
            f=open(full_path)
            split_lines = f.readlines()
            name= file_name[:-4] # 後四位是擴展名.txt，只取前面的文件名
            img_name=name+'.png' 
            img_path=os.path.join('/home/mx/KITTI/train_image',img_name) # 路徑需要自行修改            
            img_size=cv2.imread(img_path).shape
            generate_xml(name,split_lines,img_size,class_ind)
print('all txts has converted into xmls')

執行命令：python3 txt_to_xml.py 來運行py程序，轉換效果如下：

# 原始的000400.txt
Car 0.00 0 -1.67 642.24 178.50 680.14 208.68 1.38 1.49 3.32 2.41 1.66 34.98 -1.60
Car 0.00 0 -1.75 685.77 178.12 767.02 235.21 1.50 1.62 3.89 3.27 1.67 21.18 -1.60
Car 0.67 0 -2.15 885.80 160.44 1241.00 374.00 1.69 1.58 3.95 3.64 1.65 5.47 -1.59
Car 0.00 0 -1.89 755.82 101.65 918.16 230.75 3.55 2.56 7.97 7.06 1.63 23.91 -1.61
Car 0.00 1 -2.73 928.61 177.14 1016.83 209.77 1.48 1.36 3.51 17.33 1.71 34.63 -2.27

生成訓練驗證集和測試集列表

用於SSD訓練的Pascal VOC格式的數據集總共就是三大塊：首先是JPEGImages文件夾，放入了所有png圖片；然後是Annotations文件夾，上述步驟已經生成了相應的xml文件；最後就是imagesSets文件夾，裏面有一個Main子文件夾，這個文件夾存放的是訓練驗證集，測試集的相關列表文件，如下圖所示：

這裏使用create_train_test_txt.py工具，自動生成上述16個txt文件，其中訓練測試部分的比例可以自行修改，由於這個工具是用Python3寫的，所以執行的時候應該是:

python3 create_train_test_txt.py

# create_train_test_txt.py
# encoding:utf-8
import pdb
import glob
import os
import random
import math

def get_sample_value(txt_name, category_name):
    label_path = './Labels/'
    txt_path = label_path + txt_name+'.txt'
    try:
        with open(txt_path) as r_tdf:
            if category_name in r_tdf.read():
                return ' 1'
            else:
                return '-1'
    except IOError as ioerr:
        print('File error:'+str(ioerr))

txt_list_path = glob.glob('./Labels/*.txt')
txt_list = []

for item in txt_list_path:
    temp1,temp2 = os.path.splitext(os.path.basename(item))
    txt_list.append(temp1)
txt_list.sort()
print(txt_list, end = '\n\n')

# 有博客建議train:val:test=8:1:1，先嚐試用一下
num_trainval = random.sample(txt_list, math.floor(len(txt_list)*9/10.0)) # 可修改百分比
num_trainval.sort()
print(num_trainval, end = '\n\n')

num_train = random.sample(num_trainval,math.floor(len(num_trainval)*8/9.0)) # 可修改百分比
num_train.sort()
print(num_train, end = '\n\n')

num_val = list(set(num_trainval).difference(set(num_train)))
num_val.sort()
print(num_val, end = '\n\n')

num_test = list(set(txt_list).difference(set(num_trainval)))
num_test.sort()
print(num_test, end = '\n\n')

pdb.set_trace()

Main_path = './ImageSets/Main/'
train_test_name = ['trainval','train','val','test']
category_name = ['Car','Pedestrian','Cyclist']

# 循環寫trainvl train val test
for item_train_test_name in train_test_name:
    list_name = 'num_'
    list_name += item_train_test_name
    train_test_txt_name = Main_path + item_train_test_name + '.txt' 
    try:
        # 寫單個文件
        with open(train_test_txt_name, 'w') as w_tdf:
            # 一行一行寫
            for item in eval(list_name):
                w_tdf.write(item+'\n')
        # 循環寫Car Pedestrian Cyclist
        for item_category_name in category_name:
            category_txt_name = Main_path + item_category_name + '_' + item_train_test_name + '.txt'
            with open(category_txt_name, 'w') as w_tdf:
                # 一行一行寫
                for item in eval(list_name):
                    w_tdf.write(item+' '+ get_sample_value(item, item_category_name)+'\n')
    except IOError as ioerr:
        print('File error:'+str(ioerr))

執行程序過程中，如遇到pdb提示，可按c鍵，再按enter鍵。

如果想把標註數據全部作爲trainval，而把未標註的數據（大約有7000多圖片）作爲test，需要重新修改腳本，待續。

數據集的後續處理

下面進行數據集的後續處理，在/home.mx/caffe/data之下新建KITTI文件夾，用於存放本次訓練所需的腳本工具，如下圖所示。

生成訓練所需列表文件

SSD訓練的時候除了需要LMDB格式的數據以外，還需要讀取三個列表文件，分別是：trainval.txt，test.txt和test_name_size.txt。前兩個txt文件存放訓練、測試圖片的png路徑和xml路徑，第三個txt文件存放測試圖片的名稱和尺寸。所需工具可以由/home/mx/caffe/data/VOC0712/create_list.sh腳本修改而來。

複製一份上述腳本，並重命名爲create_list_kitti.sh，存放在KITTI文件夾中。經過修改後的腳本文件如下（雙#號註釋處爲博主修改過的地方）：

# create_list_kitti.sh
#!/bin/bash
root_dir=$HOME/data/KITTIdevkit/ ## 自行修改
sub_dir=ImageSets/Main
bash_dir="$(cd "</span><span class="hljs-variable">$(dirname "${BASH_SOURCE[0]}")" && pwd)"
for dataset in trainval test
do
  dst_file=$bash_dir</span>/<span class="hljs-variable">$dataset.txt
  if [ -f $dst_file ]
  then
    rm -f $dst_file
  fi
  for name in KITTI ## 自行修改
  do
    #if [[ $dataset == "test" &amp;&amp; $name == "VOC2012" ]] ## 這段可以註釋掉
    #then
        #continue
    #fi
    echo "Create list for $name $dataset..."
    dataset_file=$root_dir</span>/<span class="hljs-variable">$name/$sub_dir</span>/<span class="hljs-variable">$dataset.txt

    img_file=$bash_dir</span>/<span class="hljs-variable">$dataset"_img.txt"
    cp $dataset_file</span> <span class="hljs-variable">$img_file
    sed -i "s/^/$name\/JPEGImages\//g"</span> <span class="hljs-variable">$img_file
    sed -i "s/$/.png/g"</span> <span class="hljs-variable">$img_file ## 從jpg改爲png

    label_file=$bash_dir</span>/<span class="hljs-variable">$dataset"_label.txt"
    cp $dataset_file</span> <span class="hljs-variable">$label_file
    sed -i "s/^/$name\/Annotations\//g"</span> <span class="hljs-variable">$label_file
    sed -i "s/$/.xml/g"</span> <span class="hljs-variable">$label_file

    paste -d' ' $img_file</span> <span class="hljs-variable">$label_file >> $dst_file

    rm -f $label_file
    rm -f $img_file
  done

  # Generate image name and size infomation.
  if [ $dataset == "test" ]
  then
    $bash_dir</span>/../../build/tools/get_image_size <span class="hljs-variable">$root_dir $dst_file</span> <span class="hljs-variable">$bash_dir/$dataset"_name_size.txt"
  fi

  # Shuffle trainval file.
  if [ $dataset == "trainval" ]
  then
    rand_file=$dst_file.random
    cat $dst_file</span> | perl -<span class="hljs-constant">MList::Util</span>=shuffle -e <span class="hljs-string">'print shuffle(&lt;STDIN&gt;);'</span> &gt; <span class="hljs-variable">$rand_file
    mv $rand_file</span> <span class="hljs-variable">$dst_file
  fi
done

執行下面命令，可在/home/mx/caffe/data/KITTI文件夾下生成3個訓練所需txt文件。

$ cd ~/caffe
$ ./data/KITTI/create_list_kitti.sh

而生成的txt列表格式如下：

# trainval.txt和test.txt文件格式
KITTI/JPEGImages/000003.png KITTI/Annotations/000003.xml
KITTI/JPEGImages/000136.png KITTI/Annotations/000136.xml
KITTI/JPEGImages/000022.png KITTI/Annotations/000022.xml
KITTI/JPEGImages/000151.png KITTI/Annotations/000151.xml
......

# test_name_size.txt文件格式
000011 375 1242
000012 375 1242
000035 375 1242
000044 375 1242
......

準備標籤映射文件

由於只有3類，所以可以仿照例子，寫一個labelmap_kitti.prototxt文件，用於記錄label和name的對應關係，存放在/home/mx/caffe/data/KITTI文件夾中，具體內容如下：

item {
  name: "none_of_the_above"
  label: 0
  display_name: "background"
}
item {
  name: "Car"
  label: 1
  display_name: "Car"
}
item {
  name: "Pedestrian"
  label: 2
  display_name: "Pedestrian"
}
item {
  name: "Cyclist"
  label: 3
  display_name: "Cyclist"
}

生成LMDB數據庫

如果前面一切順利，現在就可以生成LMDB文件了，所需工具可以由/home/mx/caffe/data/VOC0712/create_data.sh腳本修改而來。仍然複製一份上述腳本，並重命名爲create_data_kitti.sh，存放在KITTI文件夾中。經過修改後的腳本文件如下：

# create_data_kitti.sh
cur_dir=$(<span class="hljs-built_in">cd</span> $( dirname ${BASH_SOURCE[0]} ) && pwd )
root_dir=$cur_dir/../..

cd $root_dir

redo=1
data_root_dir="$HOME/data/KITTIdevkit" ## 自行修改
dataset_name="KITTI" ## 自行修改
mapfile="$root_dir</span>/data/<span class="hljs-variable">$dataset_name/labelmap_kitti.prototxt" ## 自行修改
anno_type="detection"
db="lmdb"
min_dim=0
max_dim=0
width=0
height=0

extra_cmd="--encode-type=jpg --encoded"
if [ $redo ]
then
  extra_cmd="$extra_cmd --redo"
fi
for subset in test trainval
do
  python $root_dir</span>/scripts/create_annoset.py --anno-type=<span class="hljs-variable">$anno_type --label-map-file=$mapfile</span> --min-dim=<span class="hljs-variable">$min_dim --max-dim=$max_dim</span> --resize-width=<span class="hljs-variable">$width --resize-height=$height</span> --check-label <span class="hljs-variable">$extra_cmd $data_root_dir</span> <span class="hljs-variable">$root_dir/data/$dataset_name</span>/<span class="hljs-variable">$subset.txt $data_root_dir</span>/<span class="hljs-variable">$dataset_name/$db</span>/<span class="hljs-variable">$dataset_name"_"$subset</span><span class="hljs-string">"_"</span><span class="hljs-variable">$db examples/$dataset_name
done

執行命令 ./data/KITTI/create_data_kitti.sh 來運行腳本，將會生成兩份LMDB文件，路徑分別如下：

$ /home/mx/caffe/examples/KITTI/KITTI_test_lmdb
$ /home/mx/caffe/examples/KITTI/KITTI_trainval_lmdb

至此，訓練數據可以說已經準備好了。

python實戰—CITY/KITTI數據集處理

下載數據集

轉換數據集

轉換KITTI類別

轉換txt標註信息爲xml格式

生成訓練驗證集和測試集列表

數據集的後續處理

生成訓練所需列表文件

準備標籤映射文件

生成LMDB數據庫

.NET週刊【5月第3期 2024-05-19】

2020年上半年數據庫系統工程師考試

TCP粘包概念、產生原因及解決方法

C++ 棧後綴表達式

ASan內存泄漏檢測

Python3:多進程multiprocessing與多線程threading

CITY/KITTI數據集處理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結