傳統車牌檢測和識別都是在小規模數據集上進行實驗和測試,所獲得的算法模型無法勝任環境多變、角度多樣的車牌圖像檢測和識別任務。爲此,中科大團隊建立了CCPD數據集,這是一個用於車牌識別的大型國內停車場車牌數據集,該團隊同時在ECCV2018國際會議上發表論文Towards End-to-End License Plate Detection and Recognition: A Large Dataset and Baseline, 論文和數據集下載地址:https://github.com/detectRecog/CCPD。
該數據集在合肥市的停車場採集得來,採集時間早上7:30到晚上10:00。停車場採集人員手持Android POS機對停車場的車輛拍照並手工標註車牌位置。拍攝的車牌照片涉及多種複雜環境,包括模糊、傾斜、陰雨天、雪天等等。CCPD數據集一共包含將近30萬張圖片,每種圖片大小720x1160x3。一共包含8項,具體如下:
類型 | 圖片數 | 說明 |
ccpd_base | 199998 | 正常車牌 |
ccpd_challenge | 10006 | 比較有挑戰性的車牌 |
ccpd_db | 20001 | 光線較暗或較亮 |
ccpd_fn | 19999 | 距離攝像頭較遠或較近 |
ccpd_np | 3036 | 沒上牌的新車 |
ccpd_rotate | 9998 | 水平傾斜20-50°,垂直傾斜-10-10° |
ccpd_tilt | 10000 | 水平傾斜15-45°,垂直傾斜15-45° |
ccpd_weather | 9999 | 雨天、雪天或者霧天的車牌 |
總共:283037張車牌圖像 |
部分照片示例如下:
CCPD數據集沒有專門的標註文件,每張圖像的文件名就是對應的數據標註(label)。
例如:025-95_113-154&383_386&473-386&473_177&454_154&383_363&402-0_0_22_27_27_33_16-37-15.jpg
由分隔符'-'分爲幾個部分:
1) 025爲區域,
2) 95_113 對應兩個角度, 水平95°, 豎直113°
3) 154&383_386&473對應邊界框座標:左上(154, 383), 右下(386, 473)
4) 386&473_177&454_154&383_363&402對應四個角點座標
5) 0_0_22_27_27_33_16爲車牌號碼 映射關係如下: 第一個爲省份0 對應省份字典皖, 後面的爲字母和文字, 查看ads字典.如0爲A, 22爲Y....
具體的,省份對應標籤如下:
{
"皖": 0,
"滬": 1,
"津": 2,
"渝": 3,
"冀": 4,
"晉": 5,
"蒙": 6,
"遼": 7,
"吉": 8,
"黑": 9,
"蘇": 10,
"浙": 11,
"京": 12,
"閩": 13,
"贛": 14,
"魯": 15,
"豫": 16,
"鄂": 17,
"湘": 18,
"粵": 19,
"桂": 20,
"瓊": 21,
"川": 22,
"貴": 23,
"雲": 24,
"西": 25,
"陝": 26,
"甘": 27,
"青": 28,
"寧": 29,
"新": 30
}
字母和數字對應的標籤如下:
{
"a" : 0,
"b" : 1,
"c" : 2,
"d" : 3,
"e" : 4,
"f" : 5,
"g" : 6,
"h" : 7,
"j" : 8,
"k" : 9,
"l" : 10,
"m" : 11,
"n" : 12,
"p" : 13,
"q" : 14,
"r" : 15,
"s" : 16,
"t" : 17,
"u" : 18,
"v" : 19,
"w" : 20,
"x": 21,
"y" : 22,
"z" : 23,
"0" : 24,
"1" : 25,
"2" : 26,
"3" : 27,
"4" : 28,
"5" : 29,
"6" : 30,
"7" : 31,
"8" : 32,
"9" : 33
}