街景字符編碼識別之賽題理解

點贊再看,養成習慣!

前言

Datawhale開源組織最近新啓動了CV實戰學習活動,賽題是街道字符編碼識別,身爲DW鯨粉的小編毫不猶豫地加入了AI學習大軍。
第一節的學習內容便是賽題理解,目標如下:

  • 理解賽題背景和賽題數據
  • 完成賽題報名和數據下載,理解賽題的解題思路

正文

賽題背景

賽題來源自Google街景圖像中的門牌號數據集(The Street View House Numbers Dataset, SVHN),數據集鏈接爲http://ufldl.stanford.edu/housenumbers/。只不過本次比賽用到的數據集經過匿名處理和噪音處理,還有爲了降低比賽難度,Tianchi提供了訓練集、驗證集和測試集中字符的位置框,這樣就只需要我們集中注意力在字符識別上。給張圖片,直觀感受下數據集:
SVHN

賽題數據

小編最終下載的數據有:
data
訓練集:mchar_train和mchar_train.json,前者有3W張圖片,後者是對應的標籤,如下所示:
000000.png
000000.png
標籤數據:

“000000.png”: {“height”: [219, 219], “label”: [1, 9], “left”: [246, 323], “top”: [77, 81], “width”: [81, 96]}

這標籤數據是啥意思呢?
其實就是字符的位置框(左上角的座標(left,top)以及框的高寬度height和width)與字符標籤(label)
label
我們知道000000.png圖片有兩個字符1和9,所以標籤的意思就是在左上角座標爲(246,77)、高度爲219、寬度爲81的位置框中字符爲1。同理,另一個字符9的位置框也可以知道。
驗證集:mchar_val和mchar_val.json,共有1W數據。
測試集:mchar_test_a,共有4W數據。
最終要提交的結果要與mchar_sample_submit_A.csv中的格式一致,如下所示

file_name, file_code
0010000.jpg,451
0010001.jpg,232
0010002.jpg,45
0010003.jpg,67
0010004.jpg,191
0010005.jpg,892

評估指標

選手提交結果與實際圖片的編碼進行對比,以編碼整體識別準確率爲評價指標。任何一個字符錯誤都爲錯誤,最終評測指標結果越大越好,具體計算公式如下:
Score= 編碼識別正確的數量  測試集圖片數量  Score=\frac{\text { 編碼識別正確的數量 }}{\text { 測試集圖片數量 }}

如何讀取標籤數據

# json.load將已編碼的JSON字符串解碼爲Python字典對象{pic_id:{top:xx,...},...}
train_json = json.load(open(r'I:\Datas\StreetCharsRecognition\mchar_train.json'))

# 數據標註處理
def parse_json(d):
    arr = np.array([
        d['top'], d['height'], d['left'], d['width'], d['label']
    ])
    arr = arr.astype(int)
    return arr

arr = parse_json(train_json['000000.png']) #轉化成np.array類型

000000.png

解決方案有哪些

本次賽題的難點是需要對不定長的字符進行識別,與傳統的圖像分類任務有所不同。
思路有三種:

  • 簡單入門思路:定長字符識別【小編將跟隨學習的解決方案】
    需要有先驗知識(所有圖片中最多會有多少字符),本賽題大部分圖像中字符個數爲2-4個,最多的字符個數爲6個。因此可以對於所有的圖像都抽象爲6個字符的識別問題,字符23填充爲23XXXX,字符231填充爲231XXX。
    在這裏插入圖片描述

  • 專業字符識別思路:不定長字符識別
    在字符識別研究中,有特定的方法來解決此種不定長的字符識別問題,比較典型的有CRNN字符識別模型。在本次賽題中給定的圖像數據都比較規整,可以視爲一個單詞或者一個句子。

  • 專業分類思路:檢測再識別
    在賽題數據中已經給出了訓練集、驗證集中所有圖片中字符的位置,因此可以首先將字符的位置進行識別,利用物體檢測的思路完成。此種思路需要參賽選手構建字符檢測模型,對測試集中的字符進行識別。選手可以參考物體檢測模型SSD或者YOLO來完成。

結語

比賽的所有代碼,等學習完成後,小編會上傳到Github上,供小夥伴們參考,敬請期待。

參考文獻

  1. 賽題:https://tianchi.aliyun.com/competition/entrance/531795/information
  2. DW組織-賽事的學習資料

童鞋們,讓小編聽見你們的聲音,點贊評論,一起加油。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章