Datawhale乾貨
作者:阿水,Datawhale成員
本次分享的背景是,Datawhle聯合天池發佈的學習賽:零基礎入門CV賽事之街景字符識別。本文以該比賽爲例,對計算機視覺賽事中,賽事理解和Baseline兩部分內容進行解析,幫助大家更好地學習實踐。同時進行了直播分享(今晚7點在阿里天池直播分享,錄播上傳後原鏈接可回看):
https://tianchi.aliyun.com/course/live?spm=5176.12586971.1001.1.11be32bcSt2XSi&liveId=41167
分享大綱
1. 賽題介紹
介紹賽事主題、目標、數據及賽事資源;
2. Baseline
提出了三種解題思路及部分實現代碼;
3. 知識點
Baseline涉及知識點,模型提升及其他思考。
賽題介紹
本場比賽爲零基礎入門系列第二場,詳情鏈接:
https://tianchi.aliyun.com/competition/entrance/531795/introduction
本賽題以計算機視覺中字符識別爲背景,要求選手預測真實場景下的字符識別,這是一個典型的字符識別問題。
字符識別是將圖像信息轉化爲可以使用的計算機輸入的一種技術,是計算機視覺領域中最經典的應用,在業內也已經有了較爲成熟的業務落地場景。
賽事參考資料(已開源)
Baseline
賽題本質是分類問題,需要對圖片的字符進行識別。但賽題給定的數據圖片中不同圖片中包含的字符數量不等。完整baseline地址:
https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.9.2ce832bc79Tnrp&postId=108342
解題思路1:抽象爲一個定長字符識別問題。
解題思路2:將圖片數據視爲一個單詞或句子。
解題思路3:首先將字符的位置進行識別,利用物體檢測的思路完成。
最後,給出解題思路1的代碼實現。
知識點
Baseline中涉及讀取數據、構建模型、預訓練模型、驗證模型等知識點,這些在比賽中都是必不可少的操作。
同時,想要拿到好的名次,不斷進行優化是必須的。
最後,介紹如何尋找新的突破點。
視頻鏈接:https://tianchi.aliyun.com/course/live?spm=5176.12586971.1001.1.11be32bcSt2XSi&liveId=41167
如需直播地址和PPT,後臺回覆關鍵詞 CV直播 獲取
點擊閱讀原文,參與學習賽????