零基礎入門CV賽事,理論結合實踐

 Datawhale乾貨 

作者:阿水,Datawhale成員

本次分享的背景,Datawhle聯合天池發佈的學習賽:零基礎入門CV賽事之街景字符識別。本文以該比賽爲例,對計算機視覺賽事中,賽事理解和Baseline兩部分內容進行解析,幫助大家更好地學習實踐。同時進行了直播分享(今晚7點在阿里天池直播分享,錄播上傳後原鏈接可回看):

https://tianchi.aliyun.com/course/live?spm=5176.12586971.1001.1.11be32bcSt2XSi&liveId=41167

分享大綱

1. 賽題介紹

  • 介紹賽事主題、目標、數據及賽事資源;

2. Baseline

  • 提出了三種解題思路及部分實現代碼;

3. 知識點

  • Baseline涉及知識點,模型提升及其他思考。

賽題介紹

本場比賽爲零基礎入門系列第二場,詳情鏈接:

https://tianchi.aliyun.com/competition/entrance/531795/introduction

本賽題以計算機視覺中字符識別爲背景,要求選手預測真實場景下的字符識別,這是一個典型的字符識別問題。

字符識別是將圖像信息轉化爲可以使用的計算機輸入的一種技術,是計算機視覺領域中最經典的應用,在業內也已經有了較爲成熟的業務落地場景。

賽事參考資料(已開源)

Baseline

賽題本質是分類問題,需要對圖片的字符進行識別。但賽題給定的數據圖片中不同圖片中包含的字符數量不等。完整baseline地址:

https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.9.2ce832bc79Tnrp&postId=108342

  • 解題思路1:抽象爲一個定長字符識別問題。

  • 解題思路2:將圖片數據視爲一個單詞或句子。

  • 解題思路3:首先將字符的位置進行識別,利用物體檢測的思路完成。

最後,給出解題思路1的代碼實現。

知識點

Baseline中涉及讀取數據、構建模型、預訓練模型、驗證模型等知識點,這些在比賽中都是必不可少的操作。

同時,想要拿到好的名次,不斷進行優化是必須的。

最後,介紹如何尋找新的突破點。

視頻鏈接:https://tianchi.aliyun.com/course/live?spm=5176.12586971.1001.1.11be32bcSt2XSi&liveId=41167

如需直播地址和PPT,後臺回覆關鍵詞 CV直播 獲取

點擊閱讀原文,參與學習賽????

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章