基於實例的像素級標註介紹


對於機器視覺的項目,有多種標註方法可供選擇。比如你可以把圖片劃分爲不同的類別,爲圖片中物體畫嚴格相切的2D框,在重要實體的角落裏畫點或者把給點圖片中的每個單獨的像素都標註出來。不同的標註方式來源於不同的項目需求但是這幾年來對像素級別的語義分割的數據需求不斷增加。

如今的一般情況是在像素級別上,分別標註不同的類別,比如在自動駕駛項目重,一個類別可能指的是行人,車輛或者廣告牌或者是其他的你的算法模型需要識別的類別。當你給你的算法模型輸入了足夠多的行人,車輛和廣告牌的數據後,你的模型就會開始理解每個類別的特點。它通過“學習”關於行人的一些豐滿的例子,來形成自己的理解,即是什麼使人成了了人,最終它會形成自己關於行人,車輛和廣告牌的類別劃分標準。

但是根據你的應用案例的不同,有時候也會有一些問題。對於一輛車而言,這個廣告牌和那個廣告牌沒有區別,自動駕駛的汽車真正需要知道的是廣告牌是一個靜止的物體,它可以忽略廣告牌(不同於路標,自動駕駛汽車需要理解路標的含義),如果廣告牌之間互相重疊,也沒有任何影響即對汽車如何行駛造不成影響,畢竟廣告牌只是廣告而已。

但是汽車和行人卻是不同的概念,它們會移動,而且有時候移動沒有規律可循。在很多語義分割算法重,車和車或者人和人都屬於車和人的類別。但是根據你創建模型的不同,可能會出現問題,比如一個推着嬰兒車的母親和一個慢跑的人的行爲可能截然不同。還有,有時候同類物體互相重疊遮擋,如果簡單的把他們標註在一起並且定爲一個類別可能會讓機器視覺的分類器產生疑惑,比如下圖的例子

這是一張標註的很精確的語義分割圖片。類與類之間邊緣清晰並且分類準確。但是圖片中所有的車都被標註成“車”這個類別。因爲車之間相互重疊,有些算法在理解這個信息時就有有困惑。畢竟這不是一個街區長度的履帶式車輛。而是一系列單獨的,停着的車輛

我們有很多客戶找到我們並且向我們尋求解決方法。不同於履帶式車輛的標註方法,我們的工具可以實現基於實例的語義分割(instance-based sematic segmentation)。輸入結果如下圖

簡單的說,每個車單獨標註可以減少模型的理解難度。這樣標註時自動駕駛車輛模型更容易取得滿意的結果,在其他的領域比如顯微鏡圖像標註時,把分裂中的細胞標註爲離散的實體時,標註效果更好。基於實例的標註的確會花費多一些的時間,但是對企業級的標註項目而言,這個細微的變化可以得到較大的精確度提升,更利用得到更成功的算法

如果您對基於實例的標註有需求的話,請訪問我們的網站www.sparkapi.ai或者聯繫email :[email protected]獲得更多信息,如果可以幫助到您,我們將十分高興!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章