計算機視覺之圖像語義分割算法簡單介紹

這段時間一直在分享,圖像語義分割相關的論文,但是,發現自己都在寫論文的算法細節,沒有介紹技術背景,今天來通過幾個問題簡單地介紹一下人工智能算法計算機視覺圖像語義分割算法的任務。

什麼是語義分割?

語義分割可以看做是像素級別的分類任務,分割就是爲圖片中的每一個像素預測一個類別,像下面這幅圖片中有一個人和馬以及背景,語義分割的任務就是將圖片中人、馬和背景分割出來。

一般的語義分割數據集需要給出圖片和它對應的正確分割的結果,即像素級別標註。

什麼是像素級別標註?

如同下面這張圖,雖然它是有顏色的,但是實際上存儲的是一個二維圖片矩陣,每一個位置上的值表示該像素屬於的分類,假如數據集中人的分類數字是8,馬是5,背景爲0,則圖片中黑色區域存儲的數字是代表背景類別的0,橙色存儲的是代表人類別的8,以及紅色區域存儲的是代表馬的數字5.

什麼是弱監督語義分割?

有像素級別標註的監督是強監督語義分割,而只有圖片中物體類別,如同上面圖片,數據集中僅給出一張圖片以及該圖片中包含人和馬兩個類別,而人和馬在圖片中什麼位置並不給出,這是一個很粗糙的監督信息,利用類別標籤作爲監督進行語義分割任務就是弱監督語義分割的一種,其他的還有利用boundary box,塗鴉等等。

爲什麼要進行弱監督語義分割?

目標當然是省錢!省力!

從上面我們可以知道,強監督語義分割是像素級別的監督,得到的分割結果定然也是比較好的結果,相同條件下定然比弱監督要好,那麼爲什麼還要研究弱監督語義分割呢?

因爲強監督語義分割中要求的像素級別標註在人工標註數據集時,需要標註出每一個像素的類別,因此製作數據集時,需要耗費很大的人力成本和金錢成本,因此,若是能夠利用較容易獲得的類別標籤完成語義分割任務必然是有極大價值的!

通過這幾個問題,你是不是已經瞭解了圖像語義分割以及弱監督語義分割了呢?如果還有什麼問題,歡迎交流提問哦!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章