分類&定位 簡述

分類

1二分類:是貓?不是貓?

多分類:是貓?是狗?是羊?

2深度分類網絡 = 特徵提取層+分類器

3softmax

4損失函數就交叉熵損失

5分類的兩種結構:全連接 :flatten操作 卷積:squeeze操作(把維度爲1的列去掉)

卷積方式輸入尺寸可不固定

定位

1定位的兩種方式: 滑動窗口   改造的卷積神經網絡

2滑動窗口:我們通過不斷的一個不斷滑動的窗口來截取圖片中的一部分,並放入分類模型中進行識別,返回所屬分類的概率值。

3使用改造的卷積網絡 

以VGG網絡爲例 網絡最後輸出是1*1*4096  這裏的4096代表圖片屬於中物體屬於不同類別的概率。

我們改造VGG網絡使其 輸出爲7*7*4096 這裏代表的是7*7的圖像像素級別的分類概率

這代表原圖32倍像素級別下采樣的分類概率。

這個圖片切片可能是原圖片的一部分 我們可以把相同類別的標定框進行合併。

4 滑動窗口存在 窗口大小不確定 移動間距不好確定的問題  計算量大 速度慢

5 改造的VGG網絡 會受限於32倍的下採樣率

6定位-網絡結構

定位輸入的是一張圖片 通過網絡輸出的是 標定框信息(位置)+分類結果

損失函數 total-loss = classification-loss + α regression-loss

α 可以使在送損失函數中的分類損失和迴歸損失中取得一定的平衡

提問:我們這個網絡最後輸出的feature  map 包含空間信息嗎?

答:包含 神經網絡在學習過程中是根據損失函數的中所需的信息來進行學習的 ,我們的total-loss 中包括 空間的信息。

7我們使用的迴歸損失函數是平滑L1損失

 

這個損失函數在x=0時可導 計算優越性

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章