分類&定位簡述

原創

2019-09-09 23:14

分類

1二分類：是貓？不是貓？

多分類：是貓？是狗？是羊？

2深度分類網絡 = 特徵提取層+分類器

3softmax

4損失函數就交叉熵損失

5分類的兩種結構：全連接：flatten操作卷積：squeeze操作（把維度爲1的列去掉）

卷積方式輸入尺寸可不固定

定位

1定位的兩種方式：滑動窗口改造的卷積神經網絡

2滑動窗口：我們通過不斷的一個不斷滑動的窗口來截取圖片中的一部分，並放入分類模型中進行識別，返回所屬分類的概率值。

3使用改造的卷積網絡

以VGG網絡爲例網絡最後輸出是1*1*4096 這裏的4096代表圖片屬於中物體屬於不同類別的概率。

我們改造VGG網絡使其輸出爲7*7*4096 這裏代表的是7*7的圖像像素級別的分類概率

這代表原圖32倍像素級別下采樣的分類概率。

這個圖片切片可能是原圖片的一部分我們可以把相同類別的標定框進行合併。

4 滑動窗口存在窗口大小不確定移動間距不好確定的問題計算量大速度慢

5 改造的VGG網絡會受限於32倍的下採樣率

6定位-網絡結構

定位輸入的是一張圖片通過網絡輸出的是標定框信息（位置）+分類結果

損失函數 total-loss = classification-loss + α regression-loss

α 可以使在送損失函數中的分類損失和迴歸損失中取得一定的平衡

提問：我們這個網絡最後輸出的feature map 包含空間信息嗎？

答：包含神經網絡在學習過程中是根據損失函數的中所需的信息來進行學習的，我們的total-loss 中包括空間的信息。

7我們使用的迴歸損失函數是平滑L1損失

這個損失函數在x=0時可導計算優越性

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

分類&定位簡述

分類

定位

MySQL 核心模塊揭祕 | 18 期 | 鎖在內存里長什麼樣*

使用perf工具生成火焰圖

HttpSecurity 是如何組裝過濾器鏈的

數說海南——近6年海南各市縣人口簡單看

長序列中Transformers的高級注意力機制總結

響應式界面控件DevExtreme * 更強的數據分析和可視化功能

GAN，DCGAN，cGAN，pix2pix，CycleGAN,原理簡單理解

基於tf-slim 的衛星區域地形的分類模型的訓練。

經典網絡實現

錯誤：cannot unpack non-iterable float object

基於object-detection和tf-slim的辦公室檢測項目

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

分類&定位 簡述

分類

定位

分類&定位簡述