Is object localization for free? Weakly-supervised learning with convolutional neural networks

摘要

提出一個弱監督卷積神經網絡for 分類。主要貢獻有：1. 輸出正確的分類結果（image-level）2. 預測合理的位置3. 對比跟bounding box

引言

本文利用的圖片只有圖片包含的物體列表信息，並不包含這些物體的位置信息。
本文利用卷及神經網絡來進行改進。5個卷積層+4個fc層。

最後一層fc網絡看做卷積網絡，這樣輸入圖片的大小就可以是任意形狀

在輸出時引進global max-pooling層，猜測圖片中物體的可能位置。

更改代價函數

模型結構

固定輸入224*224，輸出1*1*K向量,K 是類別個數。這裏通過滑動窗口將輸出拓展成m*n*K 。我們把fc看作是kernel跟輸入大小一樣的卷積層。這裏的輸入限定大小是224*224,但是圖片是256*256,所以我們設置的stride是32.這樣每張圖片就可以生成2*2*K 個輸出。關於如何實現，請看後文。 這個就比較好玩了，我不喜歡caffe自帶的crop，因爲只能crop四個角，還有中心區域，這樣的話就可以自己設置crop的大小個位置

max-pooling用於物體的明確搜索
對於每張圖，我們要輸出一個image-level的標籤。因爲有m*n個不同位置的評分。這樣可以用來多實例檢測。
多尺度滑動窗口
用0擴展邊界到500*500，resized 0.7-1.4倍。這個挺不錯。但是不能應用在atypia scoring中，因爲這裏，大小規模不一樣，評分標準不一樣。而分類物體是大小規模不一樣，但是分類結果要一樣。

分類實驗

主要預測物體是否存在。

這篇論文應該就是死路應該來源於Network in Network. 主要就是利用global average pooling。
其次就是多尺度圖片。

Reference：
Is object localization for free? Weakly-supervised learning with convolutional neural networks

Emma
SIAT
2017.03.02

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

論文筆記：Is object localization for free?

Is object localization for free? Weakly-supervised learning with convolutional neural networks

摘要

引言

模型結構

分類實驗

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

四大卷積網絡發家之路

論文筆記：Is object localization for free?

論文筆記：Grid Long Short-Term Memory

論文筆記：Look and Think Twice

論文筆記：A Global Covariance Descriptor for Nuclear Atypia Scoring in Breast Histopathology Images

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結