【深度學習】CVPR2019-PAPER IDEAS

1. driving stereo: a large-scale dataset for stereo matching in autonomous driving scenarios

這位朋友的工作主要是在製作深度數據集,製作數據集的過程寫了這篇paper。主要是深度標籤不好獲得,直接用雷達獲取的還不夠準確,他又結合了其他信息來製作更準確的label~(第一次知道,製作label的方法也可以寫文章。。之前一直以爲根據圖片和label訓練的過程可以發paper。。。emmmm)

 

2. pose2seg

之前我也做過類似的,這邊是先提pose特徵+pose定位點,然後得到分割結果。

我之前做過pose定位點+image,得到分割結果。

 

3. cyclic guidance for weakly supervised jiont detection and segmentation

weakly supervised: 只有分類標籤,訓練detection和seg任務

用分類的各種heat map作爲檢測的僞標籤,檢測的預測圖作爲分割的僞標籤,分割的結果再返回來優化檢測,形成一個環~

 

4. visual attention consistency under image transforms for multi-label image classification

這個是我感覺今天上午看到最有意思的工作之一,雖然在分類任務上做的,但是,我感覺使用範圍並不侷限於分類。

主要思想:原圖片和翻轉的圖片提取的feature理論上也是翻轉的關係,但是實際情況確不是這樣的,他們分別把原圖和翻轉的圖片輸入網絡提取特徵,然後翻轉其中一個特徵,兩個特徵做個consistency loss,over。

思想簡單,一目瞭然,十分有道理啊~好奇爲啥這個工作不是oral。。

 

5. bag of tricks for image classification with convolutional neural networks

a. learning rate warm up

b. mix up training

c. label smoothing

d. cosine learning rate decay

e. knowledge distillation

似乎是之前的各種方法的組合。。人太多了。。沒能去問。。

 

6. libra r-cnn: towards balanced learning for object detection

三個創新點,1. 沒懂。2. 沒懂,大概是結合不同level的信息幹啥來着。3. 我感覺第三個創新點比較有意思,detection會出分類和檢測的結果,有的框分類結果對,但是檢測框不準,有的是檢測框比較準,分類結果不對。分類和檢測是兩個loss分別約束的,同時訓練的時候這種不匹配的情況就會互相影響,比如,分類很好了,檢測還差一點,那這個檢測就很難訓練到,他們改進loss曲線,讓分類好的那些,依舊可以提升檢測效果~然後就有提升了

 

7. adaptively connected neural networks

這個去的時候沒有人了。。大概看了一下,self,cnn, mlp三種連接方式做了一個balance~想法蠻簡單的~不過,有點兒像剪枝。。。

 

 

——————————————————————————————————————————————————————————————

 

 

1. Dual attention network for sene segmentation

兩個分支,分別在hw和c維度計算attention,然後合併兩個分支結果,該部分加在網絡最後

 

2. decoders matter for semantic segmentation: data-dependent decoding enables flexible feature aggregation

贊~

擴展channel數量,然後channel四等分,放在前邊,相當於2倍upsample,這種upsample是有參數的upsample,參數存在weight中,在計算過程中施加對weight的約束,使upsample的圖像再downsample之後還原回原圖儘可能減少損失。這個部分加在網絡最後來提升效果。

 

3. compressing convolutional neural networks via factorized convolutional filters

贊~

一種確定剪枝策略的方法,和drop out的區別是,drop out是隨機的,這個方法是通過某種約束來選擇的。

約束是:每一個weight對應一個v(取0或者1)來決定這個weight保留還是去掉,但是離散值並不能求解最優值,他們想到一個方法,如果v是2維,它的取值一共有4個,可以看作是以這四個點爲頂點的正方形與其外接圓的交點,這兩個區域求最優值然後求交集就可以得到解的值。就可以知道相應的點需要保留還是去掉了。

 

4. context-reinforced semantic segmentation

通過強化學習找到分割結果中有效的部分作爲僞標籤加入到訓練過程中提升網絡性能。之前通過confidence map沒有效果的原因是一開始訓練的結果直接來選,並不一定confidence高的就是分類準確的,所以他們一開始加入強化學習幫助網絡區分哪些是好的,哪些是不好的。

 

5. A simple pooling-based design for real-time salient object detection

在顯著性檢測任務中在網絡的不同層各種加提取多尺度信息的結構。結合顯著性獻策和邊緣提取的任務來提升顯著性檢測的效果。

 

6. Progressive image deraining networks: a better and simpler baseline

很新奇的點呀~

任務是圖片去雨。這個任務目前的網絡結構越來越複雜,但是作者找到了一種比較簡單的結構並且很work。沒有提出新的結構,只是去掉了很多冗餘的結構。不過在rebuttal的時候reviewer也會說沒有新的方法~但是還是通過了。

 

7. Deep flow-guided video inpainting

任務是補全video裏邊缺少的一塊。通過video的flow來從其他幀選取像素補全當前像素缺失的部分。

 

8. Towards instance-level image-to-image translation

任務是圖片白天轉爲黑夜。對不同的物體採取不同的轉換網絡來訓練(主要是用於修改test時使用的網絡的前邊的參數),更有針對性。測試的時候是一個網絡結構,保證圖片中間不會有斷層。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章