CVPR之網絡設計（Related to Networks）（RePr）

原創

2019-06-27 13:42

1、RePr: Improved Training of Convolutional Filters
作者：Aaditya Prakash, James Storer, Dinei Florencio, Cha Zhang
論文鏈接：https://arxiv.org/abs/1811.07275

文章解讀：https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA==&mid=2247487556&idx=2&sn=34b41d2500564348c3b63c6ee71d8c28&chksm=ec1ffdbddb6874abbf4c02658126d031457702fc43165bc3ff1c58a32000260ba6bbc7fe8afb&token=65056564&lang=zh_CN#rd

簡要說明：針對卷積神經網絡的訓練方法，方法比較簡單，文章通過大量的分析和實驗，驗證了提出的訓練方法非常有效。

主要思路：新的訓練方法RePr，訓練過程先訓練整個網絡，根據metric drop掉30%的filter，再訓練剩下的網絡，再把drop的filter拿回來，用於現有filters正交的方式初始化。迭代這個過程N次。

算法中最重要的其實這個metric，即如何選出需要drop的filters。

文章寫的很明白，一個layer的多個卷積核可以用一個matrix表示，也就是 $W_{l}$ ，先對 $W_{l}$ 歸一化，再與自己的轉置相乘得到 $P_{l}$ ,這是一個 $J_{l}*J_{l}$ 大小的matrix，第i行表示其他filter對第i個filter的projection，可以看成是相關性，如果是正交性的越大，那麼這個值就越小，一行的數值之和越小，說明其他filter與這個filter相關性越低。因此可以通過這個sum來對filter進行rank。

同時文章還說明了，計算這個metric是在一個layer內，但rank是在所有layer進行的，目的是爲了不讓layer這個因數影響filter的rank，避開layer的差異性，同時也不引入過多的超參。

待續...

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

CVPR之網絡設計（Related to Networks）（RePr）

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

本地SSL證書過期輸入命令在IIS自動生成

.NET週刊【5月第2期 2024-05-12】

電腦硬件基礎知識及購買指南

Ubuntu下nvidia驅動安裝方式

樹莓派之人臉檢測

常見開源腦影像分析產品

各種池化的實現

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結