這樣做是因爲經過cnn提取得到的特徵圖,其實包含了原始圖片的空間信息(也就是位置信息),如果直接做了由特徵圖到特徵向量的轉換,會破壞空間信息,而先做了全局平均池化,再做全連接層,效果會好一些。
這個內容是在看 Class Activate Map的過程瞭解的。
這個鏈接裏面進一步介紹了CAM中和全局平均池化的關係。
這樣做是因爲經過cnn提取得到的特徵圖,其實包含了原始圖片的空間信息(也就是位置信息),如果直接做了由特徵圖到特徵向量的轉換,會破壞空間信息,而先做了全局平均池化,再做全連接層,效果會好一些。
這個內容是在看 Class Activate Map的過程瞭解的。
這個鏈接裏面進一步介紹了CAM中和全局平均池化的關係。
https://www.bilibili.com/video/BV1k8411575T/?vd_source=d68ed178f151e80fea1e02efd205802c