1 learning a deep convnet for multi-label classification with partial labels
深度學習在單標籤分類任務中表現很好,但是日常生活中的圖像本質上是多標籤的。多標籤分類比單標籤分類更困難,因爲輸入圖像和輸出標籤空間都更復雜。與單標籤相比,大規模收集乾淨的多標籤註釋更難。爲了降低標註成本,我們建議訓練帶有部分標籤的模型,即每個圖像只知道部分標籤。
setting:共三種1. 全標籤;2. 分類多標籤,圖片部分標籤缺失;3. 部分標籤有誤
https://zhuanlan.zhihu.com/p/58135763
2 HRNet
先前的分類將分辨率從高到低的卷積串行連接,HRNet則是並行連接。
高分辨率網絡 (High-Resolution Network,HRNet)
關於多分辨率表徵信息交換,這裏以三個分辨率輸入和三個分辨率輸出爲例,如圖4所示。每一個分辨率的輸出表徵都會融合三個分辨率輸入的表徵,以保證信息的充分利用和交互。將高分辨率特徵降到低分辨率特徵時,我們採用stride爲2的3x3卷積;低分辨率特徵到高分辨率特徵時,先利用1x1卷積進行通道數的匹配,再利用最近鄰插值的方式來提高分辨率。相同分辨率的表徵則採用恆等映射的形式。
https://www.jiqizhixin.com/articles/2019-05-22-8