FitNets: Hints for Thin Deep Nets

其實應該先早點寫這篇文章的

這篇文章主要是將hinton的output distillation擴展到了feature distillation
在這裏插入圖片描述
在這裏插入圖片描述
該loss用來拉進student和teacher feature的距離在這裏插入圖片描述
該loss就是與hard label、soft label做cross entroy
訓練過程需要注意:

  1. 先進行hints training,即選擇某一層feature對齊後,利用HT loss訓練該層前面的參數
  2. 固定前面的參數,利用KD loss,訓練整個網絡
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章