模型壓縮之蒸餾算法小結

原創

2019-09-15 21:59

模型壓縮之蒸餾算法小結

文章目錄

模型壓縮之蒸餾算法小結

輸出配準

直接配準

擬合注意力圖

Paying More Attention to Attention: Improving the Performance of Convolutional Neural Networks via Attention Transfer（ICLR 2017）
Learning Lightweight Lane Detection CNNs by Self Attention Distillation（ICCV 2019）

擬合特徵

FitNets : Hints for Thin Deep Nets（ICLR2015）

關係配準

擬合特徵兩兩之間的關係

擬合輸出中蘊含的關係

擬合特徵自身內部的關係

原始文檔：https://www.yuque.com/lart/gw5mta/scisva
Google Slide: https://docs.google.com/presentation/d/e/2PACX-1vSsa5X_zfuJUPgxUL7vu8MHbkj3JnUzIlKbf-eXkYivhwiFZRVx_NqhSxBbYDu-1c2D7ucBX_Rlf9kD/pub?start=false&loop=false&delayms=3000
2019年09月07日製作

腦圖的原始文檔：http://naotu.baidu.com/file/f60fea22a9ed0ea7236ca9a70ff1b667?token=dab31b70fffa034a(kdxj)

輸出配準

Distilling the Knowledge in a Neural Network（NIPS 2014）

使用教師模型的soft-target

Deep Mutual Learning（CVPR 2018）

交替式訓練多個學生網絡互相促進

Born Again Neural Networks（ICML 2018）

從教師訓練學生1，以此由學生i訓練學生i+1，最後集成所有的學生模型

直接配準

擬合注意力圖

Paying More Attention to Attention: Improving the Performance of Convolutional Neural Networks via Attention Transfer（ICLR 2017）

配準各階段特徵通經過道融合後得到的單通道注意力圖

Learning Lightweight Lane Detection CNNs by Self Attention Distillation（ICCV 2019）

使網絡各階段的特徵通過通道融合計算注意力圖，配準早期的輸出注意力圖

擬合特徵

FitNets : Hints for Thin Deep Nets（ICLR2015）

第一階段使用一個迴歸模塊來配準部分學生網絡和部分教師網絡的輸出特徵，第二階段使用soft targets

關係配準

擬合特徵兩兩之間的關係

A Gift from Knowledge Distillation: Fast Optimization, Network Minimization and Transfer Learning（CVPR 2017）

計算相鄰階段特徵個通道之間的關係進行配準

Graph-based Knowledge Distillation by Multi-head Attention Network（BMVC 2019）

使用non-local挖掘相鄰階段特徵奇異值分解處理後的特徵之間的關係

擬合輸出中蘊含的關係

Similarity-Preserving Knowledge Distillation（ICCV 2019）

整個batch內部樣本對應輸出特徵之間的關係

Relational Knowledge Distillation（CVPR 2019）

batch中任意二元數據對應輸出的距離關係和三元組輸出對應角度關係

Data Distillation: Towards Omni-Supervised Learning（CVPR2018）

教師模型與學生模型結構可同可不同，會集成不同變換後的樣本對應的教師網絡的輸出

Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results（NIPS 2017）

半監督方法，教師模型使用當前學生模型的權重參數和上一週期的權重參數計算指數移動平均，一致性約束

擬合特徵自身內部的關係

Knowledge Adaptation for Efficient Semantic Segmentation（CVPR 2019）

對教師模型使用自編碼器轉換特徵，對學生模型使用適配單元來適配教師模型的特徵

Structured Knowledge Distillation for Semantic Segmentation（CVPR 2019）

同時結合了soft targets，以及使用gan做的更高級的信息的擬合

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

視頻目標分割之Video Object Segmentation using Space-Time Memory Networks

Video Object Segmentation using Space-Time Memory Networks 文章目錄Video Object Segmentation using Space-Time Memory Ne

2020-07-08 11:18:09

深度學習基礎——張量的通俗理解

轉載鏈接：https://www.cnblogs.com/abella/p/10142935.html 也許你已經下載了TensorFlow，而且準備開始着手研究深度學習。但是你會疑惑：TensorFlow裏面的Tensor，也就是“

2020-07-08 11:53:15

基於attention機制實現 CRNN OCR文字識別

定義網絡結構實現 BahdanauAttention，其中socre的實現方法爲 perceptron 形式 class BahdanauAttention(tf.keras.Model): def __init__(sel

2020-07-08 12:23:28

opencv 加載tensorflow pb模型

opencv加載的pb模型必須是用tf.layers 和 tf.nn 下的api構建的,使用slim會在加載時報未知的layer的錯誤基本流程: 1.加載pb bool CardDetect::load_model(string mo

2020-07-08 12:23:28

深度學習-攢機小記

預算1w以內吧。下面是英偉達DevBox的配置，可以作爲參考。 The DIGITS DevBox includes the following hardware and software: Four TITAN X GPU

2020-07-08 12:17:40

聊天機器人/對話生成

在這裏記錄一下聊天機器人方面的瞭解。算是一個Survey吧。聊天機器人有兩種技術方向： 1. 基於檢索 2. 基於生成模型術語 Generation based automatic chatting system Ne

2020-07-08 12:17:40

推薦系統系列（二）：從零開始搭建基於向量的推薦策略

從零開始搭建基於向量的推薦策略背景架構離線Pipeline搭建用戶行爲日誌上報日誌存儲到數據倉庫數據預處理模型訓練構建項目索引在線服務用戶向量預測最近項目查找總結參考背景向量召回/語義向量召回是現在流行的一種推薦策略，簡單來說

2020-07-08 12:17:27

論文解讀：Single path one-shot neural architecture search with uniform sampling

Single path one-shot neural architecture search with uniform sampling 1、總覽大多數搜索空間鬆弛化的方法裏，結構分佈是被連續地參數化了，這些參數在超網絡訓練時一同被

2020-07-08 12:06:15

深度學習論文中的一些術語（僅備份用，不定時更新）

hinge loss: 是機器學習領域中的一種損失函數，可用於“最大間隔(max-margin)”分類 hinge loss 函數是凸函數，因此機器學習中很多的凸優化方法同樣適用於 hinge loss empirical risk: 經

2020-07-08 12:04:52

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度學習_目標檢測_“YOLOv5”詳解（持續更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

[深度之眼]LeNet/AlexNet/VGGNet/InceptionNet/ResNet實現fashion_mnist分類

本文使用五種經典卷積神經網絡，實現fashion_mnist十分類問題，並對比準確度和運行時間LeNet5 原理AlexNet8 原理VGGNet16 原理InceptionNet10 原理ResNet18 原理用到的包： im

2020-07-08 11:53:37

TensorFlow+CNN+OpenCV快速識別中文驗證碼

聲明:文章僅源自個人興趣愛好，不涉及他用，侵權聯繫刪。轉載請註明：轉自此博文https://leejason.blog.csdn.net/article/details/106150572 TensorFlow+CNN+Open

2020-07-08 11:43:39

apt-get update 卡在working 0 已解決

Ign:1 http://mirrors.163.com/ubuntu trusty InRelease Get:2 http://mirrors.163.com/ubuntu trusty-security InRelease

一蓑烟雨任平生yu

2020-07-08 11:20:23

深度學習調參技巧pdf . Free download!

這裏有一份深度學習的調參技巧《Neural Networks: Tricks of the Trade》收錄了許多論文裏提出的調參技巧。送給大家！鏈接: https://pan.baidu.com/s/1dtKVOYsu6pY

一蓑烟雨任平生yu

2020-07-08 11:20:22

24小時熱門文章

最新文章

最新評論文章