量化訓練

量化訓練

原創

XianxinMao

2019-07-30 09:32

tensorflow量化訓練:

post-training quantization: 剪枝，稀疏編碼，對模型存儲體積進行壓縮
quatization-aware training: forward F32==>int8 映射，backward F32梯度更新，保存模型int8，quantize/dequantize
還有一種訓練和推理都用int8
在訓練過程中引入精度帶來的誤差，然後整個網絡在訓練過程中進行修正

模型大小不僅是內存容量問題，也是內存帶寬問題
量化就是將神經網絡的浮點算法轉化爲定點

花哨的研究往往是過於棘手或前提假設過強，以至於幾乎無法引入工業界的軟件棧
Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference揭示了量化感知訓練的諸多細節
爲什麼量化是有效的(具有足夠好的預測準確度)，尤其是將FP32轉換爲INT8時已經丟失了信息？直覺解釋是神經網絡被過度參數化，進而包含足夠的冗餘信息，裁剪這些冗餘信息不會導致明顯的準確度下降。相關證據表明對於給定的量化方法，FP32網絡和INT8網絡之間的準確度差距對於大型網絡來說較小，因爲大型網絡過度參數化的程度更高

可能有用的github上的一些東西:

Tensorflow官網的一些東西:

TensorFlow Lite and TensorFlow operator compatibility

tensorflow量化訓練技巧:

在你定義好網路結構之後，加上下面這句話，即可量化訓練: tf.contrib.quantize.create_training_graph(input_graph=g, quant_delay=200)
論文中提到，爲了使量化訓練有更好的精度，推薦使用relu6，讓輸出限制在較小的範圍內
tf.contrib.quantize.create_eval_graph()和tf.contrib.quantize.create_training_graph()不能同時出現在同一程序中，不然會出問題
基於已經訓好的網絡去做模擬量化實驗的，不基於預訓練模型訓不起來，可能還有坑要踩，而且在模擬量化訓練過程中bn層參數固定，融合bn參數也是用已經訓練好的移動均值和方差，而不是用每個batch的均值和方差
重寫後的 eval 圖與訓練圖並非平凡地等價，這是因爲量化操作會影響 batchnorm 這一步驟
對於卷積層之後帶batchnorm的網絡，因爲一般在實際使用階段，爲了優化速度，batchnorm的參數都會提前融合進卷積層的參數中，所以訓練模擬量化的過程也要按照這個流程．首先把batchnorm的參數與卷積層的參數融合，然後再對這個參數做量化
對於權值的量化分通道進行求縮放因子，然後對於激活值的量化整體求一個縮放因子，這樣的效果最好

理論文章:

實踐文章:

用於coral TPU的預測 Object detection and image classification with Google Coral USB Accelerator(pyImageSearch)
基於tfslim的方式量化訓練 Quantizing neural networks to 8-bit using TensorFlow(armDevelop)
【Tensorflow系列】使用Inception_resnet_v2訓練自己的數據集並用Tensorboard監控(cnblogs)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

tensorflow量化訓練:

可能有用的github上的一些東西:

Tensorflow官網的一些東西:

tensorflow量化訓練技巧:

理論文章:

實踐文章:

釘釘打卡速度慢

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Python 潮流週刊#51：用 Python 繪製美觀的圖表

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

CIFAR-10 model

Tensorflow function(二)

docker proxy

Ubuntu problem

useful link

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結