caffe finetune微調

原創

2019-08-25 12:55

什麼是fine-tuning：

在別人基於caffe訓練好的模型（如caffenet，googlenet等）的基礎上，利用別人訓練好的模型的權重參數值，通過訓練自己的圖片集修改最後一層的（也就是softmax）的參數和輸出類別，說白了就是網絡層的前面層不變作爲一個特徵提取器，只改變最後一層作爲一個分類器，最後的訓練就相當於訓練了一個適合自己需求的分類器。

finetune需要下面幾個文件：

train_val.prototxt

deploy.prototxt（測試時用到）

solver.prototxt

caffemodel（別人訓練過的）

步驟：

1.修改輸入輸出均值文件，若有網絡名字也要修改。輸入中的數據的數據格式大小也要記得修改。輸出時如果最後一層不是全連接（比如：squeezenet），在最後的num_output上修改。

2.修改最後一層的名稱，與修改網絡名字的原理一樣。因爲已訓練好的模型中沒有與新的層進行匹配的結果，因此就會以新的隨機值初始化最新創建的層。不匹配就會重新開始訓練這一層，而前面的層也不會改變。

3.學習速率，由於finetune是在局部進行微調，因此學習速率base_lr不能太大，選擇0.01，0.001...並且我們希望學習速率能隨着迭代的次數不斷降低，而且學習速率降低的幅度更快一些。這樣以來，在使用step的策略時，stepsize可以更小一些。也就是運行更少的次數，降低一次lr。

4.因爲最後一層是重新學習，因此需要有更快的學習速率相比較其他層，因此我們將，weight和bias的學習速率加快10倍。

5.train與test中的batch_size過大不修改，會出現許多Restarting data prefetching from start。跑的速度感覺也很慢，是因爲自己的數據集比模型訓練的數據集小得多，而我的批處理大小是相同的。因此，很明顯，爲了測試網絡，網絡必須從一開始就預先獲取大量數據。但這樣的話，GPU的佔有率也比較高。

6.deploy.prototxt與train_val.prototxt要修改得一致。

dim: 1 num，對待識別樣本進行數據增廣的數量，可自行定義。一般會進行5次crop，之後分別flip。如果該值爲10則表示一個樣本會變成10個，之後輸入到網絡進行識別。如果不進行數據增廣，可以設置成1
dim: 3 通道數，表示RGB三個通道
dim: 128 圖像的長和寬

參考：https://blog.csdn.net/u010402786/article/details/70141261

https://blog.csdn.net/qq_18644873/article/details/84634580

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

caffe finetune微調

什麼是fine-tuning：

步驟：

985 碩士程序員，空窗 4 個月沒有 Offer！

【入門教程】5分鐘教你快速學會集成Java springboot ~

營銷系統黑名單優化：位圖的應用解析

一文搞懂 Spring 循環依賴

我真的從測試轉成了開發......

盛大發布 | Zabbix 7.0 LTS--性能與擴展的卓越融合

nginx添加相應配置，通過瀏覽器訪問或curl時返回客戶端對應公網IP

賽博鬥地主——使用大語言模型扮演Agent智能體玩牌類遊戲。

python內置函數——sorted

[oeasy]python020在遊戲中體驗數值自由_勇闖地下城_終端文字遊戲

劍指offer力扣刷題總結

Paper Reading :模型剪枝

Caffe中使用Python腳本在cifar10數據集上測試模型

caffe 訓練模型心得

caffe finetune微調

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結