caffe——solver參數設置

原創

2020-06-21 14:24

solver文件設置是通過協調網絡的正向推理和反向梯度來協調模型優化，得到試圖改善損失的的參數。學習的職責被分配給負責監督優化和生成參數更新的solver，以及負責生成損失和梯度的網絡。

caffe有六種優化器

Stochastic Gradient Descent (type: "SGD")
AdaDelta (type: "AdaDelta")
Adaptive Gradient (type: "AdaGrad")
Adam (type: "Adam")
Nesterov’s Accelerated Gradient (type: "Nesterov")
RMSprop (type: "RMSProp")

net: "models/bvlc_googlenet/train_val.prototxt" #訓練網絡模型

test_iter: 1000 #測試數據分1000批進行

test_interval: 4000 #每訓練4000步測試一次

test_initialization: false #是否是從頭訓練，false:沿用上一次訓練參數模型

base_lr: 0.01 # 基礎學習率

lr_policy: "step" # 每迭代stepsize次，下調學習率

gamma: 0.1 #下掉學習率的比例，每次下降10%

stepsize: 100000 # 每迭代100000步，調整學習率

max_iter: 350000 # 總共訓練350000步

momentum: 0.9 #剔除10%的參數，對過擬合有一定效果

snapshot: 40000 #迭代40000步保存一次訓練參數模型

snapshot_prefix #保存訓練參數模型地址

solver_mode: GPU #訓練模式：GPU 或 CPU

lr_policy:

lr_policy: 如下7種設置
//    - fixed: 學習率不變
//    - step: base_lr * gamma ^ (floor(iter / step))
//    - exp: base_lr * gamma ^ iter
//    - inv:    base_lr * (1 + gamma * iter) ^ (- power)
//    - multistep: 類似於step，需要設置stepvalue
//                       例如stepvalue: 1000 stepvalue: 2000 stepvalue: 3000
//    - poly:   base_lr (1 - iter/max_iter) ^ (power)
//    - sigmoid: base_lr ( 1/(1 + exp(-gamma * (iter - stepsize))))

對於lr_policy不同設置下learning_rate的圖形變化可以看這篇博客：

https://blog.csdn.net/cuijyer/article/details/78195178

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

基於香橙派AIpro將開源框架模型轉換爲昇騰模型

本文分享自華爲雲社區《如何基於香橙派AIpro將開源框架模型轉換爲昇騰模型》，作者：昇騰CANN。在前面的介紹中，我們知道了如何基於香橙派AIpro開發AI推理應用，也大致瞭解到在推理之前，需要把原始網絡模型 (可能是 PyTorch 的

2024-04-12 10:32:18

Caffe框架整理

Caffe安裝 Caffe框架下載地址：https://github.com/BVLC/caffe 下載完成後解壓，進入主目錄，執行 cp Makefile.config.example Makefile.config 安裝依賴

2023-11-07 13:31:07

技術分享 | TensorRT詳細入門指北，如果你還不瞭解TensorRT，過來看看吧！

Tensor是一個有助於在NVIDIA圖形處理單元（GPU）上高性能推理c++庫。它旨在與TesnsorFlow、Caffe、Pytorch以及MXNet等訓練框架以互補的方式進行工作，專門致力於在GPU上快速有效地進行網絡推理。如今現

2021-12-25 21:44:21

矩池雲上安裝 NVCaffe教程

使用的是P100，cuda11.1base鏡像創建虛擬環境 conda create -n py36 python=3.6 conda deactivate conda activate py36 安裝依賴包 apt update a

2021-08-05 21:15:27

caffe中在某一層獲得迭代次數的方法以及caffe編譯時報錯 error: 'to_string' is not a member of 'std'解決方法

caffe中在某一層獲得迭代次數的方法以及caffe編譯時報錯 error: 'to_string' is not a member of 'std'解決方法參考文章：（1）caffe中在某一層獲得迭代次數的方法以及caffe編譯時報

2021-07-19 09:27:35

ubuntu編譯caffe遇到的問題及解決方案

ubuntu編譯caffe遇到的問題及解決方案參考文章：（1）ubuntu編譯caffe遇到的問題及解決方案（2）https://www.cnblogs.com/cnugis/p/11113028.html （3）https://w

2021-06-04 09:17:13

聊聊人像摳圖背後的算法技術

本文分享自華爲雲社區《人像摳圖：算法概述及工程實現（一）》，原文作者：杜甫蓋房子。本文將從算法概述、工程實現、優化改進三個方面闡述如何實現一個實時、優雅、精確的視頻人像摳圖項目。什麼是摳圖對於一張圖I，我們感興趣

2021-05-13 21:35:32

圖片搜索太模糊？無損放大圖片神器來了

蘇生不惑第221篇原創文章，將本公衆號設爲星標，第一時間看最新文章。話說昨天文章建了個微信交流羣，和我一起在 b 站學 Python 發出去後，羣裏已經快200人了，你要一起學Python嗎？之前文章分享過圖片搜索如何通過電

2021-03-22 21:17:15

一文帶你熟悉Pytorch->Caffe->om模型轉換流程

摘要：本文旨在分享Pytorch->Caffe->om模型轉換流程。標準網絡 Baseline：PytorchToCaffe 主要功能代碼在： PytorchToCaffe +-- Caffe | +-- caffe.p

2021-02-22 21:31:18

RepVGG-caffe

pytorch版本：https://github.com/DingXiaoH/RepVGG caffe版本：https://github.com/imistyrain/RepVGG-caffe 我提供模型轉換的caffe版本：https:

2021-01-30 11:13:36

經典網絡AlexNet介紹

AlexNet經典網絡由Alex Krizhevsky、Hinton等人在2012年提出，發表在NIPS，論文名爲《ImageNet Classification with Deep Convolutional Neural Network

2021-01-30 10:50:13

崗位內推 | 美團視覺智能中心招聘AutoML實習生

PaperWeekly 致力於推薦最棒的工作機會，精準地爲其找到最佳求職者，做連接優質企業和優質人才的橋樑。如果你需要我們幫助你發佈實習或全職崗位，請添加微信號「pwbot02」。 AutoML實習生工作地點：北京市朝陽區望京國際研

2021-01-30 10:18:15

【招聘】蘇州抱壹微電子有限公司

❝ 公司簡介 ❞ 蘇州抱壹微電子有限公司於2011年10月在蘇州工業園區成立，公司提供IC 設計公司及系統公司的全套 Foundry 設計服務解決方案，從 Layout Service , APR, Fundamental IP,

2021-01-30 09:56:30

經典網絡VGGNet介紹

經典網絡VGGNet(其中VGG爲Visual Geometry Group)由Karen Simonyan等於2014年提出，論文名爲《Very Deep Convolutional Networks for Large-Scale Im

2021-01-30 09:45:22

深度學習領域，你心目中 idea 最驚豔的論文是哪篇？

點擊上方“AI算法與圖像處理”，選擇加"星標"或“置頂” 重磅乾貨，第一時間送達

2021-01-30 09:36:24

24小時熱門文章

最新文章

最新評論文章