使用MatConvNet生成一個字符識別的動態鏈接庫(上)

簡介

該文會介紹如何利用MatConvNet生成一個可供其他程序調用的DLL。主要內容有:MatConvNet的安裝和配置、MatConvNet的手寫體識別demo、編寫數字識別函數、用MCC生成動態鏈接庫、VC下的再次封裝、使用以及常見錯誤。此外作者運行環境爲:Win7 64位+VS2012+Matlab2005rb
注:因爲所有的資料都可以在網上找到,所以有些過程描述的不夠詳盡,請自行百度或者留言交流。

MatConvNet的安裝和配置

MatConvNet官網中下載項目,建議下載最新版本(23版)。另提一句,如果你需要補一下CNN的基礎理論,可以下載官網上的手冊進行查閱。
這裏寫圖片描述

解壓後,用matlab進入項目根目錄的matlab目錄下。在命令行下運行vl_compilenn.m進行編譯。

可能遇到的問題
1.如果你是第一次用matlab混編,老版本matlab可能需要用 mex -setup命令 選擇一下c++編譯器
2.編譯源碼的時候可能會出現一些編譯錯誤,此時可根據提示定位到c++源碼中,進行適當的修改重新編譯即可。本人遇到的問題有缺少round函數,因爲VC的庫沒有這個函數,自己在該源碼文件的頭部添加一個round函數的實現即可。還有提示缺少 stdbool頭文件,VC下不用這個直接註釋。

編譯完成後,運行 vl_setupnn 配置下運行環境

MatConvNet的手寫體識別demo

進入項目根目錄下的examples\mnist\目錄。運行cnn_mnist_experiments
程序會自動下載mnist數據集,並用兩種方式進行訓練。默認的epoch次數是20,可以在cnn_mnist_init.m文件中進行修改。另外該文件是MatConvNet構建自己神經網絡拓撲結構的範例,按照自己的理解加了註釋,有問題歡迎留言指正。

function net = cnn_mnist_init(varargin)
% CNN_MNIST_LENET Initialize a CNN similar for MNIST
opts.batchNormalization = true ;%是否使用BN
opts.networkType = 'simplenn' ;%選用的網絡結構 simplenn或dagnn,定義見手冊"3.1 Wrappers"
opts = vl_argparse(opts, varargin) ;%整合輸入參數

rng('default'); %隨機數種子重置
rng(0) ;

f=1/100 ;
net.layers = {} ;
%添加捲積層 特徵圖20 卷積窗口大小5*5 滑動窗口步長1 不進行pading
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(5,5,1,20, 'single'), zeros(1, 20, 'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
%添加採樣層 方法爲最大池化 池化窗口2*2
net.layers{end+1} = struct('type', 'pool', ...
                           'method', 'max', ...
                           'pool', [2 2], ...
                           'stride', 2, ...
                           'pad', 0) ;
%添加捲積層 特徵圖50 卷積窗口大小5*5 滑動窗口步長1 不進行pading            
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(5,5,20,50, 'single'),zeros(1,50,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
%添加採樣層 方法爲最大池化 池化窗口2*2
net.layers{end+1} = struct('type', 'pool', ...
                           'method', 'max', ...
                           'pool', [2 2], ...
                           'stride', 2, ...
                           'pad', 0) ;
%添加捲積層 特徵圖500 卷積窗口大小*4 滑動窗口步長1 不進行pading   
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(4,4,50,500, 'single'),  zeros(1,500,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
%添加ReLU層
net.layers{end+1} = struct('type', 'relu') ;
%全連接層
net.layers{end+1} = struct('type', 'conv', ...
                           'weights', {{f*randn(1,1,500,10, 'single'), zeros(1,10,'single')}}, ...
                           'stride', 1, ...
                           'pad', 0) ;
%評價函數爲 softmax 的負對數
net.layers{end+1} = struct('type', 'softmaxloss') ;

%插入BN層
% optionally switch to batch normalization
if opts.batchNormalization
  net = insertBnorm(net, 1) ;
  net = insertBnorm(net, 4) ;
  net = insertBnorm(net, 7) ;
end

% Meta parameters
net.meta.inputSize = [28 28 1] ; %輸入圖像大小 w*h*c
net.meta.trainOpts.learningRate = 0.001 ;%影響SGD
net.meta.trainOpts.numEpochs = 10 ;%epoch次數(訓練集訓練次數)
net.meta.trainOpts.batchSize = 100 ;%batch SGD 大小

% Fill in defaul values
net = vl_simplenn_tidy(net) ;

% Switch to DagNN if requested
switch lower(opts.networkType)
  case 'simplenn'
    % done
  case 'dagnn'
    net = dagnn.DagNN.fromSimpleNN(net, 'canonicalNames', true) ;
    net.addLayer('top1err', dagnn.Loss('loss', 'classerror'), ...
      {'prediction', 'label'}, 'error') ;
    net.addLayer('top5err', dagnn.Loss('loss', 'topkerror', ...
      'opts', {'topk', 5}), {'prediction', 'label'}, 'top5err') ;
  otherwise
    assert(false) ;
end

% --------------------------------------------------------------------
function net = insertBnorm(net, l)
% --------------------------------------------------------------------
assert(isfield(net.layers{l}, 'weights'));
ndim = size(net.layers{l}.weights{1}, 4);
layer = struct('type', 'bnorm', ...
               'weights', {{ones(ndim, 1, 'single'), zeros(ndim, 1, 'single')}}, ...
               'learningRate', [1 1 0.05], ...
               'weightDecay', [0 0]) ;
net.layers{l}.biases = [] ;
net.layers = horzcat(net.layers(1:l), layer, net.layers(l+1:end)) ;

可自己根據要求修改網絡結構訓練,訓練後把cnn_mnist函數的返回結果保存下來,我們後面要用。另外你應該能在訓練結果的目錄下看到imdb.mat文件,裏面存的是mnist數據集。

編寫數字識別函數

這一部分我們要寫三個函數,加載神經網絡參數、加載訓練集圖片均值、識別函數

function DUCO_LoadNet(netPath)
global g_net;
g_net=load(netPath);
end
function DUCO_LoadImgAve(imgave_path)
 global g_imgave;
 g_imgave=load(imgave_path);
end
function numeric=DUCO_OCRNum(img)
 global g_imgave;
 global g_net;
g_net.layers{1, end}.type = 'softmax';
%resize inuput img
img=rot90(img);%用matlab測試時,需要註釋掉這句話
img = imresize(img, [28 28], 'bicubic');
img = single(img);
%debug
%imwrite(uint8(img),'imgd.bmp');
%enddebug
img = bsxfun(@minus, img, g_imgave.imgave);
res = vl_simplenn(g_net, img);
[~, ~, n] = size(res(end).x(1, 1, :));
tmp = 0.0;
for i = 1 : n
    res(end).x(1, 1, i);
    if tmp < res(end).x(1, 1, i)
        numeric = i - 1;
        tmp = res(end).x(1, 1, i);
    end
end
end

再寫個主調函數測試一下

DUCO_LoadImgAve('imgave.mat');%訓練集的圖片均值,可在imdb中提取
DUCO_LoadNet('net1.mat');%訓練好的神經網絡參數
img=imread('5.png');
DUCO_OCRNum(img)%識別圖像,返回數字

值得注意的是,識別函數中對圖像進行了旋轉,這是因爲該函數下一步會被封裝給C++調用,c++中的二維數組是按行優先存儲,而matlab測試按列優先存儲。

發佈了37 篇原創文章 · 獲贊 31 · 訪問量 9萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章