Keras上實現卷積神經網絡CNN——一個例子程序

一、概述及完整代碼

本例的代碼主要來自keras自帶的example裏的 mnist_cnn 模塊，主要用到keras.layers中的Dense, Dropout, Activation, Flatten模塊和keras.layers中的Convolution2D,MaxPooling2D。構建一個兩層卷積層兩層全連接層的簡單卷積神經網絡，12次循環後可以達到99.25%的準確率，可見CNN的預測準確率已經相當高了。

import numpy as np
np.random.seed(1337)  # for reproducibility
from keras.datasets import mnist
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten
from keras.layers import Convolution2D, MaxPooling2D
from keras.utils import np_utils
from keras import backend as K

# 全局變量
batch_size = 128
nb_classes = 10
epochs = 12
# input image dimensions
img_rows, img_cols = 28, 28
# number of convolutional filters to use
nb_filters = 32
# size of pooling area for max pooling
pool_size = (2, 2)
# convolution kernel size
kernel_size = (3, 3)

# the data, shuffled and split between train and test sets
(X_train, y_train), (X_test, y_test) = mnist.load_data()

# 根據不同的backend定下不同的格式
if K.image_dim_ordering() == 'th':
    X_train = X_train.reshape(X_train.shape[0], 1, img_rows, img_cols)
    X_test = X_test.reshape(X_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    X_train = X_train.reshape(X_train.shape[0], img_rows, img_cols, 1)
    X_test = X_test.reshape(X_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255
print('X_train shape:', X_train.shape)
print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'test samples')

# 轉換爲one_hot類型
Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

#構建模型
model = Sequential()
"""
model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1],
                        border_mode='same',
                        input_shape=input_shape))
"""
model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1]),
                        padding='same',
                        input_shape=input_shape)) # 卷積層1
model.add(Activation('relu')) #激活層
model.add(Convolution2D(nb_filters, (kernel_size[0], kernel_size[1]))) #卷積層2
model.add(Activation('relu')) #激活層
model.add(MaxPooling2D(pool_size=pool_size)) #池化層
model.add(Dropout(0.25)) #神經元隨機失活
model.add(Flatten()) #拉成一維數據
model.add(Dense(128)) #全連接層1
model.add(Activation('relu')) #激活層
model.add(Dropout(0.5)) #隨機失活
model.add(Dense(nb_classes)) #全連接層2
model.add(Activation('softmax')) #Softmax評分

#編譯模型
model.compile(loss='categorical_crossentropy',
              optimizer='adadelta',
              metrics=['accuracy'])
#訓練模型
model.fit(X_train, Y_train, batch_size=batch_size, epochs=epochs,
          verbose=1, validation_data=(X_test, Y_test))
#評估模型
score = model.evaluate(X_test, Y_test, verbose=0)
print('Test score:', score[0])
print('Test accuracy:', score[1])

二、知識點詳解

1. 關於Keras可能會使用不同的backend

該選擇結構可以靈活對theano和tensorflow兩種backend生成對應格式的訓練數據格式。
舉例說明：’th’模式，即Theano模式會把100張RGB三通道的16×32（高爲16寬爲32）彩色圖表示爲下面這種形式（100,3,16,32），Caffe採取的也是這種方式。第0個維度是樣本維，代表樣本的數目，第1個維度是通道維，代表顏色通道數。後面兩個就是高和寬了。
而TensorFlow，即’tf’模式的表達形式是（100,16,32,3），即把通道維放在了最後。
這兩個表達方法本質上沒有什麼區別。

# 根據不同的backend定下不同的格式
if K.image_dim_ordering() == 'th':
    X_train = X_train.reshape(X_train.shape[0], 1, img_rows, img_cols)
    X_test = X_test.reshape(X_test.shape[0], 1, img_rows, img_cols)
    input_shape = (1, img_rows, img_cols)
else:
    X_train = X_train.reshape(X_train.shape[0], img_rows, img_cols, 1)
    X_test = X_test.reshape(X_test.shape[0], img_rows, img_cols, 1)
    input_shape = (img_rows, img_cols, 1)

2. 二維卷積層Conv2D

keras.layers.convolutional.Conv2D(
filters, kernel_size, strides=(1,1), padding=’valid’, data_format=None, dilation_rate=(1,1), activation=None, use_bias=True, kernel_initializer=’glorot_uniform’, bias_initializer=’zeros’, kernel_regularizer=None, bias_regularizer=None, activity_regularizer=None, kernel_constraint=None, bias_constraint=None)
二維卷積層對二維輸入進行滑動窗卷積，當使用該層作爲第一層時，應提供 input_shape 參數。

filters：卷積核的數目；
kernel_size：卷積核的尺寸；
strides：卷積核移動的步長，分爲行方向和列方向；
padding：邊界模式，有“valid”，“same”或“full”，full需要以theano爲後端；
其他參數請參看Keras官方文檔。

3. 二維池化層MaxPooling2D

keras.layers.pooling.MaxPooling2D(pool_size=(2,2), strides=None, padding=’valid’, data_format=None)

對空域信號進行最大值池化。

pool_size：池化核尺寸；
strides：池化核移動步長；
padding：邊界模式，有“valid”，“same”或“full”，full需要以theano爲後端；
其他參數請參看Keras官方文檔。

4. Activation層

keras.layers.core.Activation(activation)

激活層對一個層的輸出施加激活函數。

預定義激活函數：
softmax，softplus，softsign，relu，tanh，sigmoid，hard_sigmoid，linear等。

5. Dropout層

keras.layers.core.Dropout(p)

爲輸入數據施加Dropout。Dropout將在訓練過程中每次更新參數時隨機斷開一定百分比（p）的輸入神經元連接，Dropout層用於防止過擬合。

Flatten層

keras.layers.core.Flatten()

Flatten層用來將輸入“壓平”，即把多維的輸入一維化，常用在從卷積層到全連接層的過渡。Flatten不影響batch的大小。

例子：

model =Sequential()
model.add(Convolution2D(64,3, 3, border_mode='same', input_shape=(3, 32, 32)))
# now:model.output_shape == (None, 64, 32, 32)
model.add(Flatten())
# now:model.output_shape == (None, 65536)

7.Dense層全連接層

keras.layers.core.Dense(units,activation=None, use_bias=True, kernel_initializer=’glorot_uniform’,bias_initializer=’zeros’, kernel_regularizer=None, bias_regularizer=None,activity_regularizer=None, kernel_constraint=None, bias_constraint=None)

units：輸出單元的數量，即全連接層神經元的數量，作爲第一層的Dense層必須指定input_shape。

8. Sequential模型compile方法

compile(self,optimizer, loss, metrics=[], sample_weight_mode=None)

編譯用來配置模型的學習過程，其參數有：

optimizer：字符串（預定義優化器名）或優化器對象；
loss：字符串（預定義損失函數名）或目標函數；
metrics：列表，包含評估模型在訓練和測試時的網絡性能的指標，典型用法是metrics=[‘accuracy’]；

9. Sequential模型fit方法

fit(self,x, y, batch_size=32, epochs=10, verbose=1, callbacks=None,validation_split=0.0, validation_data=None, shuffle=True, class_weight=None,sample_weight=None, initial_epoch=0)

verbose：日誌顯示，0爲不在標準輸出流輸出日誌信息，1爲輸出進度條記錄，2爲每個epoch輸出一行記錄；
validation_split：0~1之間的浮點數，用來指定訓練集的一定比例數據作爲驗證集。驗證集將不參與訓練，並在每個epoch結束後測試的模型的指標，如損失函數、精確度等；
validation_data：形式爲（X，y）的tuple，是指定的驗證集。此參數將覆蓋validation_spilt。

10. Sequential模型evaluate方法

evaluate(self,x, y, batch_size=32, verbose=1, sample_weight=None)
相關參數可參考其他方法的同名參數說明。

關於keras的官方文檔，在 http://keras-cn.readthedocs.io/en/latest/
個人覺得英文版的相當不錯： https://keras.io/

轉自博客 http://blog.csdn.net/marsjhao/article/details/68490105

GerHard_Z

發佈了16 篇原創文章 · 獲贊 56 · 訪問量 13萬+

私信關注

Keras上實現卷積神經網絡CNN——一個例子程序

一、概述及完整代碼

二、知識點詳解

1. 關於Keras可能會使用不同的backend

2. 二維卷積層Conv2D

3. 二維池化層MaxPooling2D

4. Activation層

5. Dropout層

7.Dense層全連接層

8. Sequential模型compile方法

9. Sequential模型fit方法

10. Sequential模型evaluate方法

使用neovim打造go ide(支持代碼跳轉, 代碼補全, 實時語法檢查)

挑戰程序設計競賽 2.3章習題 poj 3046 Ant Counting

Shell/Python中的用戶名獲取

神經網絡 ——一個很好的解釋以及簡單實現 Implementing a Neural Network from Scratch in Python – An Introduction

python下安裝eemd

EMD經驗模態分解——分析時間序列

TICC- TimeSeries Analyze

歡迎使用CSDN-markdown編輯器

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結