TensorFlow官網給的cifar-10教程,是卷積神經網絡入門的好例子,有時想直接拿這個模型來跑自己的數據,卻發現他的數據類型不是常見的,我們一般獲取的數據(圖片)以文件夾分類存好,或者直接在文件名上註明了類別,這時就要通過文件名的來獲取標籤,顯然直接用cifar-10的方式是不行的。
這裏當然可以吧數據轉化成cifar-10那種類型,不過個人不喜歡這種方式吧。
另一種就還是老辦法,對文件名進行處理,獲取標籤。
其實處理文件名,對python來說,很簡單。只是剛接觸卷積神經網絡的,可能並不熟悉TensorFlow的用法(本人),怎麼修改代碼才能以這種方式讀取數據進隊列呢?看代碼:
import tensorflow as tf
import os
#這就是數據所在的路徑,其子目錄是若干個文件夾,分別對應一類數據,
#文件夾下存放的就是對應那一類的數據。
#命名方式:1,2,3,4····(代表不同的類別,簡單粗暴)
path="./data"
classes=2#數據類別的數量
imagesList=[]#存放圖片數據的列表(這裏存放的僅僅是圖片所在的路徑,並不是圖片)
labelsList=[]#存放標籤,與上面圖片是一一對應的
filepaths=[os.path.join(path,"%d"%i)for i in range (1,classes+1)]#存放path的子目錄的路徑
for p in filepaths:
for filename in os.listdir(p):#獲取圖片的名字
imagesList.append(os.path.join(p,filename))#圖片名和路徑拼接,然後如隊列
labelsList.append(int(p[-1]))#這裏是按照命名的方式,p的最後一個字符就是類別
image = tf.cast(imagesList,tf.string)#轉化成tf的數據類型
label = tf.cast(labelsList,tf.int64)
queue = tf.train.slice_input_producer([image,label])#生成隊列,這裏也就關鍵的地方
label = queue[1]
image_c = tf.read_file(queue[0])
image = tf.image.decode_jpeg(image_c,channels = 3)
training_image_data = tf.image.resize_images(image, [2, 2]) #這個函數是重塑行,具體幹嘛不清楚,不用有時報錯
example_batch, label_batch = tf.train.shuffle_batch([training_image_data,label], batch_size=1, capacity=2, min_after_dequeue=1) #生成Batch
# 運行Graph
with tf.Session() as sess:
coord = tf.train.Coordinator() #創建一個協調器,管理線程
threads = tf.train.start_queue_runners(coord=coord) #啓動QueueRunner, 此時文件名隊列已經進隊。
for i in range(6):
e_val,l_val = sess.run([example_batch, label_batch])
print (e_val,l_val)#弄些簡單的數據來測試效果。
coord.request_stop()
coord.join(threads)
參考:
1、https://www.cnblogs.com/wktwj/p/7227544.html
2、https://blog.csdn.net/lujiandong1/article/details/53376802
感謝!