TensorFlow下如何通過文件名/文件夾名獲取標籤,並加入隊列

TensorFlow官網給的cifar-10教程,是卷積神經網絡入門的好例子,有時想直接拿這個模型來跑自己的數據,卻發現他的數據類型不是常見的,我們一般獲取的數據(圖片)以文件夾分類存好,或者直接在文件名上註明了類別,這時就要通過文件名的來獲取標籤,顯然直接用cifar-10的方式是不行的。

這裏當然可以吧數據轉化成cifar-10那種類型,不過個人不喜歡這種方式吧。
另一種就還是老辦法,對文件名進行處理,獲取標籤。

其實處理文件名,對python來說,很簡單。只是剛接觸卷積神經網絡的,可能並不熟悉TensorFlow的用法(本人),怎麼修改代碼才能以這種方式讀取數據進隊列呢?看代碼:

import tensorflow as tf
import os

#這就是數據所在的路徑,其子目錄是若干個文件夾,分別對應一類數據,
#文件夾下存放的就是對應那一類的數據。
#命名方式:1,2,3,4····(代表不同的類別,簡單粗暴)
path="./data"

classes=2#數據類別的數量
imagesList=[]#存放圖片數據的列表(這裏存放的僅僅是圖片所在的路徑,並不是圖片)
labelsList=[]#存放標籤,與上面圖片是一一對應的
filepaths=[os.path.join(path,"%d"%i)for i in range (1,classes+1)]#存放path的子目錄的路徑
for p in filepaths:
    for filename in os.listdir(p):#獲取圖片的名字
        imagesList.append(os.path.join(p,filename))#圖片名和路徑拼接,然後如隊列
        labelsList.append(int(p[-1]))#這裏是按照命名的方式,p的最後一個字符就是類別

image = tf.cast(imagesList,tf.string)#轉化成tf的數據類型
label = tf.cast(labelsList,tf.int64)
queue = tf.train.slice_input_producer([image,label])#生成隊列,這裏也就關鍵的地方
label = queue[1]
image_c = tf.read_file(queue[0])
image = tf.image.decode_jpeg(image_c,channels = 3)
training_image_data = tf.image.resize_images(image, [2, 2]) #這個函數是重塑行,具體幹嘛不清楚,不用有時報錯
example_batch, label_batch = tf.train.shuffle_batch([training_image_data,label], batch_size=1, capacity=2, min_after_dequeue=1)  #生成Batch
# 運行Graph  
with tf.Session() as sess:  
    coord = tf.train.Coordinator()  #創建一個協調器,管理線程  
    threads = tf.train.start_queue_runners(coord=coord)  #啓動QueueRunner, 此時文件名隊列已經進隊。  
    for i in range(6):  
        e_val,l_val = sess.run([example_batch, label_batch])  
        print (e_val,l_val)#弄些簡單的數據來測試效果。

    coord.request_stop()  
    coord.join(threads) 

參考:
1、https://www.cnblogs.com/wktwj/p/7227544.html
2、https://blog.csdn.net/lujiandong1/article/details/53376802

感謝!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章