TensorFlow下如何通過文件名/文件夾名獲取標籤，並加入隊列

原創

2018-09-04 02:52

TensorFlow官網給的cifar-10教程，是卷積神經網絡入門的好例子，有時想直接拿這個模型來跑自己的數據，卻發現他的數據類型不是常見的，我們一般獲取的數據（圖片）以文件夾分類存好，或者直接在文件名上註明了類別，這時就要通過文件名的來獲取標籤，顯然直接用cifar-10的方式是不行的。

這裏當然可以吧數據轉化成cifar-10那種類型，不過個人不喜歡這種方式吧。
另一種就還是老辦法，對文件名進行處理，獲取標籤。

其實處理文件名，對python來說，很簡單。只是剛接觸卷積神經網絡的，可能並不熟悉TensorFlow的用法（本人），怎麼修改代碼才能以這種方式讀取數據進隊列呢？看代碼：

import tensorflow as tf
import os

#這就是數據所在的路徑，其子目錄是若干個文件夾，分別對應一類數據，
#文件夾下存放的就是對應那一類的數據。
#命名方式：1，2，3，4····（代表不同的類別，簡單粗暴）
path="./data"

classes=2#數據類別的數量
imagesList=[]#存放圖片數據的列表（這裏存放的僅僅是圖片所在的路徑，並不是圖片）
labelsList=[]#存放標籤，與上面圖片是一一對應的
filepaths=[os.path.join(path,"%d"%i)for i in range (1,classes+1)]#存放path的子目錄的路徑
for p in filepaths:
    for filename in os.listdir(p):#獲取圖片的名字
        imagesList.append(os.path.join(p,filename))#圖片名和路徑拼接，然後如隊列
        labelsList.append(int(p[-1]))#這裏是按照命名的方式，p的最後一個字符就是類別

image = tf.cast(imagesList,tf.string)#轉化成tf的數據類型
label = tf.cast(labelsList,tf.int64)
queue = tf.train.slice_input_producer([image,label])#生成隊列，這裏也就關鍵的地方
label = queue[1]
image_c = tf.read_file(queue[0])
image = tf.image.decode_jpeg(image_c,channels = 3)
training_image_data = tf.image.resize_images(image, [2, 2]) #這個函數是重塑行，具體幹嘛不清楚，不用有時報錯
example_batch, label_batch = tf.train.shuffle_batch([training_image_data,label], batch_size=1, capacity=2, min_after_dequeue=1)  #生成Batch
# 運行Graph  
with tf.Session() as sess:  
    coord = tf.train.Coordinator()  #創建一個協調器，管理線程  
    threads = tf.train.start_queue_runners(coord=coord)  #啓動QueueRunner, 此時文件名隊列已經進隊。  
    for i in range(6):  
        e_val,l_val = sess.run([example_batch, label_batch])  
        print (e_val,l_val)#弄些簡單的數據來測試效果。

    coord.request_stop()  
    coord.join(threads)

參考：
1、https://www.cnblogs.com/wktwj/p/7227544.html
2、https://blog.csdn.net/lujiandong1/article/details/53376802

感謝！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

TensorFlow下如何通過文件名/文件夾名獲取標籤，並加入隊列

一個整數可以由其他若干個連續整數的和表示（java）

java學習-基礎（3）

Java學習-基礎（7）

求數組裏不存在的最小正整數

輸出4個整數（不重複）的所有排列組合

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結