keras flow_from_directory()

keras_preprocessing.image.image_data_generator.ImageDataGenerator.flow_from_directory()

獲取目錄路徑並生成一批增強數據。

def flow_from_directory(self,
                        directory: Any,
                        target_size: Tuple[int, int] = (256, 256),
                        color_mode: str = 'rgb',
                        classes: Any = None,
                        class_mode: str = 'categorical',
                        batch_size: int = 32,
                        shuffle: bool = True,
                        seed: Any = None,
                        save_to_dir: Any = None,
                        save_prefix: str = '',
                        save_format: str = 'png',
                        follow_links: bool = False,
                        subset: Any = None,
                        interpolation: str = 'nearest') -> DirectoryIterator

參數說明:

  • 目錄(directory):字符串,目標目錄的路徑。每個類應該包含一個子目錄。生成器中將包含每個子目錄樹中的任何PNG、JPG、BMP、PPM或TIF圖像。有關詳細信息,請參閱(https://gist.github.com/fchollet/0830affa1f7f19fd47b06d4cf89ed44d)。
  • 目標大小(target_size):整數的元組(高度、寬度)。默認值:(256,256)。將調整找到的所有圖像的尺寸。
  • 顏色_模式(color_mode):“灰度”、“rgb”、“rgba”之一。默認值:“rgb”。是否將圖像轉換爲具有1、3或4個通道。
  • 類列表(classes):類子目錄的可選列表。(例如,“狗”、“貓”)。默認值:無。如果沒有提供,將根據目錄下的子目錄名稱/結構自動推斷類列表,其中每個子目錄將被視爲不同的類(將映射到標籤索引的類的順序將是字母數字)。包含從類名到類索引的映射的字典可以通過屬性class_indexes獲得。
  • 類模式:確定返回的標籤數組的類型:“分類(“categorical”)”、“二進制(“binary”)”、“稀疏(“sparse”)”、“輸入(“input”)”、“無(None)”模式之一。默認值:“分類”。
  • “categorial”則是2維one-hot編碼標籤;
  • “binary”則是一維二進制標籤;
  • “sparse”是1維整數標籤;
  • “input”是與輸入圖像相同的圖像(主要用於自動編碼器);
  • None,則不會返回任何標籤(生成器將只生成一批圖像數據,與model.predict_generator()一起使用非常有用)。請注意,在類模式爲“無”的情況下,數據仍然需要駐留在目錄的子目錄中,以便它正常工作。
  • 批次大小(batch_size):數據批次的大小(默認值:32)。
  • 隨機播放(shuffle):是否隨機播放數據(默認值:True)。如果設置爲False,則按字母數字順序對數據進行排序。
  • 種子(seed):可選的隨機種子,用於洗牌和轉換。
  • 保存路徑(save_to_dir):none或str(默認值:none)。這允許您選擇指定一個目錄,將生成的增強圖片保存到該目錄(對於可視化所做的操作很有用)。
  • 保存前綴(save_prefix): Str. Prefix用於保存圖片的文件名(僅當設置了save_to_dir時才相關)。
  • 保存格式(save_format):“png”、“jpeg”之一(僅當設置了save_to_dir時才相關)。默認值:“png”。
  • 跟隨鏈接(follow_links):是否跟隨類子目錄內的符號鏈接(默認值:False)。
  • 子集(subset):如果在ImageDataGenerator中設置了驗證分割(validation_split),則爲數據的子集(訓練集"training" 或驗證集"validation")。
  • 插值(interpolation):當目標大小與加載的圖像大小不同時,用於對圖像重新採樣的插值方法。支持的方法有最近鄰"nearest"、雙線性"bilinear"和雙三次"bicubic"。如果安裝了PIL版本1.1.3或更高版本,還支持“lanczos”。如果安裝了PIL 3.4.0或更高版本,還支持“Box”和“Hamming”。默認情況下,使用“nearest”。

返回值

一個產生(x,y)元組的目錄迭代器(DirectoryIterator)。
其中x是包含一批(batch_size,* target_size,channels)類型的圖像的numpy數組,y是對應標籤的numpy數組。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章