一般來說,想要搭建自己的深度學習模型來對自己的圖像數據做處理往往是需要準備很多數據才行的,不然模型性能是很差的,之前也做過一些人臉識別的應用實踐,但大都是需要自己去採集自身的人臉圖像數據,這個就比較主觀了,因爲你可以採集的很多很多人臉圖像數據,或者也可以採集的很少,但是很少的話一般效果都不會太好。今天找到一個很有意思的數據集,是我目前接觸到的人臉識別領域中最爲迷你的數據集,爲什麼說它“迷你”呢?主要有兩個原因:
1、種類很多,一共包含有40個人的圖像數據
2、單個人的圖像數據很少只有10張,這個對於深度學習類型的任務來說是遠遠不夠的
今天就想基於這個數據集來構建一個基礎的人臉識別應用。
下面是這個數據集的全部數據:
首先是gif版的:
接下來是png版的
我當時看到這個數據集的時候真的都是驚呆了的,真的也是沒有想到居然會有這麼小的數據集,所有的人臉圖像數據均勻地分佈在一張完整的圖片上了,這應該也是我接觸到的最簡潔的數據集了吧。
首先需要對原始的圖像數據集進行劃分處理,我習慣將原始的圖像數據解析之後存儲到不同的子目錄中去,這樣可以直接從本地的數據集中以加載圖像的形式來完成數據集的加載、劃分等操作,下面是原始數據的解析操作代碼實現:
#!usr/bin/env python
# encoding:utf-8
from __future__ import divisio