整體的感受:
- (1)一個簡單的CNN的圖像分類已經有所接觸了,識別人臉和識別嘴脣的部分有預處理了
- (2)然後摳出ROI的區域送入分類器,25%的背景padding,也有resize的部分,resize到同一個尺寸
- (3)深度學習大部分就是調參和網絡設計的優化部分,改網絡的門檻應該很高,需要很多經驗。
- (4)同時要關注中間過程,每一步提取的特徵的部分等
一個整體的過程:人臉檢測-》嘴脣檢測-》表情分類
前面的檢測+定位都是用已有的算法做好了。然後分類的接口給圖像分類!
1、image downloader
下載和安裝參考資料,主要是要在image downloader下面創建一個bin,裏面放入:
然後,python執行requirement.txt(github的中文教程裏面有,image downloader的github),然後anconda prompt裏面輸入python image_downloader_gui.py 即可打開GUI界面
2、預處理
- 數據清洗:先利用人臉檢測將人臉的部分檢測出來。批量數據初步處理
- 再把嘴脣的部分挑選出來
3、數據接口準備
3.1 生成正負樣本路徑+list
把正負樣本放在這些位置即可
3.2 分爲訓練集和驗證集
3.3 tensorflow數據接口
- 把img數據和標籤數據用Tensorflow的接口處理好,同時做好數據增廣的操作,如crop,flip,random_brightness,random_contrast等
- 網絡設置,3層簡單的網絡模型定義如下
- 模型訓練
- 可視化(保留中間結果進行可視化)如:訓練誤差,accuracy,迭代中的圖片
- 模型測試