人臉年齡性別預測——age & gender

這是個基本問題,用人臉預測年齡和性別從主觀上看是可行的,如果說從聲音上來分辨似乎也無不可。

如果有聲音數據的話,分辨性別還是可以的,但年齡人臉還是關鍵,因爲人的聲音可以有假音,比如我的假唱。

【如果可以的話,當個花瓶也不錯啊。哈哈】

鑑於我的昨天的問題,其實就是作者寫的複雜化了,本來很簡單的問題,結果搞了幾個腳本,好幾百行代碼,讀圖,存圖,再讀圖,你累不累啊??本應該一次讀圖就解決的問題。結果來個圖像編碼???其中的用意在於什麼??

jpeg是訓練的數據格式?png,jpg都不行???都不能用還是不能正確預測啊??

這個問題稍後我再細看,我先直接喂模型數據,這個是最直接的!!!

我要實現同樣的功能不超過100行代碼,能簡化代碼纔是大佬,繁瑣的複雜的都是爲了屏蔽小白的做法。

【刪繁就簡三秋木,標新立異二月花】就要做到最簡單,最方便,一目瞭然!!!

for a single image with only one face,why the batch is 12???R U kidding Me?ignore the guess prob at first

Running file ./frontal-face-2.jpg
Running multi-cropped image
image_batch = Tensor("stack_1:0", shape=(12, 227, 227, 3), dtype=float32, device=/device:CPU:0)
Guess @ 1 (48, 53), prob = 0.42
Guess @ 2 (25, 32), prob = 0.36

Could I say the result of the age prediction is bullshit ?Will not use the age model,SO let's see the gender model

If the gender model is not really good ,will say LAJI !!!

But just Okey,so only use the gender model.

Some codes are not compatible with MTCNN,will change .

1-查看12個batch到底是啥玩意,畫出來。

感覺的確有點好高端啊,左右翻轉,並且添加了不同剪切的照片[當然其中必然有resize],做最終的判斷。

剪切的部分應該就是上下cut,寡人先忽略這個。

其中加了似乎有噪聲。可能是避免其他背景的影響。

圖片源於公開數據集:https://github.com/imagednn/rude-carnie 所用的數據

2-我僅僅用一個照片不能判斷嗎??have a try

先做單個圖片的,再做文件夾的。

開始我還以爲直接就喫12個圖片僅僅給出一個結果,那不是,肯定是12個結果,從中選擇了一個而已,這樣的話可以批處理了。

單個圖片多個人臉。

遇到了模型恢復問題,這是個 基本問題,我單獨開一篇https://blog.csdn.net/SPESEG/article/details/103297879

【百變大魔王小明哥,端茶遞水樣樣精通】

搞定,看個圖片吧,大圖【小人臉檢測下的預測都有很大誤差,這個似乎無法避免,如有好的解決方法不妨告訴我,多謝】

但是臥槽,爲啥子出錯了???請看我哥和小倩的合照

這個。。。。這。。。標錯了??

我查查,類別順序沒錯,作者的預測的沒毛病,難道就是12的問題???還是僅僅標錯了。

前者的話不至於差別這麼大,如果僅僅是標反了的話,那麼stylegan的結果就有點難以理解了。如下:

So should I use the 12-batch or encode/decode the image ???

According to the author's code, got 100% success of the prediction !!!

So need to modify the code I have.

仔細看了下序號對應,沒有問題。

那就是圖片編解碼問題了???或者圖片某種處理??crop?

我看看作者的意圖是什麼??pls ignore the prediction of the child's age, this is the model's problem.

這是我下午的工作內容。上個廁所。

我可以先試試6個的準確率如何,因爲越少越少,計算速度快。

3-解碼問題

臥槽,byte流,這幾把不好整了。這或許就是第二次讀圖的原因了。這就有點複雜了,我想自己水平翻轉下試試,再不行就加個上下或者對角翻轉,各種翻轉都用上。

這也是個基本問題,我另開一篇https://blog.csdn.net/SPESEG/article/details/103310565

下班,明天繼續

今天是12月第一天,2019年12月1日,驚聞哥哥的恩師黎小田先生仙逝,我很難過,哥哥走了,哥哥的老師也走了,還有什麼音樂陪伴我左右???推薦哥哥一首歌《不怕寂寞》,我記得有一場演唱會哥哥唱,黎小田先生鋼琴伴奏,哥哥還躺在了上面[這個在基仔紀念哥哥演唱會上也有提到],如今我早已學會了這首歌,哥哥在哪裏呢?不敢回首當年事,如今已是百年身。

看了下,tf讀圖的結果是小數-1~1之間的,這可能就是識別失敗的原因。我實際測試一下:範圍有大小,但有正負

>>> image_batch.min()
-1.1213884
>>> image_batch.max()
3.4474764

min=-2.69821,max=1.56011
min=-1.77689,max=3.20656
min=-3.37379,max=1.84279
min=-1.03419,max=3.15468
min=-1.03925,max=3.21948
min=-2.84769,max=1.56894

我比較好奇,這是怎麼做到的這個範圍,也不是-1~1,這就奇怪了。

cv2和PIL都是8位的,plt顯示需要的是0~1的。emmm,我怎麼轉換一下,轉換成-1~1之間吧

不不不,誤入歧途了,不可如此,其實很簡單的,應該是某種處理,不說了。我試試看看:

emm,我以爲原來的dlib不會差勁到看不到很明顯的人臉吧???我高估dlib了,如圖下,就是用dlib

直接漏掉了一個人臉,,,,,,這還玩個啥子???所以我這個菜鳥都放棄了這個玩意。

經過我處理後的數據能夠正確識別上個人臉中的14個,emm,就是漏掉的那個識別錯誤,難道dlib也發現奇怪了???

說不定加點上面的翻轉啥的可以提高,也可能沒作用,我試試哥哥和小倩吧:終於解決了這個問題,天不負我。

就這樣吧。拜拜,下面我做的將是圖像相似度,或者說是圖像內容的分類識別,已經開始了。跟我一起開創新紀元吧。

復聯3-無限戰爭

 

我 再也不會怕寂寞

寂寞已用一把鎖

鎖走真的我

 

另外有相關問題可以加入QQ羣討論,不設微信羣

QQ羣:868373192 

語音圖像深度學習羣

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章