40行代碼的人臉識別實踐

40行代碼的人臉識別實踐
- - 前言
  - 一點區分
  - 所用工具
  - Dlib
  - 人臉識別

前言

很多人都認爲人臉識別是一項非常難以實現的工作，看到名字就害怕，然後心懷忐忑到網上一搜，看到網上N頁的教程立馬就放棄了。這些人裏包括曾經的我自己。其實如果如果你不是非要深究其中的原理，只是要實現這一工作的話，人臉識別也沒那麼難。今天我們就來看看如何在40行代碼以內簡單地實現人臉識別。

一點區分

對於大部分人來說，區分人臉檢測和人臉識別完全不是問題。但是網上有很多教程有無無意地把人臉檢測說成是人臉識別，誤導羣衆，造成一些人認爲二者是相同的。其實，人臉檢測解決的問題是確定一張圖上有木有人臉，而人臉識別解決的問題是這個臉是誰的。可以說人臉檢測是是人識別的前期工作。今天我們要做的是人臉識別。

所用工具

Anaconda 2——Python 2

Dlib

scikit-image

Dlib

對於今天要用到的主要工具，還是有必要多說幾句的。Dlib是基於現代C++的一個跨平臺通用的框架，作者非常勤奮，一直在保持更新。Dlib內容涵蓋機器學習、圖像處理、數值算法、數據壓縮等等，涉獵甚廣。更重要的是，Dlib的文檔非常完善，例子非常豐富。就像很多庫一樣，Dlib也提供了Python的接口，安裝非常簡單，用pip只需要一句即可：

pip install dlib

上面需要用到的scikit-image同樣只是需要這麼一句：

pip install scikit-image

注：如果用pip install dlib安裝失敗的話，那安裝起來就比較麻煩了。錯誤提示很詳細，按照錯誤提示一步步走就行了。

人臉識別

之所以用Dlib來實現人臉識別，是因爲它已經替我們做好了絕大部分的工作，我們只需要去調用就行了。Dlib裏面有人臉檢測器，有訓練好的人臉關鍵點檢測器，也有訓練好的人臉識別模型。今天我們主要目的是實現，而不是深究原理。感興趣的同學可以到官網查看源碼以及實現的參考文獻。今天的例子既然代碼不超過40行，其實是沒啥難度的。有難度的東西都在源碼和論文裏。

首先先通過文件樹看一下今天需要用到的東西：

準備了六個候選人的圖片放在candidate-faces文件夾中，然後需要識別的人臉圖片test.jpg。我們的工作就是要檢測到test.jpg中的人臉，然後判斷她到底是候選人中的誰。另外的girl-face-rec.py是我們的python腳本。shape_predictor_68_face_landmarks.dat是已經訓練好的人臉關鍵點檢測器。dlib_face_recognition_resnet_model_v1.dat是訓練好的ResNet人臉識別模型。ResNet是何凱明在微軟的時候提出的深度殘差網絡，獲得了 ImageNet 2015 冠軍，通過讓網絡對殘差進行學習，在深度和精度上做到了比
CNN 更加強大。

1. 前期準備

shape_predictor_68_face_landmarks.dat和dlib_face_recognition_resnet_model_v1.dat都可以在這裏找到。不能點擊超鏈接的可以直接輸入以下網址：http://dlib.net/files/。

然後準備幾個人的人臉圖片作爲候選人臉，最好是正臉。放到candidate-faces文件夾中。

本文這裏準備的是六張圖片，如下：

她們分別是

然後準備四張需要識別的人臉圖像，其實一張就夠了，這裏只是要看看不同的情況：

可以看到前兩張和候選文件中的本人看起來還是差別不小的，第三張是候選人中的原圖，第四張圖片微微側臉，而且右側有陰影。

2.識別流程

數據準備完畢，接下來就是代碼了。識別的大致流程是這樣的：

先對候選人進行人臉檢測、關鍵點提取、描述子生成後，把候選人描述子保存起來。
然後對測試人臉進行人臉檢測、關鍵點提取、描述子生成。
最後求測試圖像人臉描述子和候選人臉描述子之間的歐氏距離，距離最小者判定爲同一個人。

3.代碼

代碼不做過多解釋，因爲已經註釋的非常完善了。以下是girl-face-rec.py


# -*- coding: UTF-8 -*-

import sys,os,dlib,glob,numpy
from skimage import io

if len(sys.argv) != 5:
    print "請檢查參數是否正確"
    exit()


# 1.人臉關鍵點檢測器

predictor_path = sys.argv[1]

# 2.人臉識別模型

face_rec_model_path = sys.argv[2]

# 3.候選人臉文件夾

faces_folder_path = sys.argv[3]

# 4.需識別的人臉

img_path = sys.argv[4]


# 1.加載正臉檢測器

detector = dlib.get_frontal_face_detector()

# 2.加載人臉關鍵點檢測器

sp = dlib.shape_predictor(predictor_path)

# 3. 加載人臉識別模型

facerec = dlib.face_recognition_model_v1(face_rec_model_path)


# win = dlib.image_window()



# 候選人臉描述子list

descriptors = []


# 對文件夾下的每一個人臉進行:


# 1.人臉檢測


# 2.關鍵點檢測


# 3.描述子提取

for f in glob.glob(os.path.join(faces_folder_path, "*.jpg")):
    print("Processing file: {}".format(f))
    img = io.imread(f)
    #win.clear_overlay()
    #win.set_image(img)

    # 1.人臉檢測
    dets = detector(img, 1)
    print("Number of faces detected: {}".format(len(dets)))

    for k, d in enumerate(dets):  
        # 2.關鍵點檢測
        shape = sp(img, d)
        # 畫出人臉區域和和關鍵點
        # win.clear_overlay()
        # win.add_overlay(d)
        # win.add_overlay(shape)

        # 3.描述子提取，128D向量
        face_descriptor = facerec.compute_face_descriptor(img, shape)

        # 轉換爲numpy array
        v = numpy.array(face_descriptor)  
        descriptors.append(v)


# 對需識別人臉進行同樣處理


# 提取描述子，不再註釋

img = io.imread(img_path)
dets = detector(img, 1)

dist = []
for k, d in enumerate(dets):
    shape = sp(img, d)
    face_descriptor = facerec.compute_face_descriptor(img, shape)
    d_test = numpy.array(face_descriptor) 

    # 計算歐式距離
    for i in descriptors:
        dist_ = numpy.linalg.norm(i-d_test)
        dist.append(dist_)


# 候選人名單

candidate = ['Unknown1','Unknown2','Shishi','Unknown4','Bingbing','Feifei']


# 候選人和距離組成一個dict

c_d = dict(zip(candidate,dist))

cd_sorted = sorted(c_d.iteritems(), key=lambda d:d[1])
print "\n The person is: ",cd_sorted[0][0]  
dlib.hit_enter_to_continue()

4.運行結果

我們在.py所在的文件夾下打開命令行，運行如下命令

python girl-face-rec.py 1.dat 2.dat ./candidate-faces test1.jpg

由於shape_predictor_68_face_landmarks.dat和dlib_face_recognition_resnet_model_v1.dat名字實在太長，所以我把它們重命名爲1.dat和2.dat。

運行結果如下：

The person is Bingbing。

記憶力不好的同學可以翻上去看看test1.jpg是誰的圖片。有興趣的話可以把四張測試圖片都運行下試試。

這裏需要說明的是，前三張圖輸出結果都是非常理想的。但是第四張測試圖片的輸出結果是候選人4。對比一下兩張圖片可以很容易發現混淆的原因。

機器畢竟不是人，機器的智能還需要人來提升。

有興趣的同學可以繼續深入研究如何提升識別的準確率。比如每個人的候選圖片用多張，然後對比和每個人距離的平均值之類的。全憑自己了。

知識星球

除了平時發文章之外，也會發一些平時學習過程中其他的參考資料和代碼，歡迎加入。

冰不語博客專家

發佈了83 篇原創文章 · 獲贊 354 · 訪問量 79萬+

他的留言板關注

40行代碼的人臉識別實踐

40行代碼的人臉識別實踐

前言

一點區分

所用工具

Dlib

人臉識別

1. 前期準備

2.識別流程

3.代碼

4.運行結果

linux安裝cuda和cudnn

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

Mellanox網卡開啓SR-IOV

我拍了拍Redis，被移出了羣聊···

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

我宣佈，這是我找到的史上AI最全論文體系！

OpenCV DNN 模塊-風格遷移

OpenCV玩九宮格數獨（二）：knn數字識別

OpenCV檢測篇（二）——笑臉檢測

個人博客開通！——Django從入門到...WordPress

Python優雅地可視化數據

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結