深度學習筆記（45）人臉驗證與二分類

原創

2019-09-16 02:04

深度學習筆記（45）人臉驗證與二分類

1. 二分類問題

深度學習筆記（44） Triplet 損失的Triplet loss是一個學習人臉識別卷積網絡參數的好方法
還有其他學習參數的方法
可以嘗試將人臉識別當成一個二分類問題

另一個訓練神經網絡的方法是選取一對神經網絡，選取Siamese網絡
使其同時計算這些嵌入，比如說128維的嵌入（編號1），或者更高維
然後將其輸入到邏輯迴歸單元，然後進行預測
如果是相同的人，那麼輸出是1，若是不同的人，輸出是0
這就把人臉識別問題轉換爲一個二分類問題，訓練這種系統時可以替換Triplet loss的方法

2. 邏輯迴歸單元的處理

最後的邏輯迴歸單元的處理
比如說sigmoid函數應用到某些特徵上，相比起直接放入這些編碼（f(x⁽ⁱ⁾),f(x^(j))）
可以利用編碼之間的不同

f(x⁽ⁱ⁾)_k 代表圖片x^((i))的編碼，下標 k 代表選擇這個向量中的第 k 個元素
|f(x⁽ⁱ⁾)_k - f(x^(j))_k |對這兩個編碼取元素差的絕對值
可能想把這128個元素當作特徵，然後把他們放入邏輯迴歸中
最後的邏輯迴歸可以增加參數 w_i 和 b ，就像普通的邏輯迴歸一樣
將在這128個單元上訓練合適的權重，用來預測兩張圖片是否是一個人
這是一個很合理的方法來學習預測0或者1，即是否是同一個人

還有其他不同的形式來計算綠色標記的這部分公式（|f(x⁽ⁱ⁾)_k - f(x^(j))_k|）
比如說，公式可以是

這個公式也被叫做 χ²公式，是一個希臘字母 χ，也被稱爲 χ平方相似度

Yaniv Taigman, Ming Yang, Marc’Aurelio Ranzato, Lior Wolf (2014). DeepFace:Closing the gap to human-level performance in face verification

這些公式及其變形在這篇DeepFace論文中有討論，深度學習筆記（44） Triplet 損失也引用過

但是在這個學習公式中：

輸入是一對圖片，這是訓練輸入x（編號1、2）
輸出y是0或者1，取決於輸入是相似圖片還是非相似圖片
與之前類似，正在訓練一個Siamese網絡
意味着上面這個神經網絡擁有的參數和下面神經網絡的相同（編號3和4所示的網絡）
兩組參數是綁定的，這樣的系統效果很好

3. 計算技巧

之前提到一個計算技巧可以顯著提高部署效果

如果這是一張新圖片（編號1），當員工走進門時，希望門可以自動爲他們打開
這個（編號2）是在數據庫中的圖片，不需要每次都計算這些特徵（編號6），不需要每次都計算這個嵌入
可以提前計算好，那麼當一個新員工走近時，可以使用上方的卷積網絡來計算這些編碼（編號5）
然後使用它，和預先計算好的編碼進行比較，然後輸出預測值

因爲不需要存儲原始圖像，如果有一個很大的成員數據庫，不需要爲每個成員每次都計算這些編碼
這個預先計算的思想，可以節省大量的計算，這個預訓練的工作可以用在Siamese網路結構中
將人臉識別當作一個二分類問題，也可以用在學習和使用Triplet loss函數上

總結一下，把人臉驗證當作一個監督學習，創建一個只有成對圖片的訓練集
不是三個一組，而是成對的圖片
目標標籤是1表示一對圖片是一個人，目標標籤是0表示圖片中是不同的人
利用不同的成對圖片，使用反向傳播算法去訓練神經網絡，訓練Siamese神經網絡

參考：

《神經網絡和深度學習》視頻課程

深度學習筆記（45）人臉驗證與二分類

深度學習筆記（45）人臉驗證與二分類

1. 二分類問題

2. 邏輯迴歸單元的處理

3. 計算技巧

Python實現大麥網搶票的四大關鍵技術點解析

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

【2024-05-21】以茶會友

Python依賴文件requirements.txt的生成和安裝

樹莓派Raspberry Pi OS開機自啓動腳本

標準霍夫變換

Git筆記（29）搜索

Git筆記（32）高級合併

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

深度學習筆記（45） 人臉驗證與二分類

深度學習筆記（45） 人臉驗證與二分類

1. 二分類問題

2. 邏輯迴歸單元的處理

3. 計算技巧

深度學習筆記（45）人臉驗證與二分類

深度學習筆記（45）人臉驗證與二分類