StartDT AI Lab | 視覺智能引擎——從Face ID說起,淺析顧客數字化

“顧客就是上帝”,這句西諺揭示了顧客佔據着商業活動中心地位這一客觀規律。爲了能更好地服務顧客,優化商家自身的服務與產品,對顧客的分析與需求調研一直是商業經營分析中的重中之重。

在商業互聯網化、社會數字化的今天,這一規律越發明顯。從Web1.0時×××始,Cookie就被髮明出來,用以對“顧客”進行數字化描述和建檔並歸一化其互聯網下的數字行爲。

其後的Web2.0時代,隨着移動互聯網的發展,個人生活中的屏—人機交互端口變多了,原先用Cookie對 “顧客” 進行數字化的方式已無法完成對個人全渠道全平臺跨屏的行爲歸一化,爲了解決這一問題,設備ID、SuperID應運而生。

當前, Web3.0正如火如荼地發展中,渠道、平臺、終端、屏幕隨着IOT的發展,通過雲端賦能,下沉霧化, 對“顧客”進行數字化描述的方式又迎來了更復雜更嚴峻的挑戰。有鑑於此,奇點雲與衆多有志於此的友商,在多年前就開始了對於新形態“顧客ID”的預研。目前基本達成的共識有兩點:

IOT時代來臨,原來的線下物理社會逐步數字化上線,對於這一開放的數字化環境,已經難以通過唯一有限的媒介數字設備對顧客及行爲數字化。這就需要從自然人身上直接數字化並抽取。
這一新形態數字ID需要能夠較爲高效和準確地拉通原先Web1.0和Web2.0時代的既有數字化信息。
在經歷了一段時間摸索後,以人臉生物特徵爲基礎的Face ID方案逐漸顯露出優勢,而 Face ID也成爲了當前奇點雲商業智能化方案中對於顧客數字化描述的主要技術方案。基於此,StartDT AI Lab在人臉數字化方向上做了充分且深入的技術沉澱。下面就爲大家展示幾點:

人臉數字化的核心自然是人臉識別,其包含了人臉生物特徵的數字化和準確比對。作爲視覺智能引擎中不可或缺的一部分,StartDT AI Lab的人臉識別技術可以解決複雜場景下的人臉識別問題。

比如動態視頻監控場景下的人臉識別,相較於約束場景下的人臉驗證所需的人臉識別技術,其一大挑戰是對無約束人臉的識別,難度在於進行人臉識別的人臉圖一般會存在模糊、遮擋、低分辨率、面部光照及表情變化巨大等,這些因素都會在一定程度上對人臉識別造成影響,甚至大幅降低人臉識別的準確率。而StartDT AI Lab對這種場景下的人臉識別準確率進行專項課題攻堅,主要研發採用了下面一些技術手段:

01數據增強

當訓練數據面臨樣本量過少、質量分佈不均衡或者訓練集與實際場景分佈差異較大時,模型的泛化能力會嚴重下降,此時數據增強就很有意義;StartDT AI Lab通過GAN網絡同時結合傳統圖像處理技術,進行樣本合成增強。

02圖像處理

在無約束場景下,一般獲取的圖像質量較差,例如對人臉而言,一般分辨率較差、 模糊、遮擋、低光等,StartDT AI Lab通過結合傳統方法和深度學習方法,對人臉圖像進行去噪、去模糊、超分辨等處理,從而獲得更高質量的人臉圖片,提升實際場景模型準確性。

03大規模分佈式並行訓練

採用多機多卡的訓練方式,StartDT AI Lab目前支持上百萬個ID,上億張照片規模的訓練數據集。

正所謂有矛就有盾,有攻就有防。自從有了數字ID,就有了對應的***技術來破解盜用數字ID,這一問題到了Face ID時代依然存在,並且因爲Face ID所在的是開放性數字場景,***手段更是豐富簡便了起來。

比如僅僅使用一個手機上的照片或者使用換臉APP就盜用了別人的人臉從而被認證,這樣就非常容易被犯罪分子利用,人臉識別的應用範圍就大打折扣了。因此,我們需要在人臉識別進行前增加活體檢測加以應對。目前,人臉識別的主要***方法包括照片與視頻回放***以及立體面具***。

我們在產品中針對不同的應用場景開發了多種活體檢測方法,針對無人零售場景,需要配合交互驗證的方式對用戶不友好,同時需要控制成本,因此我們開發了基於單目RGB的靜默活體檢測方法。主要通過深度學習方式提取特徵以及基於多特徵融合的方法達到了目前場景下99.98%拒絕率,99.8%的通過率。目前算法已用在我們的多種場景下,時刻爲我們的人臉識別系統保駕護航。

StartDT AI Lab | 視覺智能引擎——從Face ID說起,淺析顧客數字化

StartDT AI Lab | 視覺智能引擎——從Face ID說起,淺析顧客數字化

StartDT AI Lab | 視覺智能引擎——從Face ID說起,淺析顧客數字化

(已集成在產品上的活體檢測演示)

在完成Face ID的提取之後,作爲數字化需求的自然延展,視頻智能引擎對人臉的相關信息也同步進行了數字化,例如年齡性別表情等。

StartDT AI Lab | 視覺智能引擎——從Face ID說起,淺析顧客數字化
目前,人臉年齡預測方面主要的難點在於如何協調年齡的連續性、年齡間的次序性、年齡分段的模糊性等,還有來自於實際場景中妝容、光照、角度等等的影響。

在人臉性別預測方面,主要問題在於intra-class variability,所以加大光照,角度等intra-class方面的增強數據有助於提升模型性能。

在人臉表情識別方面,碰到的難點主要有3方面:

各模式(光照,姿態等)下表情數據集不足;
由於年齡、性別、種族、表情強度等因素不同造成high inter-subject variations;
由於光照、姿態、遮擋等因素造成的large intra-class variability。
目前StartDT AI Lab選擇的年齡性別表情預測與識別算法在以上問題的解決方面有了很大的突破,再通過大數據樣本的訓練,取得了相較於目前市面上主流人臉年齡性別表情API更高的性能指標。

通過以上的技術展示,相信讀者對奇點雲視覺智能引擎中的人臉相關技術能力有了一定了解,也對Face ID爲主的Web3.0時代的“顧客”數字化描述這一主要方式有了一定認識。從目前奇點雲在Web3.0的實踐來看,Face ID在頭部20%高淨值VIP客戶的服務中能有充分的數字化保障,這也直接提高商家在商業模式中80%預期收益的落袋能力。然而對於剩下20%的預期收益,由於其分散在80%長尾客羣的稀疏商業行爲中,如何以低成本的方式提高這部分預期收益的落袋向來是商業場景中的難點。有鑑於此,奇點雲從技術的角度解構了這部分商業場景,並通過技術的一次次突破,不斷地提升着預期收益的上限。而這背後的技術細節和故事正是本欄目下一期分享的主題,敬請期待!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章