關於CV的一些思考

--------------------------------------------------------------------人臉識別----------------------------------------------------------------

看到一段關於人臉識別的說明:

人臉識別是基於人的臉部特徵,首先對輸入的圖像判斷存不存在人臉,如果存在人臉,給出人臉的位置和大小信息,更進一步地給出面部特徵位置信息。面部特徵位置信息主要包括眼睛的位置、鼻子的位置、嘴的位置等。最後提取每個人臉的特徵,來判斷這個人是否是數據庫中已經存在的人,或者比對兩個人是否是同一個人。

本算法包含三個步驟:人臉檢測、特徵點定位、人臉特徵提取。人臉檢測算法的採用最新的深度人臉檢測算法,在漏檢率和誤檢率方面都優於傳統的人臉檢測算法。人臉特徵提取算法是我們在已有的深度學習模型中加入了殘差結構且使用了多個損失函數以確保同一個人學到的特徵儘可能相似,不同的人學到的特徵儘可能不相似,在實際場景中能達到理想的效果。

 

在一般的人臉識別步驟中,檢測和抽特徵耗時最久(上百毫秒),其次就是關鍵點定位(數十毫秒),剩餘的矯正,特徵比對等都在毫秒級別。因而快速有效的關鍵點定位技術對於人臉識別的性能提升幫助很大。

 

其實有關深度學習的換臉相關的研究已經很普及了,有基於 GAN 的也有基於 Glow 的,但本質上都是生成模型,只是換了一種實現方式,而這個DeepFake呢,使用的是機器學習中的 自編碼器 ,擁有與神經網絡類似的結構,魯棒性較好,我們可以通過學習它來對生成網絡有一個大概的瞭解,這樣之後碰到相似的網絡或者構造就好上手了。
---------------------------------------------------------------------------AR(增強現實)-------------------------------------------------------------

上次去上海市青少年人工智能大賽的開賽儀式上,遇到一家企業,主打產品是基於AR,大致瞭解之後,那家公司的主要業務大致是:輔助一些企業進行培訓;與軍方合作,通過建模的方式預測,飛機是否裝載了炸藥等危險品。對AR的瞭解一直不多,還停留在3,4年前,覺得AR就是做一些炫酷的視覺呈現的技術,但是看到一個比較可靠的報道稱:預計到2023年,移動設備、智能眼鏡等AR支持產品的用戶基數將超過25億。該行業的收入將達到750億美元。很好奇該技術的應用方向以及發展軌跡,因爲寫下幾個我認爲的AR發展方向:

(1)文件,AR場景共享;

(2)展示,購物、看房,導航等;

(3)培訓,AR以直觀的方式(大型以及微型不可拆解情況均適用),輔助員工培訓;

(4)與人工智能相結合,線上線下的便捷

(5)遠程協助,手術等;

專家預測,到2025年,如下表所示,AR/VR行業的規模將超過250億美元,並將繼續穩步增長。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章