AI換臉背後的技術攻防戰

經過一個週末的集中爆發,換臉軟件ZAO的熱度終於有所降溫。它應用的技術並不新鮮,卻讓人臉合成視頻第一次離普通用戶這麼近。

廣被詬病的用戶協議、合成視頻存在的安全問題使得ZAO深陷輿論漩渦——從爆紅到質疑纏身,只用了不到24小時。

但是,對ZAO的擔憂與抵制並不能解決普通人隱私、安全存在風險的問題。從人臉合成技術誕生的那一天開始,人們就沒有停止過對技術被人利用去作惡的憂慮。

人臉合成只是當下備受追捧的人工智能領域的一個分支,技術在爲人類帶來諸多新奇體驗、便利的同時,也給個體帶來對於自身諸多權益被侵犯的擔憂。

當人類製造的技術越來越強大,甚至無所不能,人類本身的領地和獨特性如何維護便成爲值得思考的問題。如今,人工智能的發展漸成加速之勢,這個情況甚至超出了不少人最樂觀的估計,潘多拉的盒子已被打開。

因此,對ZAO的擔憂,折射出的是一個潛藏於每個人內心的最基礎的疑問:如果人工智能越來越無所不能,人類該如何自處?在新一輪的產業變革中,人類的隱私和其他權益究竟如何保護?

如何讓技術被正確的使用,這是一個始終沒有標準答案的問題,卻又是解答以上問題的關鍵。

「被引爆的隱私擔憂」

曾經刷屏的應用軟件不止ZAO一款

在朋友圈刷屏,ZAO有許多前輩:臉萌、足記、天天P圖……與ZAO一樣,這些曾經刷屏的應用大多與圖像相關,許多也需要用戶上傳個人照片,但是從未引起如此規模的爭議和質疑。

能夠合成視頻是ZAO引爆公衆討論的關鍵:在此之前,圖像APP的玩法都是基於靜態的照片,ZAO則是第一次將視頻換臉帶到了每一個普通用戶身邊。

在一位從事計算機視覺研究的業界人士看來,ZAO應用的技術難度並不大:“如果說計算機視覺技術零分是最容易,十分是最難的話,原來你給我一張人臉圖像,我能生成另一張姿勢的圖像,可能那個難度是三分、四分,而合成視頻就是要生成一系列圖片,不再只是一張,難度也就五分、六分,實際上並沒有進階的突破。”

事實上,在計算機視覺領域,生成一張圖片的技術早已有之:把A的臉摳出來貼在B的臉上,Photoshop也可以完成。只是在深度學習的幫助下,程序可以快速、大量的P圖。而視頻人臉合成,實際上就是先生成一個視頻序列的所有幀,之後加入檢測或視頻序列技術,進而生成人臉合成視頻。

合成視頻,這觸達了許多人的心理底線:當視頻也可以被僞造,還有什麼可以甄別真實?

無論是今年6月被篡改的馬克•扎克伯格的視頻,還是被嫁接了美國女星面孔的色情視頻,都足夠引發大衆對於視頻真實、安全性的擔憂。比如犯罪分子僞裝子女聲音向父母勒索的案例已經發生,在人臉合成的幫助下,視頻驗真也已經無法確定事實的真相,正如有些網友提醒的:“有手機號,有面部圖像,通過技術合成,犯罪分子可以替你和家人通話。”

大部分人並不會遇到上述極端情況,但人臉識別的廣泛應用使得人臉合成有了更多可以想象的發揮空間。當人臉合成被裝進手機應用中,成爲每一個人都觸手可及的技術時,類似的擔憂無疑會被放大,在安防、支付、考勤、刑偵等領域,愈加真實、無破綻的人臉合成技術,的確會帶來不少安全隱患。

好在,圍繞人臉識別的攻防戰早已拉開帷幕,多次交手後,技術升級後的人臉識別並不那麼容易被攻破。

「技術攻防戰」

人臉合成只是計算機視覺研究的一個細分方向,作爲一門致力於讓機器看懂物體的科學,計算機視覺研究誕生已久。1966年,人工智能學家Minsky給學生布置了一個作業:編寫一個程序讓計算機告訴我們它通過攝像頭看到了什麼,這被認爲是計算機視覺最早的任務描述。而計算機視覺之所以在今天能誕生如此多新奇有趣的應用,與深度學習的發展密不可分。

2006年,深度學習泰斗Geofrey Hinton在《Science》發表了論文《A fast learning algorithm for deep belief nets》,推動了持續至今的人工智能浪潮。

深度學習在國內業界的普及則與百度密切相關。

2013年1月,百度正式對外宣佈成立深度學習研究院(IDL),李彥宏親自出任院長,中國“千人計劃”國家特聘專家、現地平線創始人餘凱任副院長。2014年,IDL的Deep Speech項目將嘈雜環境下的語音識別準確率提高至81%——彼時同樣環境下Bing、Google以及Wit.AI等的最高識別率也只有65%。這是深度學習在國內工業界應用的典範,引發了人們對深度學習的重視。

得益於此,人工智能相關應用在過去幾年迅猛增長。其中,人臉識別是應用範圍比較廣的技術之一。如今,在金融、安防、考勤等領域,人臉識別已被大量應用。比如,當用戶向互聯網金融公司借貸時,平臺首先需要做的是“驗證你是你”,由於與錢直接相關,攔截僞造的人臉攻擊就變得至爲重要。

ZAO應用的人臉合成技術引發人們憂慮的一個場景便是:合成人臉是否會引發安全問題?這個問題已經引發研究者的重視,爲了提高人臉識別的安全性,他們做了諸多嘗試。

2018年7月,曠視科技產品總監彭建宏曾在一節網絡公開課中表示:在人臉識別領域,目前比較流行的攻擊方法主要包括:圖片攻擊(使用合法用戶的紙質打印照片、彩色打印照片、手機裏保存的照片等欺騙,屬於非活體攻擊)、視頻攻擊(提前錄製的視頻回放,包含眨眼、轉頭、張嘴等動作指令欺騙,屬於活體攻擊)、立體面具攻擊(利用事先僞造的面具欺騙,屬於非活體攻擊)等幾種方法。

而研究者們最爲重視的是可以應對活體攻擊的檢測方案,包括動作活體檢測、視頻活體檢測、炫彩活體檢測、雙角度活體檢測等幾種類型。

曠視的人臉識別方案

●  動作活體檢測:要求用戶根據UI提示做點頭、搖頭等隨機動作,每次的隨機動作都是從計算機 Servers 端發出的,計算機通過人臉質量檢測、人臉關鍵點的感測和跟蹤,以及臉部的 3D 姿態等技術細節提高人臉識別的精準度。

●  視頻活體檢測:主要針對移動 H5 的場景,要求用戶根據 UI 提供的內容讀一個四位數字,計算機通過雲識別、語音同步檢測等方法判斷被檢測的人臉是否真實。

●  炫彩活體檢測:根據反射光三維成像的原理,杜絕了用 3D 軟件合成的視頻、屏幕翻拍等的攻擊。在強光環境下,炫彩活體的檢測效果不太好,因此可能需要用戶最後做出一個簡單的點頭動作,以提高活體攻擊的門檻。

●  雙角度活體檢測:要求用戶拍一張正臉的自拍照與側面自拍照,這種檢測方式相當於用戶拍攝一個1-2秒鐘的視頻,計算機通過 3D 模型重建的方式來判斷視頻中是否爲真人。

●  靜默活體檢測:不需要用戶做任何動作,自然面對攝像頭3、4秒鐘即可。由於真實人臉並不是絕對靜止的,而是存在微表情,如眼皮眼球的律動、眨眼、嘴脣及周邊面頰的伸縮等,計算機則可通過此類特徵反欺騙。

人臉識別技術已經發展得較爲成熟

各個公司運用的活體檢測方法各不相同,最常用的是摩爾紋(在數碼照相機或者掃描儀等設備上,感光元件出現的高頻干擾的條紋,是一種會使圖片出現彩色的高頻率不規則的條紋)。不過對於僞造的人臉面具,摩爾紋也無法識別。這個時候,只有通過給機器輸入大量人臉面具的圖片,讓機器找出面具特徵,再結合摩爾紋纔能有效攔截。

曠視科技的彭建宏也提到,基於雲端大量人臉數據訓練出的 FMP 深度神經網絡,能夠根據線上數據實時返回和調整,從而不斷提高識別準確率,實現有效識別翻拍及面具攻擊。

通過以上幾種檢測方案,計算機就能夠判別檢測的人臉是真實的人臉,還是僞造的人臉攻擊。

「除了人臉,

守住真實防線的武器還有哪些?」

證明你是你,臉並不是唯一的標記物。除了人臉識別之外,還有多種生物識別技術可應用於個人身份鑑定領域。

生物識別一般是通過與光學、聲學、生物傳感器和生物統計學原理等高科技手段密切結合,利用人體固有的生理特性和行爲特徵來進行個人身份的鑑定。由於具有不會丟失、不易遺忘、防僞性能好等特點,生物識別被獲得了研究者的重視,其中指紋識別、虹膜識別等識別方式已經有了較爲廣泛的應用。

●  指紋識別:將識別對象的指紋分類比對從而進行判別。目前國內早已形成了完整的指紋識別產業鏈,比如從事指紋芯片設計的上市企業匯頂科技,此外還有思立微、費恩格爾、邁瑞微等國產指紋識別芯片廠商。

●  虹膜識別:由於虹膜自胎兒發育階段形成後直至死亡終生不變,具有極強的穩定性,決定了身份識別的唯一性,因此可以基於眼睛中的虹膜識別身份。目前,虹膜識別憑藉其超高的精確性和使用的便捷性,已經廣泛應用於金融、醫療、安檢、安防、特種行業考勤與門禁、工業控制等領域。國內的代表廠商有中科虹霸、虹星科技、聚虹光電、武漢虹識、釋碼大華等。

虹膜識別技術可被用來判定人的身份

●  步態識別:旨在通過人們走路的姿態進行身份識別。由於它不需要人的行爲配合,很難僞裝,所以特別適合於遠距離的身份識別。步態識別的採集裝置簡單、經濟,甚至只需要一個監控攝像頭。當前國內步態識別領域的企業中,名氣最大的是銀河水滴。

●  聲紋識別:聲紋識別就是把聲信號轉換成電信號,再用計算機識別,包括說話人辨認(如縮小刑偵範圍)和說話人確認(如銀行交易)兩種類型。聲紋識別提取方便、成本低廉,適合遠程操作,但同時也存在易受環境噪音影響、部分場景下聲紋特徵不易提取等缺點。所以,聲紋識別目前主要還是被用於一些對於身份安全性要求並不太高的場景當中,比如音箱等智能硬件。目前國內的科大訊飛、思必馳、雲之聲等企業都推出了相應的聲紋識別技術。

我們日常使用的微信,也應用了聲紋識別技術

●  掌靜脈識別:首先通過靜脈識別儀獲取手指、手掌、手背靜脈的圖像,然後將捕獲的掌靜脈分佈圖存貯在計算機系統中供後續識別使用。掌靜脈識別簡便易用、識別快速,準確度還很高。然而,由於掌靜脈識別的產品有難以小型化、製造成本高、對採集設備有特殊要求等缺點,目前應用並不廣泛。當下國內知名的企業有富士通、通元微智能科技和智脈科技等幾家。

上面的每一種識別方式都曾以不同面目在電影中炫酷出鏡過,比如《諜中諜5》中,“步態識別”成爲阿湯哥一行人獲取情報的最大障礙。

儘管以上提到的生物識別技術各有門檻,但它們並非不可破解,在AI技術加速發展的當下,一些識別方式如同人臉識別一樣,正在遭遇更大的挑戰。

根據量子位的報道,斯坦福和普林斯頓大學等最新研究:給定任意文本,就能隨意改變一段視頻里人物說的話。並且,改動關鍵詞後人物口型還能對得奇準無比,絲毫看不出篡改的痕跡——AI也能造假聲音了。

技術的進步讓我們擁有了更多盔甲,但同樣也暴露了我們更多軟肋。

「不容忽視的AI倫理」

換臉軟件 ZAO 將人工智能時代的隱私問題暴露的更加徹底:當用戶完成面部照片上傳,製作好換臉視頻併發布到社交網絡之後,不僅可能侵犯了他人的肖像權、名譽權和著作權,而且意味着他們已經成了“透明人”,隱私權蕩然無存。

微信創始團隊成員,支付寶前資深產品經理陸樹燊就表示,照片泄露已經是公開的祕密。不管用戶使用的是蘋果手機還是安卓手機,理論上只要曾經在App上打開過相機或者選擇過相機,並使用一段時間,用戶的相冊裏面的各種照片對App運營者來說就不是祕密了。而用戶的手機號和照片同時泄露給App,更是很早就存在的事情,這個信息安全問題幾乎沒有得到過重視。

“至於大家能做什麼,實則有限。如果你的手機相冊裏存有身份證正反面的照片,記得把本地和雲端的備份都刪掉。”

可以料想的是,就像臉萌、足記、天天P圖一樣,刷屏朋友圈的ZAO遲早有一天熱度會消散,但由於其將前沿的AI技術帶到了普羅大衆面前,由此引發的隱私、安全爭議也讓人們對AI未來走向的探討更加激烈。

在技術至上派的人看來,如果人工智能技術能夠持續進步並廣泛應用,特別是如果人類可以製造出真正能推理和解決問題、有知覺甚至自我意識的強人工智能機器的話,給人類社會帶來的好處將是巨大的。從現實情況看,人工智能技術的發展確實也已經爲人類帶來實際回報。

但得到這些好處並非沒有代價,ZAO引發的爭論只是人工智能技術B面的一小部分,面對這股強大且未知的力量,圍繞人工智能倫理的探討從未停歇。

對人工智能的倫理探討主要有以下幾個議題。

一是算法歧視。算法決策其實是一種預測,用過去的數據預測未來的趨勢,算法模型和數據輸入決定着預測的結果。但在某些時候,算法並不客觀,而是暗藏歧視。比如,一些圖像識別軟件之前將黑人錯誤地標記爲“黑猩猩”或者“猿猴”。

微軟在Twitter上線的聊天機器人Tay在與網民互動過程中,曾成爲過一個集性別歧視、種族歧視等於一身的“不良少女”,這揭示了更深層的問題:因爲錯誤的輸入,形成了錯誤的輸出,錯誤的輸出作爲反饋,又進一步加深錯誤。

過去的歧視可能會在算法中得到鞏固並在未來得到加強,簡而言之:惡性循環。

二是隱私憂慮。很多人工智能系統都需要大量的數據來訓練學習算法,數據因此成爲AI時代的“新石油”,這帶來了新的隱私憂慮。

一方面,如果在深度學習過程中使用大量的敏感數據,這些數據存在後續被披露出去的風險;另一方面,考慮到各種服務之間會大量交易數據,數據成爲新的流通物,個人對其個人數據的控制和管理也會被削弱。

三是如何界定AI的人道主義待遇。當自主智能機器人越來越強大,它們在人類社會到底應該扮演什麼樣的角色,目前還無法確定。

此外,越來越多的教育類、護理類、服務類的機器人在輔助人類看護孩子、老人和病人,這些交互會對人的行爲產生什麼樣的影響,也需要得到進一步研究。

四是責任與安全的保障。埃隆·馬斯克、史蒂芬·霍金之前都提醒人們要警惕強人工智能或者超人工智能可能會威脅人類生存,但科學界和社會大衆對這個問題的討論和認識還停留在表層。

馬斯克屢次提出警告:人工智能技術未來或將導致人類走向毀滅。他曾表示,“人工智能的關鍵在於,它們並不是機器人,而是一種計算機算法。機器人只是一堆傳感器元件,而人工智能則構成了強大的網絡。如果只是算法失控,人類和人工智能便可以攜手加以控制。但一旦集中化的大型人工智能系統決意攻佔世界,我們就無力阻止了。”

爲此,馬斯克號召人們做好準備,應對人工智能帶來的“世界末日”。他提出,人類和機器可以融合爲一種“人工智能-人類”的共生生物,這樣便能有效杜絕“人工智能獨裁”局面的出現。

無獨有偶,英國理論物理學家史蒂芬·霍金生前也曾警告說,人工智能的發展可能意味着人類的滅亡。

2014年,霍金在接受英國廣播公司的採訪時說,“我們已經擁有原始形式的人工智能,而且已經證明非常有用。但我認爲人工智能的完全發展會導致人類的終結。一旦經過人類的開發,人工智能將會自行發展,以加速度重新設計自己。由於受到緩慢的生物演化的限制,人類不能與之競爭,最終將會被代替。”

在最近召開的世界人工智能大會上,馬雲和馬斯克進行了一場“雙馬”對話。相比之下,馬雲對當下人類社會發生的改變更感興趣,馬斯克則爲人類未來的命運充滿擔憂。

馬斯克說自己並不是一個天然樂觀或悲觀的人,但他依然對人與人工智能的未來持有悲觀的態度:“人工智能可能比最聰明的人還要聰明。計算機可以用超過人類幾十萬倍數字通量的方式進行對話,計算機看人一定會覺得特別無聊。”他建議,如果人類打不過人工智能的話,可以和他們組成團隊。

而馬雲的態度就很樂觀,他不覺得人工智能是一種威脅,“我不認爲人工智能是很恐怖的東西,因爲人類很聰明。人工智能很好、很有意思,我們會擁抱它。今天很多問題沒有解決方案,但是未來會有,青年人會有解決方案。”

人工智能與人類未來究竟會如何相處——是馬斯克預言的悲觀結局,還是馬雲預言的樂觀結局,在肉眼可見的時間裏,我們暫時還看不到答案。

如果將世界看做一個程序,那麼我們每一個人的選擇就是世界運行的算法,它決定了程序的未來走向。而刷屏的ZAO,也許就是那隻正在振動翅膀的蝴蝶。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章