重磅乾貨 | AI場景的價值體現——視覺 AI 技術如何落地? 原

隨着AI時代的移動技術革新大會開幕鄰近，活動現場的知識分享一直備受業界關注，本期主辦方採訪到了【基於AI的開發實踐專場】演講嘉賓楊帆先生(商湯科技聯合創始人、副總裁，EGO北京分會會員)，就AI場景的價值體現與落地進行深度剖析。

以下內容是對楊帆先生的部分採訪整理。

AI 更大的價值在於跟不同的行業結合

楊帆在計算機視覺技術領域沉浸多年，在微軟任職期間，他主要從事計算機視覺、計算機圖形學等領域的新技術孵化工作，包括人臉識別、圖像物體識別、人像三維重建等；楊帆認爲，AI技術並非新事物，但卻在過去的兩三年集中爆發，其關鍵原因就在於今天對語音、圖像、視頻，有了更加信息化的處理技術，在各個環節上具備了更強的技術儲備。從技術到落地，AI 技術所實現的這一切，都離不開場景的支持。

AI技術繼承了多種基礎技術，在面向工業、金融、醫療、家居、自動駕駛、安防、物流、農業等不同應用場景的解決方案，比如AI和醫療的融合應該會體現在智能設備和識別診斷主要兩個方面；AI和金融的整合使金融交易和管理更加安全，實現精準營銷、大數據徵信和普惠金融；AI和安防的融合實現智能監控、安保機器人等應用場景；AI、大數據等這些東西純談概念是沒有任何意義的，最終都要回歸場景，可複用的基礎技術和平臺工具固然重要，但只有落在應用場景裏，我們才知道其明確的價值在哪裏。

Q：業界曾出現一種批評的聲音，稱現在很多公司和開發者其實對於深度學習的運作原理並不清楚，只知道應用，卻不知其所以然。

楊帆表示：“學術界有兩套觀念，一套觀念說知其然不知其所以然是離經叛道、是不對的。對於這個觀念，楊帆表示認可，其實現在已經有很多團隊也投入力量在進行更加前沿、更加基礎性的科研，“這樣的基礎科研能夠指導我們將來在正確的方向上走得更遠。”但楊帆認爲，基礎研究與應用科研，二者不可偏廢，完整的科學體系和持續的方向性指引非常重要，但是實證科學也非常重要，企業最終還是要以技術落地的結果說話。”

Q：人臉識別大行其道，不免讓人對這項技術及其背後的公司產生了許多好奇。

對於這兩年非常火的“刷臉”，開始有各種基於人臉驗證能力的實用化場景。在互聯網信息安全方面，對於賬戶的盜用能夠更好的分析和調查，包括線上的手機端、桌面端、H5，包括定製的攝像頭。操作邏輯非常簡單，最開始做刷臉的註冊，現在刷臉的支付，手機逐漸去進行刷臉的解鎖。在對於個人的認證上，也有非常多的價值。人臉識別的技術，可以判斷操作手機的是不是真實的人。

有一個活體檢測的技術服務，也包括在線下一體機的形態。對身份證的關鍵信息進行掃描，包括對身份證內部照片的讀取和當前採集人之間進行判斷。基於人像的身份認證也是一個非常有價值的工作，它是一個特殊的跨行業的解決方案。這個解決方案現在已經從線上到線下開始極大範圍地蔓延。

對中國來說，個人公民身份信息的實名制是一個非常重要的訴求，這個訴求能夠有效地幫我們在一定程度上解決互聯網的安全問題、解決線下的公共安全問題。所有線上的互聯網行業應用，到各種線下行業，包括機場、超市、酒店，都會有越來越多的對於個人身份信息覈驗的強烈需求。

Q：大家都關注識別正確率，在實際場景中正確率是否爲最關鍵因素?

近幾年，很多公司在人臉識別技術上投入了大量的研發並取得了亮眼的成績，其中識別率一直是各家宣傳的重點，今年我們能在各類報道中頻繁看到各種99%、99.4%、99.8%等。雖然企業這麼宣稱，但實際背後蘊含的差異是非常大的，它會有非常多影響因素，所以準確率跟行業背景以及前置假設會是一個強相關的關係。而不同的場景下取得的識別準確率很難做類比。

當識別率達到99%以後，人臉識別技術面臨的難點主要在於，如何在不同行業場景中深化這項技術。雖然看上去99%的識別率已經很高了，但不同行業場景對於識別率的要求不同，99%可能只是該技術得以使用的入門條件；而安防場景下，照片模糊、有遮擋、角度不佳都給人臉識別帶來了更現實的挑戰。

“看似同質化很強、很簡單的人臉識別，細分的技術場景其實非常複雜，所以脫離場景去談技術是沒有太大意義的，今天能看得到的，包括以安防、手機這樣的一些重點行業爲代表，對於真正的人臉識別技術的全面深化存在着非常多的挑戰，值得我們去攻克。”

Q：那麼，怎樣判斷一個行業是否具有做 AI 場景的價值?在做AI平臺化的進程中，遇到過哪些挑戰和問題?

看需求

首先，需求得是真實的。楊帆舉了個具體的例子：有一個家電廠商想通過人臉識別功能，實現“我進去之後這個房間自動調節成 16 度，我母親進這個房間自動調節成 26 度”。我問他：“如果你和你母親一塊進去怎麼辦，如果你揹着身進去怎麼辦?”他說這個需求，其實最好的解決辦法就是搖控器。

其次，需求得是剛性的。需要考慮用戶願不願意買單，願意花多少錢買單？往後更深層次的邏輯鏈，需要對場景的更深的瞭解。

規模化

今天完成一套解決方案成本很高。人臉識別這樣的技術，在不同的場景中技術差異很大。我今天做金融，1：1的認證，錯誤率做到百萬分之一，千萬分之一，準確性非常高，在金融場景中非常好用。如果放在安防的場景下，安防要求百萬人的黑名單庫。而且黑名單庫還要有誤報，每一次誤報有一個出警。

同樣是人臉識別，不同場景下關注的技術指標和任務是完全不同的。所以同樣一個技術概念，在不同場景下的差異性非常明顯。再者技術什麼時候成熟需要在特定的需求場景下，離成熟多遠要有一個預判力。

數據閉環

做AI技術，數據閉環是非常重要的環節。爲什麼？我們做視頻的會發現，當你技術不成熟的時候你的業務不能用，業務沒有落地的時候就沒有數據。做不好，就形成死循環。這樣的死循環如何去打破？原動力的突破來自於技術，當你的技術有小的突破，把其他場景遷移過來。

技術的突破可以帶來業務的落地，業務的落地帶來數據的累積，數據的累計可以帶來技術的進步。這樣的數據閉環，幫助整體業務拓展並能帶來非常大的價值。今天，數據面臨隱私性和安全性的質問和考驗。包括區塊鏈在內的很多技術，還有一些非技術的方式方法，可以帶來更深層次的探索。

商業化

光做出好產品是不夠的，還要在市場上真的有價值，並且能持續保有競爭力。任何新技術都會隨着時間的推移而擴散，一般所擁有的時間窗口最多也就是一年多的時間。

在這一段時間內，如何看待當前所面臨的場景？在這個場景中技術到底佔據多大的地位？是非關鍵性的應用還是關鍵性的應用？技術上的突破和分配，是否產生根本性的問題？在技術的壁壘期，我們能否利用這一段時間構建起技術以外的壁壘？

只有壁壘構建出來，利用時間窗口期把技術優勢轉化成其他的競爭性壁壘，這樣的行業才值得去做。

技術創新驅動

早在一兩年前，我們就蒐集到大量用假照片和視頻去攻擊刷臉識別的行爲，各種各樣的案例。當我們擁有大量來自真實業務的攻擊數據時，就能夠針對圖像視頻各種各樣的攻擊方式進行非常好的防範，這來自於大量線上攻擊的業務數據的累積，以及對這些數據的二次挖掘和利用。這個給我們什麼樣的啓示？

做刷臉一開始是做人臉識別，但後來我們發現人臉識別不是最重要的，最重要的活體識別，分清到底是一個真人還是仿冒攻擊。只有深入場景，才能發現你所面臨的技術挑戰跟你之前想象的不同。當行業落地的時候所面臨的技術挑戰，實際上需要重新定義、分解和解決。

從這五個閉環能夠幫助我們去判斷，把一個AI技術應用在某一個場景是否真的有價值，是否真的有意義，是否帶來更大的用戶價值。從這幾個角度大家去進行分析判斷，會有一個相對比較好的結論。

想把落地場景做好，複合型技術人才尤爲重要

如楊帆所說，真正去看行業落地的時候，往往都是不同的技術疊加和組合的應用，這裏麪人臉識別和動作識別是最關鍵的技術，但實際上想把落地場景做好，一定需要多種技術組合。

楊帆表示，將創新技術轉變爲實際產品是一條滿是荊棘的道路，行之不易，而其中最大的難點，一是如何選對方向和時機，二是如何找到合適的人才。

行業落地需要各種綜合性的關鍵技術的整合。行業的需求往往是一些相對模糊的，而且從技術上來看是非常不明確的東西，這時候就需要有人有足夠的能力去一一拆解。在楊帆看來，找到或培養一些既有技術背景、又對行業有足夠深的理解的人才，是企業實現AI技術落地最關鍵的一點。

他說到，“人才問題、團隊組織問題、發展問題，特別是做2B行業，標準化與非標準之間的平衡性掌握，任何一個技術性產品落地會面臨的共有問題，做AI技術落地，這些問題一個都不會少，而只會更嚴重。AI人才是個更大的坑，AI的技術性更深重，從過往來看，它跟行業的結合更弱，所以你想要真正去打磨出一個符合真正行業需求的產品的時候，需要把對行業的理解和對技術的理解融合在一起，這是當前最具挑戰任務之一，因爲過去可能這個世界上基本不存在這樣的人，對行業有理解的人很少。”

視覺AI技術的落地與AI人才的培養是個複雜而龐大的話題，需要對技術和人才都有比較深刻的理解和認知，也是目前業內廣泛關注的話題之一。2018年1月5日，在AI時代的移動技術創新大會上，更多重量級大咖，將對AI、移動應用技術、前端開發等內容進行深度的分享，感興趣的小夥伴可加官V：柚子科技APICloud，免費領取門票。

重磅乾貨 | AI場景的價值體現——視覺 AI 技術如何落地? 原

APP定製市場陷阱頻出，怎樣避開？

如何在APICloud平臺使用騰訊X5引擎

APICloud開發者進階之路 | 超級實用技巧原

乾貨教程 | 關於支付寶模塊apiPayPlus的使用轉

不止於小程序 APICloud推出react native純翻譯模式的UI引擎原

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結