[CVPR 2019] 專訪Wormpex AI Research副總裁 華剛博士

????點擊上方藍字星標“Robinly”,獲取更多CVPR重磅訪談

Robin.ly 是立足硅谷的視頻內容平臺,服務全球工程師和研究人員,通過與知名人工智能科學家、創業者、投資人和領導者的深度對話和現場交流活動,傳播行業動態和商業技能,打造人才全方位競爭力。

本期Robin.ly CVPR2019專題訪談特邀 Wormpex AI Research 副總裁兼首席科學家華剛博士,在美國長灘CVPR大會現場分享他對計算機視覺領域的進展和挑戰的思考,以及人工智能在零售業應用前景的展望

Wormpex AI Research是中國最大的便利連鎖店“便利蜂”的研究分支。加入Wormpex之前,華剛曾擔任微軟計算機視覺科學主任以及史蒂文斯理工學院副教授。他同時也是IEEE Fellow,IAPR Fellow和ACM傑出科學家。他的研究領域包括計算機視覺、模式識別、機器學習和機器人技術等。華剛在本次CVPR擔任大會Program Chair.

華剛博士在美國長灘CVPR2019大會接受Robin.ly專訪

下文爲Robin.ly主持人Margaret Laffan與華剛博士的訪談實錄。

    

長按二維碼或點擊“閱讀原文”

問Robin.ly獲取英文訪談實錄

    

1

  計算機視覺的研究進展

    

主持人:我知道你是一位非常有成就的計算機視覺科學家,也是此次CVPR大會的Program Chair。能不能跟我們分享一下計算機視覺研究領域最近幾年的進展?


華剛:

你過獎了,是計算機視覺這個社區給我提供了良好的職業發展機會。如果我們回顧過去幾年的研究進展,最大的收穫就是深度學習在計算機視覺領域得到了長足發展。我們正在利用深度學習和數據的力量來解決各種各樣問題,但我們也不應該忽略將物理建模和統計學習相結合、和深度學習方法相結合,這樣我們才能取得更多的研究進展。

圖片來源:微軟研究院(亞洲區)

主持人:作爲大會的Program Chair, 你們是如何選拔出優秀的學者來CVPR做學術報告的?

    

華剛:

CVPR社區高水平研究和學術聲譽在很大程度上得益於我們完善、客觀、嚴格的評審過程。我們的專業評審主席和審稿人會爲投稿者提供建設性的反饋。我們從高質量的投稿中選擇了質量最高的一些論文,並邀請作者來參加爲期五天的會議。

 

2

   深度學習的影響

主持人:你曾在微軟從事基於深度學習的視覺理解(Vision Understanding),面部識別(Facial  recognition)和視覺生成  (Vision creation)這三個方面的工作。能講一講深度學習在這些領域有哪些突破和挑戰嗎?

 

華剛:

我認爲過去這三個方面確實取得了非常大的進步。首先說一下視覺理解。我們正在努力嘗試理解視頻中的場景。這個研究領域的進展得益於計算機視覺中的很多其他技術,例如物體識別、人體識別、情感分析等等。我們需要將潛在的幾種計算機視覺技術結合在一起,全面的瞭解動作事件。所以這個領域的發展是得益於一些基礎性技術的進步。

 

面部識別結合了數據和深度學習,深度網絡等精準模型,這些模型的快速發展使商業化成爲可能。從20世紀90年代早期開始,人們就在着手打造面部識別的標準,那段時間實際上是美國政府推動了事情發展。

 

在視覺生成方面,人們使用了一系列深度學習方法,稱爲深度生成模型(Deep Generative Models)。生成模型在計算機視覺領域並不算一個新的領域,2000年左右就有很多基於傳統統計模型的這方面的工作,實際上有很多研究工作的目的就是爲視覺內容創作打造模型。深度生成模型能夠高效的擬合任何類型的數據分佈,於是迅速受到了廣大研究人員的青睞。我們正在努力讓藝術創作的過程對用戶更友好。

主持人:那麼關於人工智能的未來,你覺得我們可以從神經科學研究中學到什麼?不同的領域又是如何相互借鑑的?

    

華剛:

這個問題問得很好。雖然深度學習也是間接受到了生物學研究的啓發,但是目前的成果離實現人類大腦系統的功能還很遠。其實如果看看不同領域相互借鑑的情況,是可以找到很多證據的。甚至在30年前,人們就驗證了卷積網絡的最初始幾層學習到的就是是大腦視覺系統中最初幾層的Gabor濾波器的作用。

    

但就協同性而言,我們正在從宏觀層面分析神經科學對人工智能研究的引導作用。例如,意識是一種思維過程,只屬於人類和某些類型的動物。人們對意識如何在大腦中發揮作用有了越來越深入的瞭解。是否能打造一臺有意識的機器是一個很重要的問題。但目前我們還做不到。但是人們在這方面已經取得了一些進展,瞭解到有意識的思考過程是如何發生的,並可以基於相關結論嘗試構建具有邏輯結構的計算模型。在打造通用人工智能的過程中,我們也許能看到人工智能系統真正掌握了人類的智慧。我希望看到神經科學的研究結果能夠更多的指導我們在人工智能方面的研究,我們還有很長的路要走。

    

主持人:能給出一個具體的時間點嗎?

 

華剛:

很難說,可能要五十年以後,也可能更早。打造有意識的機器是個非常大的挑戰,不過能夠看到這兩個領域的研究人員進行更多的對話,就是一個巨大的進步。

 

3

商業化應用

主持人:基於我們已經取得的進展,你最看好哪種類型的商業化應用場景?

華剛:

這是個很好的問題。過去的30年,人們一直在討論如何打造計算機視覺領域的殺手級應用 (Killer Application)。這項技術在各個領域應用非常廣泛,比如軍事方面,計算機視覺的強大之處不言而喻。不過最讓我興奮的是看到計算機視覺正在將物理世界數字化。在互聯網社會中,一切都是數字化的。但是很多在物理世界發生的活動,比如線下的會議或者銷售過程中顧客與產品的互動,都沒有數字化。所以隨着技術的進步,我認爲計算機視覺可以在數字化物理環境的過程中發揮核心作用,這樣我們就可以做出更好的智能決策,改善我們的生活質量。這算是我的一個願景吧。

 

4

  轉移學習和主動學習

 

主持人:我們來談談自動駕駛,這是計算機視覺一個最重要的應用。Waymo的工程部主任Sacha Arnoud曾經說過:當你完成了90%的工作,還有90%的工作要做。也就是說餘下90%的工作需要花費10倍的時間。那麼除了深度學習之外,還有什麼新的方法能解決這些問題嗎?

 

華剛:

這個問題很難回答。我記得 Jitendra Malik 教授在2005年的CVPR大會上說過:在計算機視覺領域,90%的問題很容易解決。因此,研究人員確實應該着重研究其餘10%的問題。雖然當今我們高度依賴機器學習來解決許多計算機視覺問題,但對於這10%的問題,我認爲我們需要以非常系統的方式處理它們。這些問題的共同點在於它們都屬於極端情況,有時候你可能只是沒有足夠的數據來訓練你的系統。我們需要利用已有的知識來識別和理解這些極端情況。這種學習模模式叫做“轉移學習(transfer learning)”,將知識從一個任務轉移到另一個任務。

 

參考人類的學習方式,我們是從語言對話中學習,比如我們兩個人在這裏進行了愉快的交談,我們可以相互學習。但對於機器學習而言,我們還不知道如何讓它能通過語言來學習。如果我們的機器學習模型就能夠理解有效的理解對話了,可能說明我們在朝正確的方向努力,但是要做好打一場持久戰的心理準備,我們需要能夠解決其餘10%問題的正確工具。

    

主持人:除了轉移學習,能再解釋一下主動學習(Active Learning)這個概念嗎?

    

華剛:

主動學習是一個籠統的概念,實際上是指機器以積極的方式參與學習過程,並不指代任何特定的學習方法。這意味着機器知道自己在什麼方面做得還不夠好。所以它要麼主動要求人類提供更多的輸入,要麼利用龐大的知識庫中自己找出解決方案。這是主動學習的要點,它會使學習更有效率。我認爲這就是真正的學習。

    

利用當前的機器學習模式,我們通常會提供大量數據,機器會將這些數據輸入到模型中。在運行了一些測試後,你就會發現它在一些極端情況下得不出好的結果,但模型本身也意識到了自己的結果是錯誤的,甚至會提供一個比較低的置信值。因此,進行主動學習意味着我們需要構建模型,這些模型能夠意識到哪個部分的結果不理想,然後將學習重點放在這些方面,進一步改進。

 

5

  人工智能與零售業


主持人:你最近加入了零售初創公司Wormpex (便利蜂)擔任副總裁兼首席科學家,能給我們介紹一下Wormpex嗎?你們的職責和企業願景是什麼?你對自己在零售界的職業發展有什麼展望?

 

華剛:

Wormpex AI Research是中國最大的一個連鎖便利店“便利蜂”的研究分支機構。建立這個研究院是希望通過人工智能技術將整個便利店連鎖操作系統的運行過程數字化。便利店的業務比較傳統,但是利用當今的技術,我們也許能夠將從店面到倉庫再到製造的各個操作階段數字化,這樣就可以擁有端到端的數字決策系統,並使用這些智能決策反過來影響物理操作。這樣一來我們不但可以提高效率,還可以節省大量成本,從而進一步提升利潤率。這就是我們研究所的工作重點。

    

在研究所成立之初,我們就定下了三個目標。第一個目標是我們希望以業務爲中心來推動我們的技術研發決策,同時也希望所開發的技術能夠有效的改善業務運營。第二個目標是我們希望打造最先進的技術,通過比較高的標準和要求在技術領域找到自己的一席之地。第三就是我們想要探索不同的應用場景以確保技術的可持續性。這就意味着我們有一定的自由來進行一些探索性的研究,推進技術的更新迭代。

 智能便利店 (圖片來源:便利蜂)

主持人:那麼從一個消費者的角度來看,如果我兩年後走進你的便利店,會看到什麼樣的景象?

華剛:

我想對於客戶來說最好的人工智能技術就是,當你進入我們的商店時,會馬上看到中意的產品,甚至不會意識到這是我們有意安排的。這跟Amazon Go不同的地方在於,Amazon Go只是簡化了結賬流程,而我們是要了解每一個客戶,瞭解他們的購物習慣和喜好,打造定製化的購物體驗。(完)

    

關注Robin.ly “Leaders In AI” Podcast

收聽完整英文訪談


相關閱讀

CVPR 2019最佳論文得主專訪:非視距形狀重建的費馬路徑理論

斯坦福AI Lab主任Chris Manning:我的第一次CVPR

硅谷AI商業化大會專題討論:自動駕駛與智能交通的未來

大咖雲集硅谷AI大會: 人工智能商業化的趨勢與挑戰

更多CVPR訪談視頻將陸續上線。關注Robinly公衆號,及時獲得內容更新和活動通知。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章