阿里iDST華先勝:城市大腦,對城市的全量、實時認知和搜索

10月11-14日,爲期四天的2017杭州雲棲大會(門票火熱搶購中!)將再度在杭州雲棲小鎮起航,作爲全球最具影響力的科技展會之一,本屆大會將有不少阿里集團專家以及各企業行業領袖的精彩演講,CSDN授權轉載了雲棲大會嘉賓的專訪內容。第一位嘉賓是阿里巴巴iDST副院長華先勝,他將在10月的雲棲大會上分享關於計算機視覺領域的前沿趨勢以及城市大腦最新的進展。

圖片描述

華先勝是視覺識別和搜索領域的國際權威,曾擔任 ACM Multimedia 等大會程序委員會主席,他還是國家千人計劃專家、IEEE Fellow、ACM傑出科學家、2008年度MIT TR 全球 35 位 35 歲以下的傑出青年創新人物。

2015年,華先勝離開職業生涯起點的微軟研究院加盟阿里巴巴,在搜索事業部負責電商圖片搜索技術的優化,並帶領團隊研發了手機淘寶中的拍立淘;2016年4月他又加入阿里人工智能研究機構iDST,帶領視覺計算團隊的研發工作,目前,其負責的項目之一就是城市大腦。

在7月底結束的全球計算機視覺頂級會議——CVPR 2017上,作爲iDST視覺計算組負責人,華先勝受邀發表了《Practices of Large-Scale Target Re-Identification》的主題報告,報告中提到了城市大腦項目。

挖掘城市異構數據的價值

2016年的杭州雲棲大會上,城市大腦首次對外公佈。彼時阿里巴巴集團技術委員會主席王堅在介紹城市大腦時表示:“城市大腦的內核採用阿里雲ET人工智能技術,可以對城市進行全局實時分析,自動調配公共資源,修正城市運行中的缺陷,成爲治理城市的超級人工智能。”

一年後的今天,城市大腦是對外界來說依舊是一個似曾相識但又神祕的項目。如果用一個通俗而又古老的詞來定義,你可以稱之爲智慧城市,但事實上城市大腦已經遠遠超越了大家通常談論的智慧城市。

用華先勝的話說,城市大腦的核心是利用大數據和大計算來挖掘大量城市異構數據的價值。

城市異構數據是什麼?它有兩個特點:

首先,城市數據是視覺數據、公交數據、GPS數據以及人口等異構數據的聚合體,當然,在這些數據中視覺數據是量最大也是最核心的部分;其次,城市的數據量很大,例如一座城市擁有十幾萬攝像頭,每天24小時產生的數據量是非常大的。因此,擁有海量數據是城市載體的天然優勢,但如何挖掘數據的價值則是城市大腦的使命。

“過去,這些數據的價值並沒有被充分挖掘出來,海量設備的部署和運維成本很高,但它的價值遠遠不只是傳統的車牌識別和交通處罰。”華先勝如是說。

城市大腦打造的是一個具有數據智能的城市,它可以通過對城市的全面、實時和全量感知來識別車的形狀、型號、路徑、速度,或者感知行人和騎行人等等,在此基礎之上,再進行決策優化、預測以及干預,城市數據的價值也就逐漸顯現出來了。

華先勝用交通狀況舉了個例子:一旦遇到突發情況,城市大腦就可以立即找出相關的數據,比如查找嫌疑車、肇事車、嫌疑人;然後還可以基於分析後的數據對整個城市進行交通的優化;更進一步,城市大腦還可以對即將發生的事情進行預測,例如10分鐘以後哪裏會出現交通擁堵?或者更長時間的預測…根據預測出來的結果,就可以提前進行警力和醫療資源的部署,甚至提前做一些交通管制、限流等等,避免事故發生。

對此,華先勝還表示,對城市數據的全面感知主要得益於兩大技術:一方面是計算能力的提升,雲計算、GPU、FPGA等都讓我們可以實現海量數據的計算,同時實時處理千路、萬路,甚至更多路的視頻;另外一個核心原因是深度學習算法對計算機視覺的推動。

目前,華先勝所帶領的視覺團隊在算法上已經取得了很多突破,他們在服務器端用更優的算法實現了更精準的車輛檢測、車牌識別,同時可以實時監測事故、預測交通狀況,而且城市大腦也已在杭州城區和蕭山區已經部署運行了很長一段時間。

“我們能做大規模的視頻處理,這對效率和穩定性都是一個很大的挑戰。過去的大半年時間,經過不斷的迭代優化,我們在整個鏈路的處理速度提升了20倍。”

從感知到搜索

在城市大腦項目中,計算機視覺無疑是最重要也是最具挑戰的部分。華先勝表示,視覺數據是城市異構數據的核心,它比其它數據更加全面,因此城市大腦項目在視覺方向投入的人力也是最多的。

“視覺的數據在覆蓋上沒有GPS數據好,因爲它是個斷面數據,但是視覺數據更加全面,它可以知道整個路口的詳盡的情況。”

但是,除了視覺感知、識別的基本問題外,城市大腦還會涉及到基於視覺的結構化數據之上的問題,例如搜索。

和拍立淘的電商產品搜索一樣,城市大腦同樣需要對圖像進行實時索引,通過攝像頭的視覺數據進城市的索引和搜索,這是該項目的突破之一。

華先勝表示,從技術角度看,城市圖搜的技術整體路線和拍立淘是類似的,首先要知道目標在哪裏,也就是目標檢測;然後是識別車或人等移動目標,以及這些目標的屬性;最後是要抽一個特徵,一個高維向量,代表這個目標的本質特徵。

但是,城市圖搜遠比商品搜索問題更復雜:同一商品的不同實例對於電商搜索而言是一樣的,但是相同型號、不同車主的車卻不相同;另外,人的特徵描述和搜索也是一大挑戰,當人臉看不清楚的情況下問題就變得棘手了,這是實際應用場景中需要克服的難題。

當然,對於iDST視覺團隊而言,他們已經走在了行業前列,目前在公開測試集上,該團隊的成績已經超越了公開發布的最好結果。

再談商業化

人工智能的發展方興未艾,最近幾年國內外涌現了大批人工智能創業公司,能否商業化便是檢驗企業實力最好的標準。

華先勝認爲人工智能商業化要滿足五個條件:

  • 第一個是算法,好的算法是基礎。

  • 第二個是要有數據。

  • 第三個是用戶。

  • 第四個就是平臺,要有強大的計算能力和一套體系架構(當然雲計算已經幫很多創業公司降低了門檻)。

  • 第五個就是有好的商業模式。

目前,人工智能企業大部分都專注於視覺應用,毫不誇張的說,計算機視覺領域已經是紅海一片。但不可否認的是,計算機視覺是人工智能落地最快的技術之一。華先勝談到,未來在視覺方向有五大應用趨勢:

  • 首先是交通安防,也就是城市大腦專注的方向;

  • 其次是富媒體,就是通過視覺的方法去挖掘大量的視頻、圖像數據的價值;

  • 第三個是醫療圖像方向,雖然醫療領域的落地時間可能會稍微遠一點,但未來這是一大熱門;

  • 第四是工業視覺,未來可以通過攝像頭來代替過去絕大多數需要人眼來檢查、判斷的場景,這是一個尚待進一步開墾的領域;

  • 此外,端上的視覺智能也是很好的方向,包括芯片和一些基於視覺的應用。

不難發現,上述領域也正是阿里雲城市大腦、醫療大腦、工業大腦研發的方向,但不同領域存在的差異也是顯而易見的。在採訪的過程中,華先勝多次強調深入行業的重要性。人工智能正在逐漸滲透到各行各業,但人工智能技術要發揮真正的價值,除了基礎的數據和算法之外,對場景的深入研究也尤爲重要,否則人工智能描繪的藍圖再美好也只是黃粱一夢罷了。

發佈了166 篇原創文章 · 獲贊 7 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章