還在糾結深度學習算法?計算機視覺CV的關鍵在於數據採集和標註!

科技雲報道原創。

2012年,AlexNet網絡橫空出世,帶來了前所未有的深度學習革命,這也讓多年來進展緩慢的計算機視覺CV研究,一下被按下了“快進鍵”。

人們突然發現,這種模擬人腦抽象和迭代過程的深度學習算法,讓計算機開始“看見”。從物體的邊緣、輪廓到物體的部分,再向更高級層層抽象,深度學習讓計算機終於能夠在一張日常照片中,檢測並識別出圖上有一隻貓,而不是一條狗。

6

這樣的一小步,人類已經等待了二十多年。2016-2018年,深度學習成爲計算機視覺CV研究的算法“標配”,人臉識別、圖像識別、視頻識別、物體跟蹤、行人檢測等CV技術得以進一步突破,並快速應用到安防、金融、汽車出行、泛娛樂等各個行業中。

如今,人們拿起手機刷臉支付、一鍵美顏、拍照識圖,背後都有計算機視覺CV技術的身影。而在更廣闊的行業市場,智慧城市、自動駕駛、智能家居、智慧醫療等多種場景都在渴望計算機視覺CV技術更進一步。

過去五年,計算機視覺CV領域一度成爲國內創投圈的“寵兒”。僅2018年,該領域融資額就高達230億。然而,這樣的盛景並沒有持續多久。

去年2月,計算機視覺奠基人Alan L. Yuille曾撰文表達他對當下計算機視覺CV技術發展的擔憂。他認爲,計算機視覺的發展面臨瓶頸,深度學習在其中起到的作用有限,需要找到新的突破口。

從某種意義上來說,計算機視覺CV研究的確已經進入了瓶頸期。

4

計算機視覺CV困境:受限於AI數據的規模和質量

在近幾年的發展中,圖像分類、對象檢測、目標跟蹤、語義分割、實例分割等計算機視覺CV技術的核心任務,其精確度已經達到了產業落地的水平,但隨之而來的,卻是計算機視覺CV公司技術的同質化。

京東集團智能平臺部投資主管徐博曾表示,在全球範圍內,計算機視覺CV企業的技術都差不多,無論從中國還是美國發布的研究成果看,算法都是類似的。

業界關於計算機視覺CV技術已觸及天花板的討論越來越多,而源頭則統一指向了深度學習算法。由於深度學習高度依賴大量的標註數據,如果計算機視覺CV的精確度想要再提高,如:對非常小和模糊的目標做檢測,在複雜光照變化下保證分割結果穩定等,都需要分類更加細緻、標註更加細化的數據去“教導”深度學習算法。

不僅如此,在工業界,數據規模更容易成爲算法研發的關鍵因素。如果有更多的數據,就可以使用容量更大、更復雜的模型,得到效果更好的算法。當數據大到一定程度,數據和算法之間可以進行反覆迭代,形成壁壘,爲公司提供競爭力。

8

尷尬的是,在計算機視覺CV領域,可用數據的規模和質量,遠遠達不到進一步提升效果的需求。爲了解決AI“數據荒”,業界嘗試過多種辦法,如:在少量數據基礎上增加特徵生成新數據;再或者,另闢蹊徑去攻克半監督或無監督學習。

但是,種種“曲線救國”的辦法,都解不了計算機視覺CV領域對高質量數據的“近渴”。落地到工業界,企業迫於市場競爭的壓力,對計算機視覺CV的感知能力要求還在提升,業界對大規模、高質量AI數據的渴望空前強烈。

以人臉識別技術爲例,雲測數據總經理賈宇航表示,2015-2016年,人工智能對人臉數據訓練的還相對粗放。但到了現在這個階段,由於人工智能應用場景的多樣性,對不同年齡、性別、膚色,不同的光線、角度的場景化要求越來越複雜,而且拍攝設備也隨着手機、相機的不斷進化,從單鏡頭到雙鏡頭甚至增加了3D攝像設備,算法訓練對數據的要求變得更加精細、豐富更加具有策略性。

場景化AI數據:量身定製的數據採集和標註

事實上,如今各大企業在AI產品上的競爭,本質上已經變成了AI數據之爭。

在智能安防領域,產品可以分爲監控、探測、防護等等,而視頻監控則佔據了其中大頭部分。現有攝像頭囊括了大量的行人、機動車、自行車等道路場景數據,而預警作爲智能安防的重要作用之一,則需要識別諸如:老人摔倒、搶劫、打架、着火等稀有的小場景數據。顯然,這種長尾場景的數據,需要在特定條件下的才能獲取。

1

在人機交互領域,除了常規的語音、動作識別等,很多前沿研究希望通過情緒識別的方式,感知用戶的心理狀態,進而優化人機交互的體驗。相對應的,人類在各種特定條件下的喜怒哀樂哭笑等精細的情緒數據,仍缺乏規模和質量。

在自動駕駛領域,由於涉及到駕駛安全,對場景化的數據要求更爲精細。以圖像識別爲例,在佐治亞理工學院的一項研究中,通過對8個圖像識別系統的測試,發現自動駕駛汽車的傳感器和攝像頭,更善於檢測膚色較淺的人,而膚色較深被檢測出的準確率平均會低5%。

但從技術角度來看,計算機視覺CV是通過RGB或RGBD識別人/物體的信息,其中黑色是最難被識別的。現實中,由於黑色及深色的數據稀少,導致算法模型不夠精確,最終在實際落地應用時出現差錯。

2

爲了獲得規模化、高質量的AI數據,工業界開始尋求一種更具專業化的數據獲取方式,即通過定製的數據採集和標註,來獲取特定的場景化數據。據云測數據總經理賈宇航介紹,現階段AI數據有着三個大趨勢:

第一,場景的多元化。基於產品落地場景,儘可能模擬各種各樣的特定條件,如:光線強度、拍攝角度、噪聲要求、室內室外等,以覆蓋豐富多樣的場景,甚至是長尾場景的數據需求;

第二,樣本的多樣性。以人的數據爲例,人是一個非常多元化的物種,有不同的年齡、人種、性別、國籍等等,除此之外還涉及廣泛的數據類型,包括圖片、視頻、音頻、文本數據。如果想要發揮人工智能的普惠性,用AI產品服務好各種人羣,就需要豐富多樣化的樣本。

第三,數據的多維化。隨着技術和行業的發展,以智能駕駛領域數據需求爲例,業界已逐漸從單攝像頭過渡到多攝像頭的方案。但是2D圖像對於物體的測距仍有着很大的侷限性,因此也出現了與激光雷達、超聲波雷達等3D傳感器的融合。通過多維度的採集硬件設備,幫助更多維度數據融合加速場景的落地。

目前,處於AI產品落地前夕或者處於重大迭代週期的企業,已經開始大力投入場景化數據用於算法的訓練。以汽車行業爲例,數據場景化定製主要集中在AI落地的兩個方向:自動駕駛和車內智能駕駛倉。

在自動駕駛方向上,業界對行駛安全尤爲關注,因此加大了對道路上長尾場景的覆蓋,如:行人出現在馬路中間、孩子突然在車前摔倒等,這決定了自動駕駛車輛能否及時識別出這些狀況,並完成相應的控制決策。而在疫情期間,大街上出現了大量戴口罩的行人,這類場景也需要相對應的數據進行算法模型訓練。

_1

而在車內智能駕駛倉方向上,企業比拼的是車內智能和互動的體驗,如:通過手勢識別、語音識別、情緒識別等AI技術,來關注車內駕駛員是否疲勞駕駛、車內是否會出現爭吵等危險事件,以便做到及時識別和干預。

事實上,道路情況千變萬化。雲測數據通過自建的“場景實驗室”的方式還原現實場景,幫助算法模型儘可能多地覆蓋不同場景下的多維數據,從而提高自動駕駛車輛的安全性。而這樣高質量的場景化數據,才得以幫助企業真正的商業化落地。

雲測數據:場景化AI數據採標的引領者

如今,越來越多的行業在與人工智能技術結合。企業爲了保持優勢,打造持續的AI競爭力,開始與AI數據服務商緊密合作,以獲得更高質量的場景AI數據來進行產品落地前的優化。

根據艾瑞《中國人工智能基礎數據服務行業白皮書》顯示,2018 年,數據資源定製服務已在基礎數據服務市場佔據86.2%的份額。各個行業的頭部企業更是一馬當先,都在爲場景化AI數據“下血本”。

目前,衆多AI巨頭、車企巨頭、大型金融機構、互聯網企業以及傳統企業等等,都與雲測數據建立了良好的合作伙伴關係。

_2

一旦數據採集和標註變成專業化、高質量的服務,交付的數據就需要在數據的規模、質量、時效性上充分滿足服務企業的需求,來助力AI產品達到商業化落地的標準,而這正是雲測數據的優勢所在。

據悉,雲測數據作爲國內數據採集和標註領域頭部的服務商,在創立之初恰逢自動駕駛、智能音箱等AI應用趨勢興起,各大企業需要大量的計算機視覺CV數據以打磨自己的算法和AI能力,由此計算機視覺CV也成爲雲測數據至今深耕最久、經驗最豐富的領域之一。

雖然與文本、語音等數據類型相比,計算機視覺CV數據的維度很多,可以說是數據品類最複雜的一個領域,但長期與行業衆多企業的緊密合作,讓雲測數據持續保持着全品類CV數據採集和標註的優勢。

爲了提供更爲專業的服務,雲測數據自建數據基地和場景實驗室的方式,打造出AI領域的數據“夢工廠”。

3

結合標準化的作業流程,並配以專業的標註工具和平臺,雲測數據在華東、華南、華北自建的數據標註基地和場景實驗室,是高效率和高質量數據交付的強力保障。

其實對於數據標註,不同的人有不同的理解,例如:什麼樣的光線叫做強光線,在判斷上有很強的主觀性。爲了保證企業客戶和標註人員的理解達成一致,雲測數據的項目經理保持着實時的溝通和反饋,並配合行業培訓師對標註員們進行前期培訓,以確保在標註時具有領域專業知識。在確立了數據標註標準後,標註員全程在線上標註系統裏完成作業,並最終經過層層質檢以保證數據標註的準確性。

__20200514102522

以自動駕駛爲例,爲了讓機器“看見”複雜道路環境中的車道線、路標、障礙物、行人、十字路口,以及一些長尾場景如:闖紅燈車輛、橫穿馬路的行人、路邊違章停靠的車輛等,數據標註時需要採用圖像分割、連續幀標註、2D圖像框選、3D點雲標註等多種標註方式。其中,雲測數據自研的3D點雲標註工具,能夠保證整個標註過程流暢快捷,其效率比開源工具高5倍左右。

在人臉及人體關鍵點標註及追蹤方面,雲測數據能夠通過領先的標註工具實現精細化的標註,如:對人臉進行26點、54點、96點、206點的人臉關鍵點標註;貼合度在3像素以內的特定任務關鍵點追蹤;對人體骨骼關鍵點位置進行打點,特定位置可腦補並分配對應動作屬性等。

對於企業客戶最關注的數據安全和隱私,雲測數據也有自己的原則和底線。首先,數據絕不復用,對於客戶定製的數據需求,交付後全部清刪。第二,在雲測數據的標註基地設定了數據隔離、質量保障等一系列數據安全流程,確保數據不泄露,同時還提供私有化部署、標註人員駐場等服務。

不難發現,雲測數據從數據採集、標註、審覈、輸出、安全等環節提供了一整套的解決方案,在保障AI場景化數據高質量生產的同時,也使得交付的數據等高效、高質、安心。

CV研究下的AI數據趨勢:精細化、效率化、多模化

隨着企業在AI功能性、擬人化、安全性方面的競爭進一步加劇,對應CV數據的要求也將越來越高。在雲測數據總經理賈宇航看來,未來計算機視覺訓練數據的發展需求會呈現三大趨勢:

_3

一是,數據採集和標註的精細度會更高。從算法的學術研究到產業落地,對於標註內容的精細程度正在不斷上升 。以人臉識別爲例,從前期的90%到95%是一個檔次,而當數據標註精度達到99%時,算法模型的完善,將會有質的提高;同時,針對物體屬性分類,也從單層級向多層級進行演進 ;以及對應的訓練數據的採集與標註,需要有更多相關操作能力和經驗的專業人員來操作。

二是,在效率層面,未來隨着更多產品落地,AI產品迭代時間將更加清晰明確 ,對應的數據標註時間、數據標註量都有明確的時間節點。因此,數據採集和標註的效率,將很大程度考驗着數據服務商的專業度。

三是,多模態的數據採集和標註,會成爲一種必然趨勢。不同的樣本、場景、設備構建的多維度數據的融合,將大幅度提升AI算法的能力。對於數據服務商而言,是否具備加速處理數據的能力,以及場景搭建、還原的能力,都決定了市場競爭的門檻。

在這樣的趨勢下,所有的AI數據服務商都面臨不斷升級的業務難度。如雲測數據這類處於引領地位的數據服務商,往往會結合各行業最頭部企業客戶的需求,來佈局自己的服務領域,對服務能力進行自我迭代升級,以確保該需求成爲行業普遍需求時已經成爲該領域的數據專家。對於後進者而言,缺少專業知識、技術和行業經驗的日復一日的積累,這種競爭差距只會越拉越大。

創立了ImageNet數據集的斯坦福教授李飛飛曾在TED演講中暢想:“當機器可以‘看到’時,醫生和護士會獲得一雙額外的、不知疲倦的眼睛,幫他們診斷病情、照顧病人;汽車可以在道路上行駛得更智能、更安全。我們會發現新的物種、更好的材料,還可以在機器的幫助下探索從未見過的前沿地帶。”

人類對於技術深度的追求和美好未來的暢想從不落幕。很多人或許認爲計算機視覺CV技術已經遭遇了瓶頸,但同時,也有越來越多的企業意識到,想要打破計算機視覺CV技術的同質化,再一次實現機器感知能力的突破,獲取高質量、精細化的場景化AI數據至關重要,而這也是各行業企業打造AI競爭力的關鍵所在。

【關於科技雲報道】

專注於原創的企業級內容行家——科技雲報道。成立於2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信雲、全球雲計算大會官方指定傳播媒體之一。深入原創報道雲計算、大數據、人工智能、區塊鏈等領域。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章