還在糾結深度學習算法？計算機視覺CV的關鍵在於數據採集和標註！

科技雲報道原創。

2012年，AlexNet網絡橫空出世，帶來了前所未有的深度學習革命，這也讓多年來進展緩慢的計算機視覺CV研究，一下被按下了“快進鍵”。

人們突然發現，這種模擬人腦抽象和迭代過程的深度學習算法，讓計算機開始“看見”。從物體的邊緣、輪廓到物體的部分，再向更高級層層抽象，深度學習讓計算機終於能夠在一張日常照片中，檢測並識別出圖上有一隻貓，而不是一條狗。

這樣的一小步，人類已經等待了二十多年。2016-2018年，深度學習成爲計算機視覺CV研究的算法“標配”，人臉識別、圖像識別、視頻識別、物體跟蹤、行人檢測等CV技術得以進一步突破，並快速應用到安防、金融、汽車出行、泛娛樂等各個行業中。

如今，人們拿起手機刷臉支付、一鍵美顏、拍照識圖，背後都有計算機視覺CV技術的身影。而在更廣闊的行業市場，智慧城市、自動駕駛、智能家居、智慧醫療等多種場景都在渴望計算機視覺CV技術更進一步。

過去五年，計算機視覺CV領域一度成爲國內創投圈的“寵兒”。僅2018年，該領域融資額就高達230億。然而，這樣的盛景並沒有持續多久。

去年2月，計算機視覺奠基人Alan L. Yuille曾撰文表達他對當下計算機視覺CV技術發展的擔憂。他認爲，計算機視覺的發展面臨瓶頸，深度學習在其中起到的作用有限，需要找到新的突破口。

從某種意義上來說，計算機視覺CV研究的確已經進入了瓶頸期。

計算機視覺CV困境：受限於AI數據的規模和質量

在近幾年的發展中，圖像分類、對象檢測、目標跟蹤、語義分割、實例分割等計算機視覺CV技術的核心任務，其精確度已經達到了產業落地的水平，但隨之而來的，卻是計算機視覺CV公司技術的同質化。

京東集團智能平臺部投資主管徐博曾表示，在全球範圍內，計算機視覺CV企業的技術都差不多，無論從中國還是美國發布的研究成果看，算法都是類似的。

業界關於計算機視覺CV技術已觸及天花板的討論越來越多，而源頭則統一指向了深度學習算法。由於深度學習高度依賴大量的標註數據，如果計算機視覺CV的精確度想要再提高，如：對非常小和模糊的目標做檢測，在複雜光照變化下保證分割結果穩定等，都需要分類更加細緻、標註更加細化的數據去“教導”深度學習算法。

不僅如此，在工業界，數據規模更容易成爲算法研發的關鍵因素。如果有更多的數據，就可以使用容量更大、更復雜的模型，得到效果更好的算法。當數據大到一定程度，數據和算法之間可以進行反覆迭代，形成壁壘，爲公司提供競爭力。

尷尬的是，在計算機視覺CV領域，可用數據的規模和質量，遠遠達不到進一步提升效果的需求。爲了解決AI“數據荒”，業界嘗試過多種辦法，如：在少量數據基礎上增加特徵生成新數據；再或者，另闢蹊徑去攻克半監督或無監督學習。

但是，種種“曲線救國”的辦法，都解不了計算機視覺CV領域對高質量數據的“近渴”。落地到工業界，企業迫於市場競爭的壓力，對計算機視覺CV的感知能力要求還在提升，業界對大規模、高質量AI數據的渴望空前強烈。

以人臉識別技術爲例，雲測數據總經理賈宇航表示，2015-2016年，人工智能對人臉數據訓練的還相對粗放。但到了現在這個階段，由於人工智能應用場景的多樣性，對不同年齡、性別、膚色，不同的光線、角度的場景化要求越來越複雜，而且拍攝設備也隨着手機、相機的不斷進化，從單鏡頭到雙鏡頭甚至增加了3D攝像設備，算法訓練對數據的要求變得更加精細、豐富更加具有策略性。

場景化AI數據：量身定製的數據採集和標註

事實上，如今各大企業在AI產品上的競爭，本質上已經變成了AI數據之爭。

在智能安防領域，產品可以分爲監控、探測、防護等等，而視頻監控則佔據了其中大頭部分。現有攝像頭囊括了大量的行人、機動車、自行車等道路場景數據，而預警作爲智能安防的重要作用之一，則需要識別諸如：老人摔倒、搶劫、打架、着火等稀有的小場景數據。顯然，這種長尾場景的數據，需要在特定條件下的才能獲取。

在人機交互領域，除了常規的語音、動作識別等，很多前沿研究希望通過情緒識別的方式，感知用戶的心理狀態，進而優化人機交互的體驗。相對應的，人類在各種特定條件下的喜怒哀樂哭笑等精細的情緒數據，仍缺乏規模和質量。

在自動駕駛領域，由於涉及到駕駛安全，對場景化的數據要求更爲精細。以圖像識別爲例，在佐治亞理工學院的一項研究中，通過對8個圖像識別系統的測試，發現自動駕駛汽車的傳感器和攝像頭，更善於檢測膚色較淺的人，而膚色較深被檢測出的準確率平均會低5%。

但從技術角度來看，計算機視覺CV是通過RGB或RGBD識別人/物體的信息，其中黑色是最難被識別的。現實中，由於黑色及深色的數據稀少，導致算法模型不夠精確，最終在實際落地應用時出現差錯。

爲了獲得規模化、高質量的AI數據，工業界開始尋求一種更具專業化的數據獲取方式，即通過定製的數據採集和標註，來獲取特定的場景化數據。據云測數據總經理賈宇航介紹，現階段AI數據有着三個大趨勢：

第一，場景的多元化。基於產品落地場景，儘可能模擬各種各樣的特定條件，如：光線強度、拍攝角度、噪聲要求、室內室外等，以覆蓋豐富多樣的場景，甚至是長尾場景的數據需求；

第二，樣本的多樣性。以人的數據爲例，人是一個非常多元化的物種，有不同的年齡、人種、性別、國籍等等，除此之外還涉及廣泛的數據類型，包括圖片、視頻、音頻、文本數據。如果想要發揮人工智能的普惠性，用AI產品服務好各種人羣，就需要豐富多樣化的樣本。

第三，數據的多維化。隨着技術和行業的發展，以智能駕駛領域數據需求爲例，業界已逐漸從單攝像頭過渡到多攝像頭的方案。但是2D圖像對於物體的測距仍有着很大的侷限性，因此也出現了與激光雷達、超聲波雷達等3D傳感器的融合。通過多維度的採集硬件設備，幫助更多維度數據融合加速場景的落地。

目前，處於AI產品落地前夕或者處於重大迭代週期的企業，已經開始大力投入場景化數據用於算法的訓練。以汽車行業爲例，數據場景化定製主要集中在AI落地的兩個方向：自動駕駛和車內智能駕駛倉。

在自動駕駛方向上，業界對行駛安全尤爲關注，因此加大了對道路上長尾場景的覆蓋，如：行人出現在馬路中間、孩子突然在車前摔倒等，這決定了自動駕駛車輛能否及時識別出這些狀況，並完成相應的控制決策。而在疫情期間，大街上出現了大量戴口罩的行人，這類場景也需要相對應的數據進行算法模型訓練。

而在車內智能駕駛倉方向上，企業比拼的是車內智能和互動的體驗，如：通過手勢識別、語音識別、情緒識別等AI技術，來關注車內駕駛員是否疲勞駕駛、車內是否會出現爭吵等危險事件，以便做到及時識別和干預。

事實上，道路情況千變萬化。雲測數據通過自建的“場景實驗室”的方式還原現實場景，幫助算法模型儘可能多地覆蓋不同場景下的多維數據，從而提高自動駕駛車輛的安全性。而這樣高質量的場景化數據，才得以幫助企業真正的商業化落地。

雲測數據：場景化AI數據採標的引領者

如今，越來越多的行業在與人工智能技術結合。企業爲了保持優勢，打造持續的AI競爭力，開始與AI數據服務商緊密合作，以獲得更高質量的場景AI數據來進行產品落地前的優化。

根據艾瑞《中國人工智能基礎數據服務行業白皮書》顯示，2018 年，數據資源定製服務已在基礎數據服務市場佔據86.2%的份額。各個行業的頭部企業更是一馬當先，都在爲場景化AI數據“下血本”。

目前，衆多AI巨頭、車企巨頭、大型金融機構、互聯網企業以及傳統企業等等，都與雲測數據建立了良好的合作伙伴關係。

一旦數據採集和標註變成專業化、高質量的服務，交付的數據就需要在數據的規模、質量、時效性上充分滿足服務企業的需求，來助力AI產品達到商業化落地的標準，而這正是雲測數據的優勢所在。

據悉，雲測數據作爲國內數據採集和標註領域頭部的服務商，在創立之初恰逢自動駕駛、智能音箱等AI應用趨勢興起，各大企業需要大量的計算機視覺CV數據以打磨自己的算法和AI能力，由此計算機視覺CV也成爲雲測數據至今深耕最久、經驗最豐富的領域之一。

雖然與文本、語音等數據類型相比，計算機視覺CV數據的維度很多，可以說是數據品類最複雜的一個領域，但長期與行業衆多企業的緊密合作，讓雲測數據持續保持着全品類CV數據採集和標註的優勢。

爲了提供更爲專業的服務，雲測數據自建數據基地和場景實驗室的方式，打造出AI領域的數據“夢工廠”。

結合標準化的作業流程，並配以專業的標註工具和平臺，雲測數據在華東、華南、華北自建的數據標註基地和場景實驗室，是高效率和高質量數據交付的強力保障。

其實對於數據標註，不同的人有不同的理解，例如：什麼樣的光線叫做強光線，在判斷上有很強的主觀性。爲了保證企業客戶和標註人員的理解達成一致，雲測數據的項目經理保持着實時的溝通和反饋，並配合行業培訓師對標註員們進行前期培訓，以確保在標註時具有領域專業知識。在確立了數據標註標準後，標註員全程在線上標註系統裏完成作業，並最終經過層層質檢以保證數據標註的準確性。

以自動駕駛爲例，爲了讓機器“看見”複雜道路環境中的車道線、路標、障礙物、行人、十字路口，以及一些長尾場景如：闖紅燈車輛、橫穿馬路的行人、路邊違章停靠的車輛等，數據標註時需要採用圖像分割、連續幀標註、2D圖像框選、3D點雲標註等多種標註方式。其中，雲測數據自研的3D點雲標註工具，能夠保證整個標註過程流暢快捷，其效率比開源工具高5倍左右。

在人臉及人體關鍵點標註及追蹤方面，雲測數據能夠通過領先的標註工具實現精細化的標註，如：對人臉進行26點、54點、96點、206點的人臉關鍵點標註；貼合度在3像素以內的特定任務關鍵點追蹤；對人體骨骼關鍵點位置進行打點，特定位置可腦補並分配對應動作屬性等。

對於企業客戶最關注的數據安全和隱私，雲測數據也有自己的原則和底線。首先，數據絕不復用，對於客戶定製的數據需求，交付後全部清刪。第二，在雲測數據的標註基地設定了數據隔離、質量保障等一系列數據安全流程，確保數據不泄露，同時還提供私有化部署、標註人員駐場等服務。

不難發現，雲測數據從數據採集、標註、審覈、輸出、安全等環節提供了一整套的解決方案，在保障AI場景化數據高質量生產的同時，也使得交付的數據等高效、高質、安心。

CV研究下的AI數據趨勢：精細化、效率化、多模化

隨着企業在AI功能性、擬人化、安全性方面的競爭進一步加劇，對應CV數據的要求也將越來越高。在雲測數據總經理賈宇航看來，未來計算機視覺訓練數據的發展需求會呈現三大趨勢：

一是，數據採集和標註的精細度會更高。從算法的學術研究到產業落地，對於標註內容的精細程度正在不斷上升。以人臉識別爲例，從前期的90%到95%是一個檔次，而當數據標註精度達到99%時，算法模型的完善，將會有質的提高；同時，針對物體屬性分類，也從單層級向多層級進行演進；以及對應的訓練數據的採集與標註，需要有更多相關操作能力和經驗的專業人員來操作。

二是，在效率層面，未來隨着更多產品落地，AI產品迭代時間將更加清晰明確，對應的數據標註時間、數據標註量都有明確的時間節點。因此，數據採集和標註的效率，將很大程度考驗着數據服務商的專業度。

三是，多模態的數據採集和標註，會成爲一種必然趨勢。不同的樣本、場景、設備構建的多維度數據的融合，將大幅度提升AI算法的能力。對於數據服務商而言，是否具備加速處理數據的能力，以及場景搭建、還原的能力，都決定了市場競爭的門檻。

在這樣的趨勢下，所有的AI數據服務商都面臨不斷升級的業務難度。如雲測數據這類處於引領地位的數據服務商，往往會結合各行業最頭部企業客戶的需求，來佈局自己的服務領域，對服務能力進行自我迭代升級，以確保該需求成爲行業普遍需求時已經成爲該領域的數據專家。對於後進者而言，缺少專業知識、技術和行業經驗的日復一日的積累，這種競爭差距只會越拉越大。

創立了ImageNet數據集的斯坦福教授李飛飛曾在TED演講中暢想：“當機器可以‘看到’時，醫生和護士會獲得一雙額外的、不知疲倦的眼睛，幫他們診斷病情、照顧病人；汽車可以在道路上行駛得更智能、更安全。我們會發現新的物種、更好的材料，還可以在機器的幫助下探索從未見過的前沿地帶。”

人類對於技術深度的追求和美好未來的暢想從不落幕。很多人或許認爲計算機視覺CV技術已經遭遇了瓶頸，但同時，也有越來越多的企業意識到，想要打破計算機視覺CV技術的同質化，再一次實現機器感知能力的突破，獲取高質量、精細化的場景化AI數據至關重要，而這也是各行業企業打造AI競爭力的關鍵所在。

【關於科技雲報道】

專注於原創的企業級內容行家——科技雲報道。成立於2015年，是前沿企業級IT領域Top10媒體。獲工信部權威認可，可信雲、全球雲計算大會官方指定傳播媒體之一。深入原創報道雲計算、大數據、人工智能、區塊鏈等領域。

還在糾結深度學習算法？計算機視覺CV的關鍵在於數據採集和標註！

python gdal 安裝使用（Windows， python 3.6.8）

KubeSphere研發總監周小四：在談容器同質化之前，你得先理解工匠精神

科技雲報道：4年後，中國會成爲全球最大的雲計算市場嗎？

“新基建”看5G？先過了這個坎兒再說

IT安全交給MSP，企業能當“甩手掌櫃”嗎？

首個電力企業核心業務上雲，快來國網黑龍江電力“抄作業”！

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結