原创 Tensorflow object detection API訓練自己的數據
一. 安裝 Tensorflow object detection api是tensorflow官方出品的檢測工具包,集成了像ssd、faster rcnn等檢測算法,mobilenet、inception、resnet等back
原创 OCR文字識別(2)
一. 文字識別 文字識別是指在確定檢測框之後,識別出對應的文字,文字識別的方法有很多,包括: 1)基於分割後單個字符的分類; 2)基於序列的CNN方法,包括 基於STN矯正,CTC loss,Attention機制等策略;
原创 OCR文字識別(1)
一. 研究背景 文字識別是CV領域應用最廣,最接地氣的方向之一,從證件識別到智慧醫療,從拍照識別到無人駕駛,從車牌識別到物流分揀,幾乎涵蓋了AI的所有場景。 通常文字識別分成兩步,文本位置檢測 + 識別。
原创 基於視頻的目標檢測
一. 提出背景 目標檢測在圖像處理領域有着非常大的佔比,過去兩年,深度學習在Detection的持續發力,爲這個領域帶來了變革式的發展:一方面,從 RCNN 到 Fast RCNN,再到 Faster RCNN,不斷刷新 mA
原创 人羣密度估計-Crowd Density
一. 應用背景 在安防大背景下,對敏感區域人流量的管控是一個重要的課題,防止人羣騷亂、踩踏現象的發生,對非預期的人員匯聚進行預警等等,最常用的方法是檢測到每個目標,然後藉助 Perspective 矩陣完成到實際位置的映射,當然
原创 基礎網絡架構探究之DiracNets
CNN研究者總是面臨一個共同的話題:如何提升神經網絡的表達能力?分兩個方向去探討:1)拉長增加網絡層數是最直觀的一種方法,但這種方法所面臨的是 梯度消失問題,網絡越深,梯度的回傳越困難。基於此,MSRA提出了ResNet,通過skipco
原创 TensorRT深度學習推理框架介紹
一. 產生背景 深度學習的發展帶動了一批深度學習框架,caffe、tensorflow、pytorch等,對於計算量龐大的CNN,效率一直是大家所關注的,接觸過深度網絡壓縮的同學應該知道網絡壓縮最關鍵的兩個思路,剪枝和量化。
原创 語義分割網絡之PSPnet
一.提出背景 基於FCN全卷積網絡的分割面臨諸多問題,這篇文章從多尺度入手,提出了金字塔模型來提取多尺度的信息,達到了 State-of-the-art 的結果 論文:PSPnet:Pyramid Scene Pa
原创 視頻人員行爲識別(Action Recognition)
一. 提出背景 目標:給定一段視頻,通過分析,得到裏面人員的動作行爲。 問題:可以定義爲一個分類問題,通過對預定的樣本進行分類訓練,解決一個輸入視頻的多分類問題。 這裏提出的問題是簡單的圖片(視頻)分類
原创 DenseNet:更接近於真實神經網絡的跨層連接
一. 提出背景 CVPR2017 的 Best Paper,簡單大氣上檔次! 論文:Densely Connected Convolutional Networks 【點擊下載】 Caffe代碼:【Gi
原创 目標檢測 - Tensorflow Object Detection API
一. 找到最好的工具 “工欲善其事,必先利其器”,如果你想找一個深度學習框架來解決深度學習問題,TensorFlow 就是你的不二之選,究其原因,也不必過多解釋,看過其優雅的代碼架構和工程化實現之後,相信這個問題不會有人再提,
原创 Mark 一些有意思的深度學習方向
1. VQA Visual Question Answering,給出一張圖片,就該圖片提出任何問題?自動get到你所期望的答案。 這屬於Visual Reasoning 的範疇,學者們不滿足於傳統的圖像識別、分割
原创 Facebook開源檢測工具包 Detectron (by Caffe2)
一. Detectron 特徵 大名鼎鼎的 FAIR 開發的軟件包,可以從【github】瞭解一下。 個人感覺比較有用的是 基於 ResNet 基礎框架的 Faster RCNN和Mask RCNN。
原创 深度網絡模型壓縮 - CNN Compression
一. 技術背景 一般情況下,CNN網絡的深度和效果成正比,網絡參數越多,準確度越高,基於這個假設,ResNet50(152)極大提升了CNN的效果,但inference的計算量也變得很大。這種網絡很難跑在前端移動設備上,除非網
原创 對抗網絡之目標檢測應用:A-Fast-RCNN
對抗網絡之目標檢測應用:A-Fast-RCNN 論文:A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection 【點擊下載】