原创 DeepID2 "Deep Learning Face Representation by Joint Identification-Verification"

降低類內方差,提升類間方差一直是人臉識別的熱點。論文將人臉識別和驗證損失同時監督網絡的訓練,在LFW上獲得99.15%的驗證準確率。人臉識別是對輸入圖像分類,驗證是判斷一對圖像是否爲同一個ID。 分類信號具有豐富的ID相關信息,或者類間方

原创 MegDet: A Large Mini-Batch Object Detector

分類網絡如ReseNet-50的mini-batch尺寸已經很大了,如8192或16000.但檢測網絡的mini-batch尺寸確很小,如2-16。小的batch尺寸有什麼問題?一是訓練時間長,二是無法爲BN提供精確的統計信息。三是正負樣

原创 目標檢測“Cascade R-CNN: Delving into High Quality Object Detection”

目前的目標檢測器主要使用IOU=0.5定義正負樣本,這通常會產生很多接近負樣本的檢測結果。但檢測性能又會隨着IOU的提高而下降,主要是由於:1)IOU提高,正樣本數量減少,出現訓練過擬合;2)檢測器最優時IOU與輸入假設時inferenc

原创 姿態估計“2D/3D Pose Estimation and Action Recognition using Multitask Deep Learning”

提出了用於2D/3D姿態估計,及行人行爲分析的多任務框架。姿態估計一般做的事熱點估計,需要使用argmax函數復原座標,破壞了端到端的BP鏈。 姿態估計使用迴歸的方法,擴展Soft-argmax函數用於處理2D/3D姿態迴歸。姿態估計網

原创 行人姿態估計源碼AlphaPose

機器環境:ubuntu16.04,cuda8.0 1.torch&tensorflow 版本 源碼地址:https://github.com/MVIG-SJTU/AlphaPose 首先跑的是torch版本,安裝了torch和tensor

原创 行人屬性“Attribute Recognition by Joint Recurrent Learning of Context and Correlation”

應該是比較新的屬性學習文章了,ICCV2017。在監控場景中進行行人屬性的識別,主要遇到的挑戰是圖像質量差,外形變化及屬性可能在不同的空間位置,標記的訓練樣本少。論文提出JRL模型挖掘屬性上下文信息及屬性間相互關係提升識別準確率。JRL在

原创 多任務學習“Rotating Your Face Using Multi-task Deep Neural Network”

多任務學習框架,在保持人臉ID同時將任意姿態和光照人臉旋轉到目標姿態,目標姿態可以人爲控制。通過使用人造的控制姿態的圖像,提取姿態及光照不變的特徵,用於人臉識別,在MultiPIE數據庫上比較。 論文通過訓練一個DNN網絡,將一幅人臉和一

原创 Multi-task Learning

Deep Learning 回顧之多任務學習 https://www.52ml.net/20775.html?utm_source=tuicool&utm_medium=referral 深度神經網絡的多任務學習概覽(An Overvi

原创 開源代碼文獻

持續跟新 可以看看這個 http://blog.csdn.net/workerwu/article/details/46537849 Deep Residual Networks Deep Residual Learning for I

原创 多任務學習“DEEP MULTI - TASK REPRESENTATION LEARNING : A TENSOR FACTORISATION APPROACH”

多任務深度學習結構通常是一個黑科技,由設計者決定哪些層共享。論文在深度網絡的每一層學習任務間的共享結構,基於矩陣分解泛化技術進行tensor分解,實現端到端的深度網絡信息共享。該方法可以用於同類和不同類的多任務學習。 由設計者定義的深度多

原创 多任務學習“Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics”

多任務學習系統的性能很大程度上依賴於任務間的損失權值。手動調節權值非常耗時耗力,論文提出使用任務間的同方差不確定性給每個損失函數賦權。模型由單一圖像同時學習像素級深度迴歸、語義及實例分割。場景理解的多任務學習在機器人領域比較實用,多個任務

原创 多任務學習“Fine-grained Recognition in the Wild: A Multi-Task Domain Adaptation Approach”

精細圖像分類需要大量樣本標記,但有些樣本不容易標記。論文使用容易標記的樣本,研究domain adaptation解決易獲取樣本與自然場景樣本數據集轉換的問題。這其中多任務的屬性學習被用來提升性能。 論文要解決的問題示例,先獲取有標記的樣

原创 人體姿態”RMPE: Regional Multi-Person Pose Estimation“

多人姿態估計新興研究方向,論文方法RMPE包含三個部分,即,對稱空間變換網絡(SSTN)、參數化的姿態非極大值抑制及姿態引導的proposal生成器(PGPG)。 多人姿態識別的方法有兩步結構、part-based的結構兩種。其中兩步結構

原创 姿態估計及跟蹤“Detect-and-Track: Efficient Pose Estimation in Videos”

基於行人檢測和視頻理解,估計及跟蹤人體關鍵點。首先在單幀或短視頻剪輯估計關鍵點,然後使用輕量級網絡生成關鍵點的估計。單幀的估計使用Mask-RCNN,3D Mask-RCNN。在PoseTrack上對比,MOTA爲51.8%。 相關工作

原创 姿態跟蹤“Pose Flow: Efficient Online Pose Tracking ”

複雜場景下多人關節姿態跟蹤,論文設計了一個在線的優化網絡建立幀間姿態關係,並形成姿態流,此外設計了一個姿態流非極大值抑制減少冗餘姿態流,重新建立時間上不相交姿態的聯繫。實驗在兩個姿態跟蹤數據庫上Pose Tracking datasets