原创 【文章閱讀】The Devil is in the Decoder【計算機視覺中的上採樣方式-6種】

一、這是google的一篇探索的文章,探討decoder結構的一篇文章 二、主要貢獻點      1、 探討了不同的幾種decoder的優劣,提出自己的上採樣方案      2、 提出針對上採樣的residual connection

原创 【姿態估計文章閱讀】Structured Feature Learning for Pose Estimation

一、年份2016、港中文的文章 二、代碼https://github.com/chuxiaoselena/StructuredFeature 用的是caffe,可視化出來的結構比較複雜不好展示,就不放圖片了 三、核心思想:      

原创 【姿態估計文章閱讀】Human Pose Estimation with Iterative Error Feedback【這篇文章看的雖然有點迷糊,但是最後有一點很重要,自適應scale】

          一、這是伯克利的大哥哥們在2016年發的一篇文章,也算是CNN的姿態估計,上升比較快的那幾年。 二、其實核心思想很像GBDT,一步步的去擬合殘差。但是,不一樣肯定是不一樣的!放一張好看的圖,GBDT的。        

原创 【姿態估計文章閱讀】PifPaf: Composite Fields for Human Pose Estimation

一、CVPR2019,內容上還是比較厲害的,代碼:https://github.com/vita-epfl/openpifpaf 二、主要思想        1、提出了Part Intensity Field (PIF)來提升heatm

原创 【文章解讀】FreeAnchor: Learning to Match Anchors for Visual Object Detection

一、簡介      這些年已經有不少基於深度學習的目標檢測的文章了,從最開始的Anchor based 到後來的 Anchor Free。但是解讀這篇文章,主要是由於他的出發點比較新穎---Free Anchor。      雖然叫Fre

原创 pytorch loss 出現nan,原因之一,計算圖中存在torch.sqrt或者 **0.5,以及如何解決

今天寫一個loss函數 dist=torch.sqrt(x*x+y*y) loss=soomthL1loss(dist,gt_dist) 我隨便寫的幾句示意代碼,這樣會導致在第一個iteration之後出現nan,第一次iteratio

原创 【姿態估計文章閱讀】Single-Stage Multi-Person Pose Machines【依圖科技】

一、今年ICCV2019剛出爐的文章,顏水成教授團隊的,非官方代碼:https://github.com/murdockhou/Single-Stage-Multi-person-Pose-Machines 二、這篇文章核心思想    

原创 【姿態估計文章閱讀】Efficient Object Localization Using Convolutional Networks【大佬文,每一個實驗都值得一看】

一、這是大佬們的一篇文章,算是比較早的利用CNN預測heatmap來做姿態估計的文章,上傳時間2015年。 二、這篇文章的核心思想:        1、pooling層能爲網絡增強一些“局部不變性”、“旋轉不變性”之類的能力,也能降低參數

原创 【姿態估計文章閱讀】Joint Training of a Convolutional Network and a Graphical Model for Human Pose Estimation

一、這是毫無疑問的大佬們的文章,2014年出就發佈了第一版本,代碼:https://github.com/max-andr/joint-cnn-mrf 二、文章的核心思想        1、利用CNN做姿態估計,採用heatmap的方式來

原创 【簡單的Pytorch迴歸模型案例】CNN去除隨機噪聲--修復2d高斯分佈【pytorch demo】

  一、這是個Pytorch學習案例,可以根據這個案例寫自己的模型 二、代碼 1、導入相關模塊 import torch from torch import nn import torchvision import numpy as

原创 【文章閱讀visual granding】GuessWhat?! Visual object discovery through multi-modal dialogue

一、文章主要有兩個貢獻點       1、建立了基於對話的visual granding數據集       2、給出了基於深度學習的baseline model 二、數據集 這是數據集中的兩個例子,可以發現每一張圖有一個instance

原创 Pytorch 在訓練NLP相關模型中的一些BUG

1、RuntimeError: Expected `len(lengths)` to be equal to batch_size, but got 9 (batch_size=18)  這個問題,有很多人討論。主要是涉及到使用 nn.

原创 【論文閱讀】【AlexNet】【dropout】ImageNet Classification with Deep Convolutional Neural Networks

     一、這是AlexNet,雖然是很多年前的網絡了,但是在今天依然有着舉足輕重的地位!特別是其中的思想,非常關鍵! 二、主要思想       1、採用了非飽和神經元(通過Relu-非飽和非線性函數)        2、多GPU拆分計

原创 【論文閱讀】Deep Residual Learning for Image Recognition 【ResNet】

           一、論文來自於凱明大哥的團隊,這也是近幾年來大多數計算機視覺任務,網絡baseline的基礎 二、核心思想       1、如何個去構建更深層的網絡,因爲之前的一些工作證明了,網絡層次的加深有助於提高模型的性能。但是

原创 【CNN感受野計算】python 示例含蓋 vgg alexnet rtpose等

一、感受野       layer 1 : kernel size:3*3 stride:1       layer2 :kernel size:3*3 stride:1       第一層的感受野就是卷積核大小 3*3 ,第二層感受野是