原创 深度學習圖像分類(一)——AlexNet論文理解

0. 寫作目的 好記性不如爛筆頭。 1. 論文理解 1.1 ReLU 激活函數的使用 Rectified Linear Units(ReLU) 使用ReLU比使用tanh(或者sigmoid)激活函數收斂速度更快。下圖來自AlexNet論

原创 linux 使用技巧(不斷更新)(screen 和tmux的使用)

0. 寫作目的 好記性不如爛筆頭。 1. screen後臺運行程序 1.1 建立screen 使用XShell(windows)或者SSH(ubuntu)連接遠程終端,建立一個screen screen -S name ## name

原创 深度學習目標檢測(一)——YOLOV2論文細節理解

0. 寫作目的 好記性不如爛筆頭。說實話,YOLO的論文真心難明白,文獻[2]中解釋的很到位。 1. Better 與Fast R-CNN相比,YOLOv1 的錯誤分析顯示:YOLOv1有較低的召回率和迴歸框的錯誤。因此YOLOv2目的在

原创 如何判斷一個點在多邊形的內部

  1.  背景      給定任意多邊形(不一定是凸多邊形)的頂點座標(逆時針給出點的座標), 然後給定一點,判斷該點是否在多邊形內部?   2. 思路      使用 向量的叉乘(向量積)來進行計算。      向量積複習:  

原创 CCNet_Criss-Cross Attention for Semantic Segmentation

0. 寫作目的      好記性不如爛筆頭。 1. 主要思路      目前的self-attention需要生成 N * N 的affinity 矩陣(其中N = H * W), 作者提出存在一種更有效的方法?      因此作者提出了

原创 OCNet_Object Context Network for Scene parsing

0. 寫作目的     好記性不如爛筆頭。 1. 主要思想      使用self-attention引入同類的 object context map。 (感覺這個自監督,沒有CVPR2020中 CPNet更直觀)     如下圖:  

原创 ACNet_ Adaptive Context Network for Scene Parsing

0. 寫作目的     好記性不如爛筆頭。 1.  主要思想     在feature 中對於全局上下文和局部上下文引入不同的權重。 (個人感覺思想上,cvpr2020 中的 CPNet 引入同類和非同類的權重更好一些) 2. 模型的框架

原创 cvpr2020_SPNet_ Strip Pooling: rethinking spatial Pooling for Scene Parsing

0. 寫作目的     好記性不如爛筆頭。 1. 問題 目前的 spatial pooling 都是 N*N的,這會限制他們捕捉特徵。如分佈狹長的   2. 解決方法    使用1*k 和 k * 1的pooling。    同時結合

原创 PSPNet_ Pyramid Scene Parsing Network

0. 寫作目的     好記性不如爛筆頭。   1. 問題 ADE20K 數據集存在的一些問題: 1, 錯分: 圖2第一行,船被誤分爲車了。 如果使用了全局信息,則可以避免這種情況。 2。 迷惑的類別: 第二行,建築和摩天大樓。 3。 不

原创 FCN—— Fully Convolutional Networks for Semantic Segmentation

0. 寫作目的       好記性不如爛筆頭,爲了後續快速查看。   1.  模型架構:   其中上採樣爲線性插值。     融合策略爲: element sum      2.  評價指標:     There may be som

原创 GCN_large kernel matters_improving semantic seg by global conv network

0. 寫作目的      好記性不如爛筆頭。   1. 主要思想 分割需要對像素進行分類,同時精確定位,而這兩個任務是存在矛盾的。 作者發現 large kernel conv對於分割更有效。 主要是 使用1 * k + k *1  和

原创 cvpr2020_CPNet_ Context Prior for Scene Segmentation

0. 寫作目的:       好記性不如爛筆頭。   1. 問題    目前的方法很少區分,不同類之間的上下文依賴,這可能會影響精度。 如:   2. 解決方法 作者使用Context Prior 來同類和不同類的(類內和類間)的關係進

原创 refineNet_multi-path refinement network for high-resolution semantic seg

0. 寫作目的    好記性不如爛筆頭。   1.  問題 下采樣導致損失了細節信息。 2. 解決方法 高層的信息和低層的信息都有用。 作者對所有的信息都使用。   3. 模型 具體細節: 2x表示使用兩次 RCU。逐層進行使用re

原创 Google的yapf進行風格標準化

0. 目的        向github上傳 code前,使用Google的 yapf模塊(python)進行代碼格式的修改。 1. 使用方法      1.1 安裝: pip install yapf (python3) (對於py

原创 如何計算深度學習網絡中的感受野(Receptive Field)(以DenseBox中的網絡爲例)

  1. Receptive Field 計算方法 當前層的stride: 歷史所有層的stride的乘機 當前層的Receptive Field:  RF = last_RF + (ksize - 1) * history_stride