原创 《Relation Networks for Object Detection》筆記

Introduction 上下文信息或對象之間的關係有助於對象識別。該論文提出了一個對象關係模塊,類似於自然語言處理的注意力機制。該對象關係模塊使用對象的外貌特徵和幾何特徵。後者模擬對象之間的空間關係,僅考慮它們之間的相對幾何關係

原创 《Deformable part-based fully convolutional network for object detection》筆記

Introduction 該論文參照傳統目標檢測方法DPM,在基於R-FCN的基礎上,給網絡添加了檢測目標的部分形變的功能。把目標分成k×kk \times kk×k個網格部分,考慮到目標的各個部分在不同的場景下可能會發生形變或位

原创 《Semi-Supervised Pedestrian Instance Synthesis and Detection with Mutual Reinforcement》筆記

Motivation 該論文的內容是行人實例檢測,針對的問題是數據集只有部分數據有標註,其他大部分數據沒有標註,即半監督(semi-supervised)學習研究的內容。該論文使用GAN來生成行人實例樣本,訓練一個行人類別分類器,

原创 《Adapting Object Detectors via Selective Cross-Domain Alignment》筆記

Introduction 深度卷積網絡模型的性能非常依賴數據集。如果數據集的數據分佈與現實生活的數據分佈一致,深度模型能夠表現出優異的性能。但是,現有的基礎數據集只覆蓋了有限範圍內的場景。在現實世界的模型部署中,環境條件的變化,比

原创 《Focal loss for dense object detection》筆記

目標檢測中,類別不平衡問題很嚴重,特別是背景類和其他目標類的不平衡。一階算法在一張圖片上大概會評估104−10510^4-10^5104−105個候選位置,只有一些位置含有objects。訓練樣本類別不平衡會影響訓練效果,導致分類

原创 《FreeAnchor: Learning to Match Anchors for Visual Object Detection》筆記

Introduction 在目標檢測中,從圖片上預測出一些region proposals,這些region proposals會與預先設置好的anchors進行匹配,匹配的方式是nms,超過給定IoU閾值就匹配,否則不匹配。這種

原创 《Self-Supervised Difference Detection for Weakly-Supervised Semantic Segmentation》筆記

Intorduction 該論文講述如何用弱監督的方法訓練語義分割器。弱監督方法沒有強監督信息,比如ground truth。在這篇論文裏,語義分割的樣本標籤只有圖片的分類類別。已經有許多方法能夠從分類信息中生成語義分割的mask

原创 《Scale-Aware Trident Networks for Object Detection》筆記

Introduction 特徵金字塔有一個缺點,它每層的特徵都是由不同的參數卷積得到的,這樣做犧牲了不同尺度下特徵的一致性,這會減低訓練數據的影響和在每個尺度下有過擬合的風險。這篇論文的目標就是生成對所有尺度都有效率的有統一表徵能

原创 《Imbalance problems in object detection: A review》筆記

簡介 論文《Imbalance problems in object detection: A review》對目標檢測中的不平衡問題做了綜合的敘述。該論文對目標檢測的不平衡問題做了系統性的分類,根據相關的輸入屬性,把不平衡問題劃

原创 《GhostNet: More Features from Cheap Operations》筆記

GhostNet Introduction GhostNet是從模型設計方面精簡卷積神經網絡模型。 Motivation 卷積神經網絡模型得到的特徵中有許多特徵是冗餘的。比如下圖是ResNet-50的第一個殘差塊得到的特徵圖,紅色

原创 適用於目標檢測的數據增強方法

論文《Learning Data Augmentation Strategies for Object Detection》研究了適用於目標檢測的數據增強策略。該論文的思路和《AutoAugment: Learning Augme

原创 《DropBlock: A regularization method for convolutional networks》筆記

Introduction Dropout的思想是隨機失活一部分激活單元,讓輸出的feature或feature map丟失一些信息,使得網絡能夠關注更多的有辨別能力的特徵,而不是隻關注某幾個特徵,從而使得網絡更加魯棒,從另一方面來

原创 《Libra R-CNN: Towards Balanced Learning for Object Detection》筆記

Introduction 這篇論文針對目標檢測訓練過程中的不平衡問題,提出了一種平衡化學習方法。關於目標檢測中的不平衡問題,這篇博客有更詳細的介紹。 這篇論文討論的不平衡問題包括三種: 樣本級別的不平衡:對於二階段的目標檢測算法

原创 《The graph neural network model》筆記

Introduction 該論文應該是最早的講GNN的論文。該論文的主要工作是實現一個轉導(transduction)函數,把圖GGG或者結點nnn映射到一個m維的嵌入向量:τ(G,n)∈Rm\tau(G,n) \in \math

原创 《Inductive representation learning on large graphs》筆記

Introduction 這篇論文介紹了一種圖卷積網絡(Graph convolution network),該論文的圖卷積方法很容易理解,沒有涉及傅里葉變換。論文的出發點是爲圖中每個結點計算得到一個低維嵌入向量。已有的基於因式分