原创 Pytorch入門第二課之Tensor

Tensor Tensor,又名張量,可以將它簡單的認爲是一個數組,支持高效的科學計算。它可以是一個數(標量)、一維數組(向量)、二維數組(矩陣)或更高維的數組(高階數據)。Tensor和numpy的array類似,但是Pytor

原创 論文翻譯之Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

摘要 目前最先進的物體檢測網絡依靠區域提議(proposal)算法來假設物體的位置。 SPPnet [1]和Fast R-CNN [2]之類的進步減少了這些檢測網絡的運行時間,但也揭示了區域提議計算存在瓶頸。在這項工作中,我們引入

原创 論文翻譯之Enriched Feature Guided Refinement Network for Object Detection

摘要 我們提出了一個單階段檢測框架,該框架解決了多尺度目標檢測和類不平衡的問題。我們沒有設計更深層的網絡,而是引入了一種簡單而有效的特徵豐富化方案來生成多尺度的上下文特徵。我們進一步引入了一種級聯的優化(精煉)方案,該方案首先將多

原创 論文筆記之Faster R-CNN

1.回顧 1.1 RCNN 算法流程: 使用Selective Search方法在輸入的每一張圖片上生成2000個左右的候選區域; 對每個候選區域,使用深度卷積網絡提取特徵; 特徵送入每一類的SVM分類器,判別是否屬於該類; 使

原创 論文筆記之Repulsion Loss: Detecting Pedestrians in a Crowd

一、摘要 本文首先通過實驗探索人羣遮擋對檢測器性能的傷害,然後提出了一種專門針對人羣場景的邊界框迴歸損失,稱爲排斥力。 這種損失是由兩部分組成:目標的吸引力和周圍其他物體的排斥。***(就像磁鐵的同性相吸異性相斥)*** 排斥項可

原创 論文筆記之ICAN

利用注意力模塊,爲每一個檢測到的人或物體生成注意力圖以突出顯示與任務相關的區域 被接收 論文地址: https://arxiv.org/pdf/1808.10437.pdf 1. 摘要 本文提出了端到端可訓練的以實例爲中心的注

原创 論文筆記之TSN

基於長範圍時間結構(long-range temporal structure)建模,結合了稀疏時間採樣策略(sparse temporal sampling strategy)和視頻級監督(video-level superv

原创 論文筆記之Two-Stream Convolutional Networks for Action Recognition in Videos

雙流網絡的開篇之作,使用圖像和光流兩個分支訓練,最終綜合兩個分支得到最終結果。 被NIPS 2014接收 論文地址:https://arxiv.org/abs/1406.2199 1. 摘要 本文研究了用於訓練視頻中行爲識別的

原创 論文筆記之CSPNet

本文解決的是減少推理計算的問題。 本文收錄於CVPR2019 論文地址:https://arxiv.org/pdf/1911.11929.pdf 1. 摘要 目前最先進的能夠在計算機視覺任務上取得非常好的結果的方法往往很大程度

原创 論文筆記之VOVNet

主要是解決DenseNet的檢測速度慢效率低的問題。 本文被CVPR2019收錄 論文地址:https://arxiv.org/abs/1904.09730 1. 摘要 DenseNet通過密集連接聚集不同的感受野來保存中間特

原创 論文筆記之D-IOU Loss

1. 摘要 邊界框迴歸是目標檢測的重要一步,現有用的最多的是使用L1/2-norm函數來計算損失,但是他不是非常適合評估指標(IOU)。因此後面有了IOU Loss和G-IOU Loss,但是這兩個依舊存在收斂慢、迴歸不準確的問題

原创 論文筆記之ATSS

1. 摘要 作者發現,採用相同的正負例選擇策略時,無論是基於box(anchor-based)的檢測器(本文以RetinaNet爲例)還是基於關鍵點的(anchor-free)檢測器(以FCOS爲例),性能幾乎一樣,也就是說正負例

原创 論文筆記之FCOS

1. 摘要 本文提出了一種全卷積的一階段目標檢測器(FCOS),以按像素預測的方式解決目標檢測,類似於語義分割。FCOS不含anchor,也不含proposal,所以他是Anchor-free的。總的來說,它是一種更加簡單靈活的檢

原创 論文筆記之SaccadeNet: A Fast and Accurate Object Detector

1. 摘要 對於人來說,一般不會固定的注視某個場景。 取而代之的是,人眼四處走動,定位物體的部分信息以瞭解物體的位置。 這種主動的感知移動過程稱爲saccade。 受這種機制的啓發,本文提出了一種稱爲SaccadeNet的快速,準

原创 論文筆記之CornerNet

1. 摘要 本文是一個Anchor-free的方法,是預測物體的左上角和右下角來替代anchor。本文是一個一階段目標檢測方法。思想來源於人體關鍵點檢測。 本文主要貢獻有兩點: 預測物體的左上角和右下角這一對角點 引入Corne