台部落To_1

Tensor Tensor，又名張量，可以將它簡單的認爲是一個數組，支持高效的科學計算。它可以是一個數（標量）、一維數組（向量）、二維數組（矩陣）或更高維的數組（高階數據）。Tensor和numpy的array類似，但是Pytor

2020-06-18 22:18:52

摘要目前最先進的物體檢測網絡依靠區域提議（proposal）算法來假設物體的位置。 SPPnet [1]和Fast R-CNN [2]之類的進步減少了這些檢測網絡的運行時間，但也揭示了區域提議計算存在瓶頸。在這項工作中，我們引入

2020-06-18 22:18:52

摘要我們提出了一個單階段檢測框架，該框架解決了多尺度目標檢測和類不平衡的問題。我們沒有設計更深層的網絡，而是引入了一種簡單而有效的特徵豐富化方案來生成多尺度的上下文特徵。我們進一步引入了一種級聯的優化（精煉）方案，該方案首先將多

2020-06-18 22:18:52

1.回顧 1.1 RCNN 算法流程：使用Selective Search方法在輸入的每一張圖片上生成2000個左右的候選區域；對每個候選區域，使用深度卷積網絡提取特徵；特徵送入每一類的SVM分類器，判別是否屬於該類；使

2020-06-18 22:18:52

一、摘要本文首先通過實驗探索人羣遮擋對檢測器性能的傷害，然後提出了一種專門針對人羣場景的邊界框迴歸損失，稱爲排斥力。這種損失是由兩部分組成：目標的吸引力和周圍其他物體的排斥。***（就像磁鐵的同性相吸異性相斥）*** 排斥項可

2020-06-18 22:18:52

利用注意力模塊，爲每一個檢測到的人或物體生成注意力圖以突出顯示與任務相關的區域被接收論文地址： https://arxiv.org/pdf/1808.10437.pdf 1. 摘要本文提出了端到端可訓練的以實例爲中心的注

2020-06-12 13:37:51

基於長範圍時間結構（long-range temporal structure）建模，結合了稀疏時間採樣策略（sparse temporal sampling strategy）和視頻級監督（video-level superv

2020-06-10 01:16:14

雙流網絡的開篇之作，使用圖像和光流兩個分支訓練，最終綜合兩個分支得到最終結果。被NIPS 2014接收論文地址：https://arxiv.org/abs/1406.2199 1. 摘要本文研究了用於訓練視頻中行爲識別的

2020-06-10 01:16:14

本文解決的是減少推理計算的問題。本文收錄於CVPR2019 論文地址：https://arxiv.org/pdf/1911.11929.pdf 1. 摘要目前最先進的能夠在計算機視覺任務上取得非常好的結果的方法往往很大程度

2020-05-26 03:42:56

主要是解決DenseNet的檢測速度慢效率低的問題。本文被CVPR2019收錄論文地址：https://arxiv.org/abs/1904.09730 1. 摘要 DenseNet通過密集連接聚集不同的感受野來保存中間特

2020-05-20 20:19:21

1. 摘要邊界框迴歸是目標檢測的重要一步，現有用的最多的是使用L1/2-norm函數來計算損失，但是他不是非常適合評估指標（IOU）。因此後面有了IOU Loss和G-IOU Loss，但是這兩個依舊存在收斂慢、迴歸不準確的問題

2020-05-13 21:42:35

1. 摘要作者發現，採用相同的正負例選擇策略時，無論是基於box（anchor-based）的檢測器（本文以RetinaNet爲例）還是基於關鍵點的（anchor-free）檢測器（以FCOS爲例），性能幾乎一樣，也就是說正負例

2020-05-11 16:33:45

1. 摘要本文提出了一種全卷積的一階段目標檢測器（FCOS），以按像素預測的方式解決目標檢測，類似於語義分割。FCOS不含anchor，也不含proposal，所以他是Anchor-free的。總的來說，它是一種更加簡單靈活的檢

2020-05-10 14:45:09

1. 摘要對於人來說，一般不會固定的注視某個場景。取而代之的是，人眼四處走動，定位物體的部分信息以瞭解物體的位置。這種主動的感知移動過程稱爲saccade。受這種機制的啓發，本文提出了一種稱爲SaccadeNet的快速，準

2020-05-01 08:46:16

1. 摘要本文是一個Anchor-free的方法，是預測物體的左上角和右下角來替代anchor。本文是一個一階段目標檢測方法。思想來源於人體關鍵點檢測。本文主要貢獻有兩點：預測物體的左上角和右下角這一對角點引入Corne

2020-04-25 20:26:03