Video Classification with Channel-Separated Convolutional Netwroks 論文閱讀

原創

2020-07-02 12:36

論文地址：https://arxiv.org/abs/1904.02811

Github：https://github.com/facebookresearch/VMZ

論文思想：

這篇文章的主要出發點就是降低3D網絡的參數量，並且希望找到對於3D網絡來說哪些維度的信息是更重要的，以及如何平衡參數量和準確率。主要是藉助了分組卷積，通道分離的思想。並且提出了一個通道interactions的概念：

在這個圖中(a)的interactions爲4*6=24；（b）4*1 = 4 ; (c) 4*0 = 0;

作者設計了多個bottleneck, gc代表組卷積，dw代表深度可分離卷積

在kinetics數據集上面最好的結果有82.6%

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

動作識別——action recognition新手入門

定義行爲識別似乎是圖像分類任務到多個幀的擴展，然後聚合來自每幀的預測背景傳統方法，視頻輸入=》特徵提取=》特徵融合=》特徵分類=》分類結果深度學習方法，單流法，雙流法，基於骨架特徵提取，ROI提取表示傳統方法 DT（D

2020-07-07 20:22:22

動作識別——Multi-Model Domain Adaptation for Fine-Grained Action Recognition——CVPR2020 oral

Abstract Fine-grained action recognition datasets exhibit environmental bias, where multiple video sequences are c

2020-07-07 19:25:33

註解版：基於動態骨骼的動作識別方法ST-GCN（時空圖卷積網絡模型）

原文鏈接：解讀：基於動態骨骼的動作識別方法ST-GCN（時空圖卷積網絡模型）在本文中，通過將圖卷積網絡擴展到時空圖模型，設計用於行爲識別的骨骼序列通用表示，稱爲時空圖卷積網絡（ST-GCN）。如圖 2 所示，該模型是在骨骼圖

2020-07-07 11:11:25

基於時空圖卷積模型的分析歸納

名稱 ST-GCN 目的解決基於人體骨架關鍵點的人類動作識別問題優點 1、空間關係利用人類關節空間關係理解人類行爲2、層次性ST-GCN 的層次性消除了手動劃分部分或遍歷規則的需要。這不僅能獲得更強的表達能力

2020-07-07 11:11:22

圖卷積-動作識別-姿態預測三篇論文歸納

名稱 Actional-Structural Graph Convolutional Networks forSkeleton-based Action Recognition Convolutional Neural Ne

2020-07-07 11:11:21

Temporal Pyramid Network for Action Recognition（CVPR2020）

Abstract 視覺節奏表徵了動作的動態和時間尺度。對不同動作的這種視覺節奏進行建模有助於動作的識別。以前的工作通常通過以多種速率採樣原始視頻，並構建輸入級幀金字塔來捕獲視覺節奏，而幀金字塔通常需要昂貴的多分支網絡來處理。本文提出了一種

2020-07-05 17:06:48

Action Snippets: How many frames does human action recognition require?閱讀筆記 - 人體動作識別

Paper Reading Note URL: https://www.vision.ee.ethz.ch/publications/papers/proceedings/eth_biwi_00532.pdf TL;DR 採用了一

2020-06-23 08:33:16

Two-Stream Convolutional Networks for Action Recognition in Video

Two-Stream Convolutional Networks for Action Recognition in Video 我們提出了一種有區分訓練的卷積網絡來識別視頻中的動作。挑戰是從視頻幀中獲取外觀和運動的互補的信息。我們的

2020-06-21 08:43:04

基於Motion Vector的實時動作識別

論文：Real-time Action Recognition with Enhanced Motion Vector CNNs Github: https://github.com/zbwglory/MV-release 201

2020-06-16 08:52:06

SlowFastNet(SlowFast) finetune(微調)

SlowFastNet github(最近放出來的): https://github.com/facebookresearch/SlowFast 配置環境要求： https://github.com/facebookresearc

2020-06-16 02:48:51

3D CNN(視頻分類網絡)無預訓練權重訓練難以收斂問題在各視頻分類網絡論文中的解決綜合(train from scratch)(更新中)

問題：視頻分類網絡像two stream i3d等都是直接在作者給的預訓練權重上finetune自己的數據，然後在訓練集上訓練至過擬合。基本隨便一個圖像分類網絡在任意一個數據集的訓練集上都能收斂，但自己直接使用一個恆定的學習率來

2020-06-16 02:48:51

VidSage: Unsupervised Video Representational Learning with Graph Convolutional Networks個人論文筆記

模型主要從視覺和語義上編碼一個視頻：通過預訓練的圖像特徵提取器提取視覺特徵，再通過GCN變體來傳播背景信息，獲取視頻語義 3D CNN, LSTM, GCN(提取每幀人的關節作爲關鍵點後產生的圖像來預測動作) 1.介紹通過GCN

2020-06-16 02:48:51

FASTER Recurrent Networks for Efficient Video Classification論文筆記

通常可以從兩個方面減少視頻分類任務的時間，一是通過減少網絡結構計算量，二是通過減少推理時如何結合每個clip通過網絡得到預測；本文使用第二種方法爲了減少推理時的計算量，根據本身一個常規的clip特徵提取網絡(會比較重量級，用於提

2020-06-16 02:48:51

X3D: Expanding Architectures for Efficient Video Recognition個人論文筆記

2020-04-18 13:21:51

吃了這些數據集和模型，跟 AI 學跳舞，做 TensorFlowBoys

超神經HyperAI

2019-05-22 16:25:05

24小時熱門文章

最新文章

最新評論文章