Video Classification with Channel-Separated Convolutional Netwroks 論文閱讀

論文地址:https://arxiv.org/abs/1904.02811

Github:https://github.com/facebookresearch/VMZ

論文思想:

這篇文章的主要出發點就是降低3D網絡的參數量,並且希望找到對於3D網絡來說哪些維度的信息是更重要的,以及如何平衡參數量和準確率。主要是藉助了分組卷積,通道分離的思想。並且提出了一個通道interactions的概念:

在這個圖中(a)的interactions爲4*6=24; (b)4*1 = 4 ; (c) 4*0 = 0;

作者設計了多個bottleneck, gc代表組卷積,dw代表深度可分離卷積

在kinetics數據集上面最好的結果有82.6%

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章