論文瀏覽(4) STH: Spatio-Temporal Hybrid Convolution for Efficient Action Recognition


0. 前言

  • 相關資料:
  • 論文基本信息
    • 領域:行爲識別
    • 作者單位:西安交大&騰訊
    • 發表時間:2020.3

1. 要解決什麼問題

  • 行爲識別模型要解決的就是對空間信息建模(temporal modeling)的問題……
  • 還是那些老問題:
    • 雙流法耗時、佔用硬盤。
    • 3D卷積計算量太大,2D卷積不能很好的對temporal建模。
  • 現在主要都是在模型準確率與模型大小之間做權衡。

2. 用了什麼方法

  • 提出了Spatio-Temporal Hybrid(STH)block,用於提到普通的卷積操作。
    • STH Conv可以同時提取時間與空間信息。
  • 2D/3D/(2+1)D/STH 的結構比較
    • 這圖比較抽象,感覺作者是抽象派畫家。
    • 畢竟是抽象畫,所以可能理解不對,我猜這圖的意思是介紹2D-Conv Block/3D-Conv Block/(2+1)D-Conv Block/STH Block 的基本結構。
      • 2D-Conv Block:先1*1*1卷積,再1*3*3卷積,最後1*1*1卷積。
      • 3D-Conv Block:先1*1*1卷積,再3*3*3卷積,最後1*1*1卷積。
      • (2+1)D-Conv Block:先1*1*1卷積,再1*3*3卷積,接着3*1*1卷積,最後1*1*1卷積。
      • STH Block:先1*1*1卷積,再同時進行1*3*3/3*1*1卷積,最後1*1*1卷積。
    • image_1e9ultdq3svk1h2p6ki1360i1t2d.png-215.4kB
    • 所謂的 Temporal Convolution、Spatial Convolution 在本圖中有說明。
      • 輸入特徵圖尺寸一般爲 N, T, C, H, W
      • 所謂Temporal Convolution就是在T通道上進行特徵融合(T通道卷積核尺寸爲3,H, W通道卷積核尺寸爲1)
      • 所謂Spatial Convolution就是對H, W通道進行特徵融合(H, W通道卷積核尺寸爲3,T通道卷積核尺寸爲1)
  • STH結構介紹
    • 圖中 H, W 合併爲一個維度。
    • Spatio-Temporal Hybrid Convolution,翻譯成中文應該是 時空混合卷積。
    • 也就是說,在一個STH block中,會將一個普通的卷積轉換爲若干個Temporal/Spatial Convolution,如下圖中,一次普通卷積按照C通道分爲4部分,分別進行Temporal/Spatial卷積操作。
    • image_1e9un2lvo1s998ae1pesf0u13ke2q.png-199kB
  • STH的實現細節
    • 上圖中給出的STH結構,就是下圖的(a)結構。
    • image_1e9v0ve73c0p1kc4sj11pah55j37.png-117.5kB
  • 如何融合時間、空間特徵:
    • 普通直接按位加,也可以搞個注意力網絡啥的。
    • image_1e9v2ngndga6c1416bc1i0j16md5r.png-77.9kB
  • STH的計算效率
    • 從FLOPs上看,STH比普通的Spatial Convolution要少一些。
    • image_1e9v1sr1k5b11jbq1slq19n1vbl3k.png-113.7kB
  • STH網絡
    • image_1e9v23mne1jqgp2a1kq2d31ged5e.png-101.2kB

3. 效果如何

  • 從模型準確率看,STH與其他SOTA模型差距不大。
    image_1e9ukubp9132h1tc71lo9peo3fp16.png-158.4kB
    image_1e9ukul0pk121ptb1afi1e151col1j.png-206kB
    image_1e9ukutrc1en81t6l1qquo1c1ogm20.png-230.6kB
  • 這裏比較了幾個模型在1080ti上的執行效率,感覺對比TSM也沒有太大優勢。
    image_1e9ukoedm18vhmno4ta20j1bsi9.png-116.6kB

4. 還存在什麼問題

  • 論文本身的idea挺有意思,但感覺效果好像並沒有什麼特別之處。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章