【NeurIPS 2022】視頻動作識別，AFNet 用更低的成本接收更多數據

原創

2023-02-20 21:23

出品人：Towhee 技術團隊顧夢佳

爲了避免大量的計算，現有的視頻動作識別方法通常會採樣幾幀來表示每個視頻，然而這往往會限制識別的性能。爲此，Ample and Focal Network（AFNet）提出兩個分支的結構，以用更少的計算量利用更多的視頻幀。在減少計算量的前提下，AFNet 依然能借助其中間特徵中的動態選擇強制執行隱式時序建模，成功實現更高的精度。此外，該方法還可以幫助用更低的成本減少空間冗餘。在五個公開的動作檢測數據集上進行大量實驗，AFNet 證明了其有效性和效率。

Architecture of AFNet

AFNet 雖然使用了更多視頻幀，但明智地從中提取信息以保持較低的計算成本。具體來說，該方法設計了一個雙分支結構，根據視頻幀的重要性進行區別對待。另外，它以自適應的方式處理特徵，以獲得提供強大的靈活性。Ample Branch 將以較低的分辨率和較小的通道尺寸處理所有的輸入特徵。它將所有的視頻幀作爲數據，通過壓縮計算獲得豐富的信息，並利用所提出的定位模塊爲 Focal Branch 提供指導。而 Focal Branch 壓縮時序大小以僅關注每個卷積塊的顯着幀。該分支只會針對導航模塊建議的顯着幀，計算其彩色特徵。兩個分支的結果在 AF 模塊的末尾自適應融合，防止信息丟失。

相關資料：

代碼地址：https://github.com/bespontaneous/afnet-pytorch
論文鏈接：Look More but Care Less in Video Recognition

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

DataGear 5.0.0 新特性之dgMap圖表選項

DataGear 企業版 1.1.0 已發佈！ http://datagear.tech/pro/ DataGear在新發布的 5.0.0 版本中，重構了地圖類圖表，新增了dgMap圖表選項，可以更方便靈活地設置圖表地圖。在 5.0.0

2024-04-26 21:42:31

6個實例帶你解讀TinyVue 組件庫跨框架技術

本文分享自華爲雲社區《6個實例帶你解讀TinyVue 組件庫跨框架技術》，作者：華爲雲社區精選。在DTSE Tech Talk 《手把手教你實現mini版TinyVue組件庫》的主題直播中，華爲雲前端開發DTSE技術佈道師阿健老師給

2024-04-26 10:33:20

MySQL 核心模塊揭祕 | 15 期 | 事務模塊小結

✍ 專欄小結 1 月 3 日，我在社區發佈事務模塊的第一篇文章；4 月 17 日，發佈了最後一篇文章。歷時 3 個半月，用 14 篇文章對事務模塊做了比較全面的介紹。本文我們對事務模塊已經發布的 14 篇文章做個簡單回顧。 01 期《事

2024-04-24 23:20:56

一則 TCP 緩存超負荷導致的 MySQL 連接中斷的案例分析

除了 MySQL 本身之外，如何分析定位其他因素的可能性？作者：龔唐傑，愛可生 DBA 團隊成員，主要負責 MySQL 技術支持，擅長 MySQL、PG、國產數據庫。愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註

2024-04-24 23:20:53

自學編程兩個月，現在我月入 4 萬元

這個外國小哥叫 Nico，他一開始是個編程小白，後來把自己關在房間裏花了兩個月時間學會了編程，如今正在開發一款名爲 Talknotes 的應用，可以將語音備忘錄轉化爲結構化的內容，月收入 5000 美元。 Nico 從高中畢業就開始創業，

2024-04-24 21:14:29

2024 開源數據工程生態系統全景圖

點擊藍字關注我們作者 | ALIREZA SADEGHI翻譯 | Debra Chen 01 簡介

2024-04-23 21:30:36

RAG 修煉手冊｜如何評估 RAG 應用？

如果你是一名用戶，擁有兩個不同的 RAG 應用，如何評判哪個更好？對於開發者而言，如何定量迭代提升你的 RAG 應用的性能？顯然，無論對於用戶還是開發者而言，準確評估 RAG 應用的性能都十分重要。然而，簡單的幾個例子對比並不能全面衡量

2024-04-23 21:20:22

MyDumper “喜歡” 觸發器麼？

是的，但現在它更“喜歡”它們，原因如下。介紹使用 LIKE 子句過濾特定表中的觸發器或視圖很常見。但是，它可能會欺騙您，特別是如果您看不到輸出（即在非交互式會話中）。讓我們看一個簡單的例子，以及如何以更可靠的方式處理任務。還有一個指向

2024-04-22 23:19:50

一次奇妙的任意用戶登錄實戰

剛剛進行了微信sessionkey的學習，正準備實戰一下，就發現了這個神奇的網站，預知後事如何。請繼續向下看去 1. 目標 2. 開局一個登錄框 3. 首先，直接弱口令走起來，萬一留有測試的賬號呢嘗試，1311111111，1333

2024-04-22 22:46:11

輕鬆復現一張AI圖片

輕鬆復現一張AI圖片現在有一個非常漂亮的AI圖片，你是不是想知道他是怎麼生成的？今天我會交給大家三種方法，學會了，什麼圖都可以手到擒來了。需要的軟件在本教程中，我們將使用AUTOMATIC1111 stable diffusio

2024-04-22 21:30:45

入職3年-我如何做一名AI產品經理

引言從2021年校招加入京東開始，我一直從事AI產品經理的工作，有幸見證了AI行業的熱情從一臺臺服務器燒到了全世界各個角落，也見證了京東AI中臺團隊的影響力如何一步步的擴大。從21年的迷茫到24年的堅定，很慶幸我正走在適合自己的道路上，

2024-04-22 11:16:31

推薦一個電視直播源檢測工具--live-streaming-m3u8-checker，檢測結果可以真正流暢播放

使用教程首先搜索直播源，存放到playlists文件夾下，支持txt和m3u播放列表；併到 https://ffmpeg.org/download.html#build-windows 這裏下載 ffmpeg.exe文件，放到當前

2024-04-21 00:46:42

MySQL 創建表後神祕消失？揭祕零寬字符陷阱

三招教你解決零寬字符陷阱，讓你的數據庫不再”鬧鬼“。作者：秦福朗，愛可生 DBA 團隊成員，負責項目日常問題處理及公司平臺問題排查。熱愛互聯網，會攝影、懂廚藝，不會廚藝的 DBA 不是好司機，didi~ 愛可生開源社區出品，原創內容未經

2024-04-19 23:21:06

寫給職場新人｜從迷茫到屢獲殊榮的技術人成長之路

在這個時代，技術的每一次飛躍都在重塑我們的工作方式。借Up技術人專欄活動寫了這篇文章，回望一下我和計算機打交道的這幾年，希望能給學生或職場新人們一些幫助。 1.錨定方向：學生生涯的一次探險如果用一個詞語概括我的本科階段，那大概就

2024-04-19 23:17:23

百度智能雲千帆AppBuilder重磅升級！工作流編排正式上線！AssistantsAPI開放邀測！

>>【v0.5.3版本】上線時間：2024/4/14 關鍵發版信息：低代碼態：新增工作流，低代碼製作組件自定義組件：支持用戶自定義創建組件，並被Agent自動編排調用工作流框架：組件支持流式編排、調試和發佈工作

2024-04-19 11:29:41

24小時熱門文章

最新文章

最新評論文章