【MVOS】Efficient Video Object Segmentation via Network Modulation

原創

2020-06-19 16:20

論文地址：http://openaccess.thecvf.com/content_cvpr_2018/papers/Yang_Efficient_Video_Object_CVPR_2018_paper.pdf

有代碼！

Motivation

本文是semi-supervised的方法。最近有很多方法是在已有標註的視頻幀上finetune出結果，所以作者想提出單一forward的網絡segment instance object in video。

Pipline

網絡的主體是“Segmentation Net”，Backbone是VGG16，作者在倒數四層每一層都加了一個“Modulator”，每個Modulator包括一個“Visual M”和“Spatial M”。

Visual Modulator

把visual guide frame（annotated first frame）輸入網絡（VGG16），並通過全鏈接，輸出scalar個數爲對應Segmentation Net最後4層通道數數。相當於學習Segmentation Net最後4層每個通道數的weight，每個通道學到的參數記作：

Spatial Modulator

把pre-mask變成一個2維高斯分佈的heatmap，記作，用於添加一個location信息，會做下采樣來和Segmentation Net最後四層的feature map 的尺寸對齊。同時還會對每次下采樣的heatmap做一個防縮和平移(用一個1x1的卷積實現)：

Modulator

因此結合兩者，可以得到每一層的輸出：

Implementation details

作者也是先在image dataset上pretrain（stage1），再在video dataset（DAVIS2017）上finetune20 epoch。

Result

作者做了對比實驗，-B實驗是隻在image 上pretrain，-M實驗是作者在這兩個網絡最後一層加上作者設計的Modulator

就搞不懂作者說的FT是怎麼樣的

2020年01月08日

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AAAI 2020 收錄的百度騰訊優圖螞蟻金服的論文

會議官網：https://aaai.org/Conferences/AAAI-20/ 關注公衆號code4fun，回覆 “百度28” ，打包下載會議收錄的百度研究院的論文。注：暫缺3篇，已標註，後續更新。百度28篇論文清單，來自

2020-07-08 08:24:13

基於深度學習的惡意 URL 識別

基於深度學習的惡意 URL 識別原文作者：陳康, 付華崢, 向勇原文期刊：計算機系統應用,2018,27(6):27–33 原文鏈接：http://www.c-s-a.org.cn/1003-3254/6370.html

2020-07-07 20:13:37

基於PU-Learning的惡意URL檢測

基於PU-Learning的惡意URL檢測原文作者：Ya-Lin Zhang, Longfei Li, Jun Zhou, Xiaolong Li, Yujiang Liu, Yuanchao Zhang, Zhi-Hua Zh

2020-07-07 20:13:37

基於機器學習的惡意URL識別--選自《通信技術》

基於機器學習的惡意URL識別原文作者：李澤宇，施勇，薛質原文期刊：信息安全與通信保密雜誌社選自《通信技術》2020年第二期 2020-03-10 原文鏈接：https://www.secrss.com/articles/

2020-07-07 20:13:37

A Deep Learning Approach to Fast, Format-Agnostic Detection of Malicious Web Content

一種快速、不區分格式的檢測惡意Web內容的深度學習方法作者：fish@DAS 原文作者：Joshua Saxe(主頁[1]), Richard Harang, Cody Wild, Hillary Sanders 原文標題：A

2020-07-07 20:13:37

ApproxANN——神經元關鍵性分析

ApproxANN: An Approximate Computing Framework for Artificial Neural Network 主要是解讀自己閱讀的這篇論文裏的3.1節部分——神經元關鍵性分析定義關鍵性

2020-07-07 13:28:57

論文閱讀：Meta-Learning in Neural Networks: A Survey

題目：Meta-Learning in Neural Networks: A Survey 論文地址：https://arxiv.org/abs/2004.05439 作者：Timothy Hospedales, Antreas Ant

2020-07-07 02:03:34

論文閱讀：A Baseline for Few-Shot Image Classification

題目：A Baseline for Few-Shot Image Classification 論文地址：https://arxiv.org/abs/1909.02729v2 作者：Guneet S. Dhillon, Pratik C

2020-07-07 02:03:34

跨領域遷移的連貫性模型（ACL 2019）

本文爲ACL 2019的論文A Cross-Domain Transferable Neural Coherence Model的讀後感。 1. 論文主旨本文主要是面向跨領域的連貫性建模的相關研究。採用的是一個局部判別模型，可以

2020-07-06 04:27:44

【論文閱讀】【綜述】從Optical Flow到Scene Flow

文章目錄Optical FlowFlowNet（2015ICCV）FlowNet2.0（2017CVPR）PWCNet（2018CVPR）MaskFlowNet（2020CVPR）Sene FlowPoint-basedPoint

2020-07-06 04:03:20

對Visualizing and Understanding Convolutional Networks的一些理解

本文通過引入CNN網絡的可視化技術分析AlexNet網絡結構，主要告訴我們CNN的每一層到底學習到了什麼特徵，讓我們在調參、改進網絡結構的時候提供一定的參考。 CNN網絡性能的顯著提高，得益於三個因素：（1）大量的帶標註的訓練數據

2020-07-05 22:19:52

01.Optimal,Sampling-Based Manipulaiton

本論文爲2017 ICRA的5篇最佳操作機械手論文之一。在實際應用中，機械臂的路徑規劃存在如下問題，目前還沒有哪個規劃方案能同時解決上述三個問題： 1、抓取、放置和其他動作的連續性； 2、運動規劃的完備

2020-07-05 21:02:30

求最大李雅普諾夫指數（Largest Lyapunov Exponents，LLE）的 Rosenstein 算法

文章目錄原始論文python 相關代碼混沌系統的常見指標最大李亞普諾夫指數的含義算法流程圖python 代碼模塊最近鄰maximum Lyapunov exponentRANSAC 擬合曲線例子：計算洛倫茲系統的最大李雅普諾夫指數

2020-07-05 17:46:29

IOTFUZZER: Discovering Memory Corruptions in IoT Through App-based Fuzzing

IOTFUZZER: Discovering Memory Corruptions in IoT Through App-based Fuzzing 隨着越來越多的物聯網設備進入消費市場，迫切需要在攻擊者之前檢測其安全漏洞。現有的

2020-07-05 14:36:27

匈牙利算法計算GED

time:2020.5.20 文章標題《approximate graph edit distance computation by means of bipartite graphs matching》 GED計算通常構建一個搜

2020-07-05 12:25:18

24小時熱門文章

最新文章

最新評論文章