【MOTS】Learning a Spatio-Temporal embedding for video instance segmentation

原創

2020-06-19 14:16

Purpose

把特徵映射到高維做聚類，加上自監督的訓練得到的圖片的Depth信息結合來做VIS

Pipline

用ResNet18作爲Encoder，得到每一幀的feature x_t；然後用3D卷積，把前後兩者特徵再濾波得到z_t；z_t通過Decoder（2個分支，每個分支7層卷積，3個upsample，Embedding分支的output通道數爲p，Depth通道數爲1）

訓練時計算作者設計的loss

inference等會再說

Loss

首先看前面三項，是針對Embedding的分支。具體如下：

La是讓每個pixel i 的embendding y_i更接近其類別中心μ_k；

Lr是讓不同類的中心離得更遠，也即不同instance更分離；

Lreg是一個正則項。

在看Depth分支，具體計算參考https://blog.csdn.net/weixin_41024483/article/details/87992248

主旨就是通過把當前幀重建到源幀（比如前一幀），再用重建的源和源做對比進行優化，進而間接的優化Depth。

這個loss如下：

最後把兩個分支loss相加得到最終loss

Inference

對於每一個新的幀，我們首先使用mask network生成背景mask，然後使用mean shift對前景embedding進行聚類，發現每個簇對應一個實例的密集區域。跟蹤實例只需要比較新分割實例與以前分割實例的mean embedding。小於ρr的距離表示匹配。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

AAAI 2020 收錄的百度騰訊優圖螞蟻金服的論文

會議官網：https://aaai.org/Conferences/AAAI-20/ 關注公衆號code4fun，回覆 “百度28” ，打包下載會議收錄的百度研究院的論文。注：暫缺3篇，已標註，後續更新。百度28篇論文清單，來自

2020-07-08 08:24:13

基於深度學習的惡意 URL 識別

基於深度學習的惡意 URL 識別原文作者：陳康, 付華崢, 向勇原文期刊：計算機系統應用,2018,27(6):27–33 原文鏈接：http://www.c-s-a.org.cn/1003-3254/6370.html

2020-07-07 20:13:37

基於PU-Learning的惡意URL檢測

基於PU-Learning的惡意URL檢測原文作者：Ya-Lin Zhang, Longfei Li, Jun Zhou, Xiaolong Li, Yujiang Liu, Yuanchao Zhang, Zhi-Hua Zh

2020-07-07 20:13:37

基於機器學習的惡意URL識別--選自《通信技術》

基於機器學習的惡意URL識別原文作者：李澤宇，施勇，薛質原文期刊：信息安全與通信保密雜誌社選自《通信技術》2020年第二期 2020-03-10 原文鏈接：https://www.secrss.com/articles/

2020-07-07 20:13:37

A Deep Learning Approach to Fast, Format-Agnostic Detection of Malicious Web Content

一種快速、不區分格式的檢測惡意Web內容的深度學習方法作者：fish@DAS 原文作者：Joshua Saxe(主頁[1]), Richard Harang, Cody Wild, Hillary Sanders 原文標題：A

2020-07-07 20:13:37

ApproxANN——神經元關鍵性分析

ApproxANN: An Approximate Computing Framework for Artificial Neural Network 主要是解讀自己閱讀的這篇論文裏的3.1節部分——神經元關鍵性分析定義關鍵性

2020-07-07 13:28:57

論文閱讀：Meta-Learning in Neural Networks: A Survey

題目：Meta-Learning in Neural Networks: A Survey 論文地址：https://arxiv.org/abs/2004.05439 作者：Timothy Hospedales, Antreas Ant

2020-07-07 02:03:34

論文閱讀：A Baseline for Few-Shot Image Classification

題目：A Baseline for Few-Shot Image Classification 論文地址：https://arxiv.org/abs/1909.02729v2 作者：Guneet S. Dhillon, Pratik C

2020-07-07 02:03:34

跨領域遷移的連貫性模型（ACL 2019）

本文爲ACL 2019的論文A Cross-Domain Transferable Neural Coherence Model的讀後感。 1. 論文主旨本文主要是面向跨領域的連貫性建模的相關研究。採用的是一個局部判別模型，可以

2020-07-06 04:27:44

【論文閱讀】【綜述】從Optical Flow到Scene Flow

文章目錄Optical FlowFlowNet（2015ICCV）FlowNet2.0（2017CVPR）PWCNet（2018CVPR）MaskFlowNet（2020CVPR）Sene FlowPoint-basedPoint

2020-07-06 04:03:20

對Visualizing and Understanding Convolutional Networks的一些理解

本文通過引入CNN網絡的可視化技術分析AlexNet網絡結構，主要告訴我們CNN的每一層到底學習到了什麼特徵，讓我們在調參、改進網絡結構的時候提供一定的參考。 CNN網絡性能的顯著提高，得益於三個因素：（1）大量的帶標註的訓練數據

2020-07-05 22:19:52

01.Optimal,Sampling-Based Manipulaiton

本論文爲2017 ICRA的5篇最佳操作機械手論文之一。在實際應用中，機械臂的路徑規劃存在如下問題，目前還沒有哪個規劃方案能同時解決上述三個問題： 1、抓取、放置和其他動作的連續性； 2、運動規劃的完備

2020-07-05 21:02:30

求最大李雅普諾夫指數（Largest Lyapunov Exponents，LLE）的 Rosenstein 算法

文章目錄原始論文python 相關代碼混沌系統的常見指標最大李亞普諾夫指數的含義算法流程圖python 代碼模塊最近鄰maximum Lyapunov exponentRANSAC 擬合曲線例子：計算洛倫茲系統的最大李雅普諾夫指數

2020-07-05 17:46:29

IOTFUZZER: Discovering Memory Corruptions in IoT Through App-based Fuzzing

IOTFUZZER: Discovering Memory Corruptions in IoT Through App-based Fuzzing 隨着越來越多的物聯網設備進入消費市場，迫切需要在攻擊者之前檢測其安全漏洞。現有的

2020-07-05 14:36:27

匈牙利算法計算GED

time:2020.5.20 文章標題《approximate graph edit distance computation by means of bipartite graphs matching》 GED計算通常構建一個搜

2020-07-05 12:25:18

24小時熱門文章

最新文章

最新評論文章