2020年, VideoQA论文汇总

原創

2020-07-08 08:07

目录

CVPR2020：CRN

CVPR2020：CRN

题目
Hierarchical Conditional Relation Networks for Video Question Answering
下载链接
动机
VideoQA的两个难点：1. 提取动态视觉信息和关系信息。2. 将提取到的信息与语言概念进行关联。现有的QA视频建模方法是构建神经结构，其中每个子系统要么是为特定的定制目的设计的，要么是为特定的数据模态设计的。所以，这些模型结构不能适应数据模态的变化、视频长度的变化、或问题类型的变化。
贡献

新的视频表示方法
可用于视频文本交互的building block

方法
本文提出的CRN block如下图所示：

CRN的流程为：

本文的整体框架为：

本文的层次化CRNs主要分为四层：1. 编码clip之间的帧，context: clip motion。2. 聚合linguistic信息。3. 编码不同的clip，context: video motion。4. 聚合linguistic信息。
实验
在TGIF-QA数据集上的实验结果：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【CVPR2020】Fast Soft Color Segmentation

Fast Soft Color SegmentationSoft Color Segmentation 什麼是軟顏色分割Fast Soft Color Segmentation 快速軟色彩分割01 Introduction02 M

2020-06-22 22:52:56

2020北京智源大会图神经网络专题总结

目錄引言[1] 基於感知和認知系統的邏輯關係推理作者介紹分享內容system1 和 syetem2 reasoningGMNN: Graph Markov Neural Networks (ICML2019)Probabilist

2020-07-06 14:22:03

CVPR 2020 HAN:《Hypergraph Attention Networks for Multimodal Learning》论文笔记

目錄簡介動機貢獻方法實驗簡介本文提出了一種用於多模態學習的超圖注意力網絡，作者來自Kakao公司和首爾大學。 Kakao公司的主要產品是Kakao talk，類似於國內的微信，且騰訊是其第二大股東。 Kakao Brain這個

2020-07-04 09:51:10

CVPR 2020 《Transform and Tell: Entity-Aware News Image Captioning》论文笔记（数据集）

目錄簡介動機貢獻方法實驗簡介本文是新聞圖像標註，和常見的Image Captioning任務不太一樣。下載鏈接 News Image Captioning中沒有object-level的標註，難點在於，將text和image

2020-07-04 09:51:10

CVPR 2020 《Context-Aware Group Captioning via Self-Attention and Contrastive Features》论文笔记（数据集）

目錄簡介動機貢獻方法實驗簡介本文提出了一個新任務——Group Captioning，就是在一堆圖片中，對特定的幾個圖片生成caption，生成的caption要具備選定的圖片的特性，且不包含其他未選定的圖片的特性。下載鏈接

2020-07-04 09:51:10

KDD 2017 《ReasoNet: Learning to Stop Reading in Machine Comprehension》论文笔记

目錄簡介動機貢獻方法實驗簡介本文面向機器閱讀理解問題（Machine Reading Comprehension），作者來自微軟研究院。下載鏈接動機現有的方法可以分爲兩類：單步推理（Single turn）、多步推理（m

2020-07-04 09:51:10

CVPR 2020 《Local-Global Video-Text Interactions for Temporal Grounding》论文笔记

目錄簡介動機貢獻方法實驗簡介本文的作者來自浦項科技大學和首爾大學下載鏈接動機在Grounding領域，早些的方法都可以歸結爲scan-and-localize framework，主要包括兩個步驟：1. 生成propos

2020-07-04 09:51:10

2020-07-07 CVPR2020 i3DV论文讨论（3）笔记

目錄[1] PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization[2] Height and U

2020-07-08 08:07:23

2020-07-02 CVPR2020 V&L论文讨论（3）笔记

目錄[1] Bi-directional Relationship Inferring Network for Referring Image Segmentation[2] A Real-Time Cross-modality

2020-07-04 10:30:59

2020-07-03 CVPR2020 i3DV论文讨论（2）笔记

目錄[1] Context Prior for Scene Segmentation[2] Deep Stereo using Adaptive Thin Volume Representation with Uncertaint

2020-07-04 09:51:10

2020CVPR深度估计

論文收集方法檢索了所有帶depth的標題的論文，爭取沒有遺漏的篩選深度估計相關論文下面進行分類單純有監督深度估計 uncertainty aware cnns for depth completion: uncertain

2020-07-04 00:21:19

Pose-guided Visible Part Matching for Occluded Person ReID阅读笔记

Paper：https://arxiv.org/abs/2004.00230 Code：https://github.com/hh23333/PVPM 前言：本人閱讀的第二篇CVPR 2020關於ReID的論文。主要解決了遮擋行人重識別的

不甘现状的咸鱼却没办法

2020-07-02 14:14:11

[CVPR2020] StarGAN v2

目錄網絡改進具體結構GeneratorDiscriminatorStyle EncoderMapping network損失函數Adversarial objectiveStyle reconstructionStyle dive

2020-07-01 22:29:46

CVPR2020 | 小样本学习论文合辑

前言根據openaccess cvpr2020給出的文章列表，根據關鍵詞查詢文章，並且下載論文。以下是我根據few-shot 和 few這兩個作爲關鍵字查詢得到的文章列表文章列表 FSS-1000: A 1000-Class

2020-06-29 18:52:23

大合集！CVPR2020论文分方向整理: 目标检测/图像分割/姿态估计等，附打包下载（持续更新）

CVPR2020在2月24日公佈了所有接受論文ID，相關報道：1470篇！CVPR2020結果出爐，你中了嗎？（附部分論文鏈接/開源代碼/解讀）。自論文ID公佈以來，許多開發者都分享了自己的優秀工作。從論文ID公佈以來，極市一直

2020-06-21 18:32:19

24小時熱門文章

最新文章

最新評論文章