Baby Talk and Neural Baby Talk

原創

2019-05-21 14:13

兩篇關於用類似完形填空方式做image captioning的文章。

1.Baby Talk: Understanding and Generating Image Descriptions[CVPR2011]。
2.Neural Baby Talk[CVPR2018]。code

文章列出了傳統baby talk， neural baby talk和主流encoder-decoder三種生成圖像描述方法的示意圖。

這個方法主要的思路是有現有的基於attention的方法生成一個sentence，這個sentence叫做template，然後利用Stanford lemmatization toolbox去判斷生成sentence中的visual word，最後再通過計算生成這個visual word過程中的attention map多對應bounding box與faster RCNN中所對應的bounding box之間的IOU，IOU大於0.5就選擇faster RCNN檢測對應的class即爲visual word，否則選擇原LSTM生成的visual word，得到visual word後，再判斷visual word的單複數和細粒度的類別，文章的framework如下所示。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

image caption研究進展

主要介紹image caption最近的幾篇文章，及其相關的應用。 1.Google NIC，Show and Tell: A Neural Image Caption Generator [CVPR2015]。code 2.H

2020-07-06 08:38:40

計算機視覺方向如何寫文章

一般學術論文主要分爲這8各方面。 1.Title 多看文章，看別人怎麼給題目起名字，短小精悍，描述自己方法和任務的同時，吸引讀者，題目最好帶一些熱點的詞彙比如revisit，graph，adversarial，reinforce

2020-07-06 08:38:40

Text2Colors: Guiding Image Colorization through Text-Driven Palette Generation

arxiv上面2018年4月13號更新的韓國高麗大學的關於跨媒體（NLP與CV結合）的文章，一作是個研究生，團隊主頁http://davian.korea.ac.kr，文章鏈接https://arxiv.org/pdf/1804.

2020-07-06 08:38:40

Actor and Action Video Segmentation from a Sentence

2020-02-20 18:05:59

跨媒體分析中的新任務

2018-12-24 03:15:27

如何寫文章

2018-10-27 12:23:39

ECCV2018比較有意思的paper

2018-09-26 11:21:49

文本圖像跨媒體檢索進展

2018-09-04 09:48:47

Learning Cross-modal Embeddings for Cooking Recipes and Food Images

2018-09-04 09:48:46

AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks

2018-09-04 09:48:46

Finding “It”: Weakly-Supervised Reference-Aware Visual Grounding in Instructional Videos

2018-09-04 09:48:46

Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

2018-09-04 09:48:46

Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge

2018-09-04 09:48:45

TALL: Temporal Activity Localization via Language Query

2018-09-04 09:48:45

Cross-Modal Retrieval in the Cooking Context：Learning Semantic Text-Image Embeddings

2018-09-04 09:48:45

24小時熱門文章

最新文章

最新評論文章