Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

這是CVPR2018 Oral的一篇關於 Image Captioning和Visual Question Answering的文章,paper鏈接https://arxiv.org/abs/1707.07998,作者的homepage http://www.panderson.me/,code已經被released出來了https://github.com/peteanderson80/bottom-up-attention
文章要做的事情:
image caption + visual question answer
文章中show出來的關於image caption和visual question answer的實驗結果。
example caption
example VQA

這篇文章的實驗結果很好, 2017 VQA Challenge第一名,image caption方面也與很多最新的方法進行了比較,文章列出了很多trick,但framework沒有講清楚,沒看明白,以後再看看。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章