CVPR2018一篇關於Visual Question Answering Tricks的文章,作者是2017 VQA Challenge冠軍團隊成員之一,paper連接https://arxiv.org/abs/1708.02711,作者的homepage https://www.damienteney.info/adventures。
文章要做的事情:
visual question answer
method
文章的framework如下所示。
主要思路是用bottom-up attention方式得到很多的proposal,然後在用Top-down attention學習這些proposal的權重。