Finding “It”: Weakly-Supervised Reference-Aware Visual Grounding in Instructional Videos

這是CVPR2018 Oral的一片關於Weakly-Supervised Video Grounding的文章,paper連接http://ai.stanford.edu/~dahuang/papers/cvpr18-ramil.pdf,作者的homepage http://ai.stanford.edu/~dahuang/,code暫時沒有被released出來。
文章要做的事情:
輸入:sentence+video         輸出:bounding box(train的時候沒有bbox ground truth)
文章中show出來的example如下所示。
example
文章在兩個datasets上面的實驗結果如下所示。
results

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章