image caption筆記（五）：《Knowing When to Look: Adaptive Attention》

原創

2020-06-04 11:05

本質上仍然是對attention機制的改進。在每一個時刻，模型決定更依賴圖像視覺信息或者語言模型。

一、模型結構：

（1）對原本的attention機制做改進

原本的attention機制：

是第i個位置的圖像特徵，是softmax歸一化之後的t時刻的權重

詳細看博客《image caption筆記（三）：show,attend and tell》

原本的attention機制每一個時刻的上下文變量由圖像特徵和得到，然後生成當前時刻的。與、前一個時刻的輸出（當前時刻的輸入）結生成下一個單詞的概率。

做出的改動爲：

先生成由圖像特徵和得到。其餘不變。

也就是上下文變量由根據前一個時刻的隱藏態生成變爲根據當前時刻的隱藏態生成。

（2）在上面的attention機制上，加入adaptive機制。

attention機制中表達了在某一個時刻，對圖像不同位置的關注度。

那麼我們現在還需要一個東西，來表達這個時刻對語言模型前面信息的關注度。我們知道是細胞狀態，貫穿整個lstm,包含了語言模型t時刻之前的信息。

建立一個哨兵機制（我更願意稱呼它爲哨兵門，因爲定義和 LSTM中門的定義很像）

每一個時刻和共同產生預測結果

二、總結

仍然是對attention的改進，每一個時刻對圖像特徵和語言模型確定一下偏向性。

（1）改進attention機制

（2）設計了哨兵門

利用控制對二者的關注程度

（3）爲了確定，重新設計了計算圖像特徵權重的softmax分類器。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

image caption筆記（二）：《Show and Tell : A Neural Image Caption Generator》

2020-06-04 11:05:43

image caption筆記（三）：《Show, Attend and Tell_Neural Image Caption》

2020-06-04 11:05:43

image caption筆記(一)：RNN、LSTM和GRU的理解

2020-06-04 11:05:32

image caption筆記（六）：《self_critical (scst)》

2020-06-04 11:05:32

image caption筆記（四）：《Image Captioning with Semantic Attention》

2020-06-04 11:05:32

image caption筆記（五）：《SCA-CNN》

2020-06-04 11:05:32

image caption筆記（七）：《Bottom-Up and Top-Down Attention》

2020-06-04 11:05:32

Image captioning with visual attention（TF2.0基於注意機制的圖像字幕）

2020-05-23 02:28:41

Positional encodings

2020-02-21 23:41:20

畢業前的計劃

2020-02-20 13:43:42

subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: java: java

在運行coco計算ImageCaption得分時，出現以下錯誤： subprocess.py報錯：FileNotError: [Errno 2] No such file or directory: 'java': 'java' 原因：

清晨的光明

2020-07-08 02:37:26

面向遙圖像數據的Image Caption研究附源碼

面向遙感圖像數據的Image Caption 相關理論知識請參見其他文章，這裏只從工程角度進行描寫，重點是源代碼。參考網址： 1.面向遙感圖像的Image caption 數據集：【乾貨】讓遙感圖像活起來：遙感圖像描述生成的模型與數據

Jerry_liu20080504

2020-06-15 20:10:19

image caption筆記（二）：《Show and Tell : A Neural Image Caption Generator》

2020-06-04 11:05:43

image caption筆記（三）：《Show, Attend and Tell_Neural Image Caption》

2020-06-04 11:05:43

image caption筆記(一)：RNN、LSTM和GRU的理解

2020-06-04 11:05:32

24小時熱門文章

最新文章

最新評論文章