14 Positional Encoding (爲什麼 Self-Attention 需要位置編碼)


厚顏無恥的要個贊

Attention

優點:

  1. 解決了長序列依賴問題
  2. 可以並行

缺點:

  1. 開銷變大了

  2. 既然可以並行,也就是說,詞與詞之間不存在順序關係(打亂一句話,這句話裏的每個詞的詞向量依然不會變),即無位置關係(既然沒有,我就加一個,通過位置編碼的形式加)

位置編碼的問題

爲什麼需要位置編碼

位置編碼怎麼做的

img

具體做法

做法 1

img

做法 2

img

爲什麼這麼做有用

pos+K=5,我在計算第 5 個單詞的位置編碼的時候

pos=1,k=4

pos=2,k=3

img
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章