厚顏無恥的要個贊
Attention
優點:
- 解決了長序列依賴問題
- 可以並行
缺點:
-
開銷變大了
-
既然可以並行,也就是說,詞與詞之間不存在順序關係(打亂一句話,這句話裏的每個詞的詞向量依然不會變),即無位置關係(既然沒有,我就加一個,通過位置編碼的形式加)
位置編碼的問題
爲什麼需要位置編碼
位置編碼怎麼做的
具體做法
做法 1
做法 2
爲什麼這麼做有用
pos+K=5,我在計算第 5 個單詞的位置編碼的時候
pos=1,k=4
pos=2,k=3
優點:
缺點:
開銷變大了
既然可以並行,也就是說,詞與詞之間不存在順序關係(打亂一句話,這句話裏的每個詞的詞向量依然不會變),即無位置關係(既然沒有,我就加一個,通過位置編碼的形式加)
位置編碼的問題
做法 1
做法 2
pos+K=5,我在計算第 5 個單詞的位置編碼的時候
pos=1,k=4
pos=2,k=3