1401 位置編碼公式詳細理解補充


Self-Attention:對於每個詞而言都是無位置關係,把每個詞的順序打亂,得到的注意力值依然不變

通過 t1 告訴你,x1 是在前面,x2 在 x1 的後面

位置編碼

img

位置編碼公式

img

位置編碼怎麼用

img

位置編碼底層解釋

img
sin(pos+k) = sin(pos)*cos(k) + cos(pos)*sin(k)  # sin 表示的是偶數維度
cos(pos+k) = cos(pos)cos(k) - sin(pos)*sin(k)  # cos 表示的是奇數維度

他特別在 pos+k 是 pos 和 k 的線性組合

我愛你 ,現在我做第三個詞 “你” 的位置編碼

pos = 3 = 1+2
pos + k = 3 =  1+2 = 1*2+1*2

pos = 10
1+9,2+8,3+7

這句話變成 “你愛我”,現在我們仍然做第三個詞 “我” 的位置編碼

pos = 3 = 1+2
pos + k = 3 =  1+2 = 1*2+1*2
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章