Word2Vec 模型
NNLM 模型(是不是在預測下一個詞,副產品是詞向量)
Word2Vec 模型:專門做詞向量
- CBOW
- Skip-gram
![image-20220614193540503](../../Library/Application Support/typora-user-images/image-20220614193540503.png)
apple,蘋果,
ELMo
elmo 解決多義詞問題
ELMo(專門做詞向量,通過預訓練)
不只是訓練一個 Q 矩陣,我還可以把這個次的上下文信息融入到這個 Q 矩陣中
左邊的 LSTM 獲取 E2 的上文信息,右邊就是下文信息
x1,x2, x4,x5 --> Word2Vec x1+x2+x4+x5 ---> 預測那一個詞
獲取上下文信息後,把三層的信息進行一個疊加
E1+E2+E3 = K1 一個新的詞向量 \(\approx\) E1
E2,E3 相當於兩個上下文信息
E1+E2+E3+E4
K1 包含了第一個詞的詞向量包含單詞特徵、句法特徵、語義特徵
怎麼用
E2,E3 不同,E1+E2+E3 不同
apple --》 我吃了一個 蘋果 -- 》 [1,20,10]
apple --》我在用蘋果手機 --》[1,10,20]
LSTM 無法並行,長期依賴
Attention