Word2Vec模型精簡和本質

原創

2020-06-24 21:56

1. 模型框架

CBOW模型，上下文預測中心詞，目標函數爲
Skip-gram模型，中心詞預測上下文，目標函數爲

2. Hierarchical Softmax

藉助CBOW訓練模型，得到詞向量

2.1 CBOW模型

輸入層：2c個上下文context(w)的詞向量
投影層：2c個向量求和累加
輸出層：huffman樹和sigmoid函數（一開始就將詞彙建立了一個huffman樹）

從根節點到足球，共經歷四次分支，每次分支可看做是一次二分類，即將一個節點進行分類，分到左邊是負類，分到右邊是正類。
一個節點被分爲正類的概率是（後續要優化）

被分爲負類的概率是

$x_w^{T}是足球這個葉子節點的詞向量表達，\Theta 是非葉節點對應的向量$

最後的結果是將四次的分類相乘

因此，條件概率的一般公式可以寫成

其中，

或者寫成整體表達式

代入下列公式，得到

將內核表示成

上面就是CBOW模型的目標函數
目前需要做的就是將這個函數最大化，因此使用隨機梯度上升法

霍夫曼樹上每一步的

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

DeepWalk算法

隨機遊走冪律分佈前提：如果一個網絡的節點服從冪律分佈，那麼節點在隨機遊走序列中的出現次數也服從冪律分佈，並且實證發現NLP中單詞的出現頻率也服從冪律分佈。 DeepWalk算法 DEEPWALK(G,w,d,γ,t)

2020-06-24 21:56:53

基於邊採樣的網絡表示模型

1. 整體過程 2.sigmoid 函數求導過程

2020-06-24 21:56:53

網絡節點表徵學習

2020-06-24 21:56:53

LINE 方法部分

本文有很多問題，LINE方法暫時略過 1. 一階相似性聯合概率：一階相似性實質上是一個sigmoid function函數，向量越接近，點積越大，聯合概率越大（有點硬扯）經驗概率：兩點之間邊的權值越大，經驗概率越大爲了保持一

2020-06-24 21:56:42

word2ve的python源碼解析

#!/usr/bin/env python # -*- coding: utf-8 -*- # # Author: Shiva Manne <[email protected]> # Copyright (C) 2018 R

2020-06-24 21:56:42

機器學習典型算法包含的步驟

訓練過程：已知輸入，根據輸出，運用梯度下降等方法調整參數。驗證過程（使用過程）：最後的效果是根據輸入和中間參數，得到輸出，使輸出最接近現實情況詞向量：訓練過程的中間參數，即中間產物，類似的詞其詞向量也應該類似。一般方法：

2020-06-24 21:56:42

Graph embedding techniques, applications, and performance: A survey 論文閱讀和理解

1. 圖嵌入的分類： 1.1基於矩陣分解 1.2基於隨機遊走 1.2.1 DeepWalk：通過隨機遊走保留了高階屬性 https://blog.csdn.net/qq_32294855/article/details/89006

2020-06-24 21:56:42

gensim之word2vec用法總結

初始化模型 >>> from gensim.test.utils import common_texts, get_tmpfile >>> from gensim.models import Word2Vec >>> >>> pa

2020-06-24 21:56:42

負採樣方法

1. 負採樣方法高頻詞被採樣的概率大，低頻詞被採樣的概率小 2. CBOW模型在這裏插入圖片描述 3. Skip-Gram模型上下文預測當前詞，所以要最後一起更新 CBOW 輔助向量，並不是真正的向量

2020-06-24 21:56:42

基於異構網絡節點表示的推薦系統（HERec）

2020-02-21 22:13:21

metapath2vec：異構網絡的可擴展表示學習

2020-02-21 22:13:20

DeepWalk算法

隨機遊走冪律分佈前提：如果一個網絡的節點服從冪律分佈，那麼節點在隨機遊走序列中的出現次數也服從冪律分佈，並且實證發現NLP中單詞的出現頻率也服從冪律分佈。 DeepWalk算法 DEEPWALK(G,w,d,γ,t)

2020-06-24 21:56:53

基於邊採樣的網絡表示模型

1. 整體過程 2.sigmoid 函數求導過程

2020-06-24 21:56:53

網絡節點表徵學習

2020-06-24 21:56:53

LINE 方法部分

本文有很多問題，LINE方法暫時略過 1. 一階相似性聯合概率：一階相似性實質上是一個sigmoid function函數，向量越接近，點積越大，聯合概率越大（有點硬扯）經驗概率：兩點之間邊的權值越大，經驗概率越大爲了保持一

2020-06-24 21:56:42

24小時熱門文章

最新文章

最新評論文章