1、DeepWalk
[DeepWalk] DeepWalk- Online Learning of Social Representations (SBU 2014)
word2vec是基於序列進行embedding;但是,實際上實體之間的關係越來越複雜化、網絡化。這個時候sequence embedding------>graph embedding。
圖的定義:
G=(V,E),Evv
兩大塊內容:
1、構建序列;------->隨機遊走,截斷隨機遊走
2、word2vec訓練;------>Skip-gram
2.模型特點:
文章開創性的提出了隨機遊走 + skipGram的形式對節點進行表達,後續大量工業界對emb的應用都是參照這種形式進行的。
deepWalk的核心思想就是分爲兩步:
(1)通過關係網絡圖構建隨機遊走序列;
(2)把生成的序列通過skip-Gram的形式記性表示,將每個節點都能夠表示在同一個空間中。文章對於算法效果的評定主要是通過對於幾個網站的用戶進行多標籤分類的任務。
實驗結果顯示,提升效果比較明顯,同時在訓練數據比較少的情況下本算法也能夠有較好的表現。
優勢:
數據量比較稀疏的時候依然能夠有很好的表現
支持大規模在線執行預測
能夠實現並行化操作
應用到的算法和公式都是基於語言模型的。
文章提出瞭如果能夠直接得到訓練序列,也不一定需要進行隨機遊走這個過程。
3.參考文獻:
simrank:https://www.cnblogs.com/pinard/p/6362647.html
https://zhuanlan.zhihu.com/p/45167021
https://www.cnblogs.com/pinard/p/7243513.html
原論文:http://www.perozzi.net/publications/14_kdd_deepwalk.pdf
論文翻譯:https://www.jianshu.com/p/5adcc3d94159
應用參考文獻:https://yq.aliyun.com/articles/716011