hin2vec 異質信息網絡表示學習個人筆記

原創

2019-05-21 15:40

hin2vec的思想其實挺簡單的

它學習兩種embedding，一種是對於節點的嵌入，一種是對於元路徑（meta path）的嵌入

（ps 作者在文中說如果要強調路徑的有向性，強調路徑開始節點和終止節點的不同，那麼可以擴展到三種embedding，對於路徑起始節點的嵌入，對於路徑終止節點的嵌入，對於元路徑的嵌入）

訓練流程如上。這是一個二分類網絡，輸出對於一定的x,y存在關係r的概率

x,y,r 分別代表路徑起始節點、路徑終止節點、元路徑的one-hot向量，𝑊_x′x 就是x對應節點的嵌入向量

這個模型的輸出是 o= 𝑠𝑖𝑔𝑚𝑜𝑖𝑑( ∑ 𝑊_𝑥′𝑥⊙𝑊_𝑦′𝑦⊙𝑓01(𝑊_𝑟′𝑟) )

從外到內

sigmoid是sigmoid函數

∑是求和

⊙是hadmard函數，也就是對向量的逐項相乘

f01是01標準化函數

損失函數就是一般的交叉熵損失

其實會讓人聯想到注意力機制（我不懂注意力），訓練過程中的r相當於一個query

另外用起來的話覺得比較不順手的一點就是對於不同的metapath在訓練時沒有權重分配。也就是說對於不同的特定任務hin2vec訓練得到的嵌入其實是有提升空間的

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

機器學習--Logistic Regression(scikit-learn_ 預測疝氣病症病馬死亡率問題)

據說，心情不好的時候，整理東西可以讓好心情迴歸，那麼同理，懶散得想要沉淪時候，總結知識可以召回學習的神龍。學習回顧：認識sklearn：scikit-learn，Python庫之一，Scipy（Scientific Pyt

2020-07-07 03:34:08

Detectron2源碼分析- demo-對象檢測

python demo/demo.py --config-file configs/COCO-InstanceSegmentation/mask_rcnn_R_50_FPN_3x.yaml --input 001.jpg –out

维民所止1226

2020-07-07 00:30:30

關鍵詞提取-TFIDF 自定義逆文檔IDF的值

TF-IDF 用於提取關鍵詞，那麼如何從多個文檔中提取出關鍵詞。文章的關鍵詞可能有什麼規律，表示文章主要意思，那這個詞應該在該文章中出現多次，但是在其他文章中出現次數不多。 TF 詞頻（Term Frequency）表示w在文檔

2020-07-06 22:43:56

條件隨機場CRF(Conditional Random Field)

⼀個重要的要求是，我們保留了推斷的⾼效算法，它與鏈的長度是線性關係。例如，這要求，在給定觀測的條件下，表⽰的後驗概率分佈的量在與轉移概率和發射概率相乘然後在上求和或積分之後，我們得到的上的概率分佈與上的概率分佈具有相同的函數

2020-07-06 21:30:11

lightgbm(gpu)在linux(centos7)安裝

#保證gpu是正常可用的： nvidia-smi nvcc -V #進入root權限，且python環境爲你正常使用環境，比如anaconda3，而不是python2.7 #依賴：sudo apt-get install --n

2020-07-06 10:25:20

極簡單Ubntu18.10安裝TF,Keras,PyTorch (cpu版)以及jupyter notebook並配置遠程訪問小記

1.安裝Anaconda Anaconda安裝基本大家都會很容易，直接在ubantu中打開瀏覽器在官網下載對應系統版本的.sh文件即可。然後使用sh命令安裝。 sudo sh /home/file_name/Ana

2020-07-05 16:20:01

彩票理論

神經網絡壓縮是人工智能落地過程中重要的一個環節。關於網絡壓縮的理論之前就已經有很多，比如，模型蒸餾，剪枝，量化，低秩矩陣近似等。彩票理論算是個令人耳目一新的觀點，值得看看。摘要：神經網絡修剪技術可以將訓練有素的網絡的參數數量減少90％

2020-07-05 08:54:49

實際使用中的神經網絡壓縮

引起這篇綜述的緣由是論文《Neural Network Distiller: A Python Package ForDNN Compression Research》，這種實用工具會使我對這一充滿希望的方向充值一點希望。除了Distil

2020-07-05 08:54:49

《機器學習原理算法應用》筆記

文章目錄簡介數學基礎算法基礎貝葉斯分類器決策樹k近鄰數據降維線性判別分析人工神經網絡支持向量機線性模型隨機森林Boosting深度學習卷積神經網絡循環神經網絡生成對抗網絡聚類半監督學習隱馬爾可夫模型條件隨機場強化學習工程實現相關

2020-07-04 07:32:17

完美解決 Spark：java.net.URISyntaxException: Relative path in absolute URI: file:D:/XXX/

windows下使用intellij 開發 spark mllib 程序發現如下錯誤。 var spark=SparkSession.builder().master("local").appName("test").getOrCre

2020-07-03 20:58:58

富數科技：“數據不出門，可用不可見” | 百萬人學AI評選

2020 無疑是特殊的一年，而 AI 在開年的這場”戰疫“中表現出了驚人的力量。站在“新十年”的起點上，CSDN【百萬人學AI】評選活動正式啓動。本屆評選活動在前兩屆的基礎上再度升級，設立了「AI優秀案例獎Top 30」、「AI新銳公

2020-07-03 19:59:31

機器學習2018-12-28

機器學習組成主要任務分類（classification）：將實例數據劃分到合適的類別中。應用實例：判斷網站是否被黑客入侵（二分類），手寫數字的自動識別（多分類）迴歸（regression）：主要用於預測數值型數據應用實

2020-07-03 14:03:40

推薦系統常用評估指標對比

制定評估指標是數據挖掘前期很重要的一步，一個好的評估指標要和關心的業務指標波動一致。這樣可以通過對比不同模型的評估指標，來評價模型在實際業務中的效果，加快模型迭代週期，降低線上成本。在推薦系統中評估指標可以分爲三類：分類指標，迴

2020-07-03 11:44:06

機器學習小白日記

“人生最痛苦的事情，不是我不行，而是我本可以”。 - --- ----- --- -------- ------- -------- --------- - --------- --- 閱讀目錄https://www.jianshu.co

2020-07-03 07:03:48

單變量線性迴歸實現波士頓房價預測

1、預測過程（1）、波士頓地區房價數據獲取，數據來自於sklearn自帶數據集；（2）、波士頓地區房價數據分割；（3）、訓練與測試數據標準化處理；（4）、使用最簡單的線性迴歸模型LinearRegression對房價進行預測。 2

2020-07-03 04:26:27

24小時熱門文章

最新文章

最新評論文章