論文筆記之Learning Deep Representations for Graph Clustering

原創

2020-02-25 04:14

本篇論文是2014年AAAI的一篇論文。

思想也比較簡單，主要是採用SAE（棧式自編碼）無監督學習的形式，在graph上進行node embedding，將embedding得到的每個node的vector做爲輸入，進行graph cluster。論文中採用的是最常用的k-means方法來cluster。

算法如下：
step1 得到graph的n*n的鄰接矩陣S和度矩陣D

step2 將D’S作爲SAE的輸入，實際上是graph有n個node，作爲n個sample的訓練集輸入到 SAE中，每個sample的feature的維度是n表示該點與其他各點的連接情況。

step3 訓練SAE，文中採用的是稀疏自編碼的棧式形式。（自編碼器一般都採用lbfgs的最優化策略來bp，效率和效果較好）

step4 取棧底的AE的hidden層的vector作爲node embedding的結果

step5 將embedding結果作爲k-means的輸入，進行graph cluster，最後用nmi來評價cluster的結果

優點：
1.速度快，相比於譜聚類（涉及了EVD）
2.對於稀疏圖而言，SAE有更好的表達效果
3.SAE更易於擴展成更deep的structure

缺點：
1.需要遍歷所有的node，存儲所有node的鄰接點信息，對於big graph 可能在效率上不怎麼work
2.只是考慮了1-hop的信息，embedding的效果可能不夠好

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

論文筆記之Structural Deep Network Embedding

本論文是kdd2016的一篇論文主要的目的也是做node embedding。主要的想法就是通過deep autoencode對node進行embedding，不過在在embedding的時候不僅考慮了1-hop的信息而且考慮

2020-07-08 10:23:34

神經網絡動量因子

其中動量係數一般取（0,1），直觀上理解就是要是當前梯度方向與前一步的梯度方向一樣，那麼就增加這一步的權值更新，要是不一樣就減少更新。更詳細的介紹參見《DeepLearning最優化方法之Momentum（動量）》

2020-07-08 10:23:34

Deep Learning 之參數初始化

本文僅對常見的參數初始化方法進行總結（大部分內容來自deep learning一書），原理性的問題不進行過多的探討。 Deep Learning中參數初始化十分重要，一般來說有以下這些原因： 1.初始點的選取，有時候能夠決定算法

2020-07-08 10:23:34

BERT預訓練模型的演進過程！(附代碼)

文章目錄1. 什麼是BERT2. 從Word Embedding到Bert模型的發展2.1 圖像的預訓練2.2 Word Embedding2.3 ELMO2.4 GPT2.5 BERT2.5.1 Embedding2.5.2 M

2020-07-07 14:42:00

Transformer各層網絡結構詳解！面試必備！(附代碼實現)

文章目錄1. 什麼是Transformer2. Transformer結構2.1 總體結構2.2 Encoder層結構2.2.1 Positional Encoding2.2.2 Self-Attention2.2.3 Multi

2020-07-07 14:42:00

XLNet預訓練模型，看這篇就夠了！(代碼實現)

文章目錄1. 什麼是XLNet2. 自迴歸語言模型（Autoregressive LM）3. 自編碼語言模型（Autoencoder LM）4. XLNet模型4.1 排列語言建模（Permutation Language Mod

2020-07-07 14:41:58

seq2seq通俗理解----編碼器和解碼器(TensorFlow實現)

文章目錄1. 什麼是seq2seq2. 編碼器3. 解碼器4. 訓練模型5. seq2seq模型預測5.1 貪婪搜索5.2 窮舉搜索5.3 束搜索6. Bleu得分7. 代碼實現8. 參考文獻 1. 什麼是seq2seq 在⾃然語

2020-07-07 14:41:58

【Model Log】模型評估指標可視化，自動畫Loss、Accuracy曲線圖工具，無需人工參與!

文章目錄1. Model Log 介紹2. Model Log 特性3. Model Log 演示地址4. Model Log 安裝5. Model Log 使用5.1 啓動 web 端5.2 Model Log API使用5.3

2020-07-07 14:41:56

antv/g6 怎麼關閉 tooltip ？

在項目上，使用了 antv/g6 的 Tooltip插件。但是，插件不支持顯示一個自定義的關閉按鈕，只能在渲染 tooltip 內容自己來控制了。找了API，並沒有找到，只能通過猜測，最終發現，在插件實例 new G6.Tooltip(

2024-04-22 10:33:52

TorchAcc：基於 TorchXLA 的分佈式訓練框架

本文旨在探討阿里雲 TorchAcc，這是一個基於 PyTorch/XLA 的大模型分佈式訓練框架。過去十年 AI 領域的顯著進步，關鍵在於訓練技術的革新和模型規模的快速攀升。儘管大模型展現了堪比人類的理解力，但其訓練卻對算力提出了極高的

2024-04-01 23:39:48

百億大規模圖在廣告場景的應用

本文通過搜索推薦項目進行外賣搜索廣告弱供給填充，提高流量變現效率。我們提出外賣多場景異構大圖、異構大圖在線建模技術演進路線，解決外賣搜索推薦業務多渠道、即時化的挑戰。相關成果發表CIKM2023會議一篇。聯合機器學習平臺搭建大規模圖訓練、

2024-03-29 21:16:38

這是一份簡單到沒朋友的上手圖數據庫的圖文教程

前幾天和社區小夥伴友好交流（閒聊），不少加入 NebulaGraph 的小夥伴雖然對圖感興趣，但是因爲業務調整或者是時間緣故，最終沒能用上 NebulaGraph。而他們當中不少的小夥伴說，春節我打算好好學習一番。既然大家有此打算，那 Ne

2024-03-14 02:48:50

doxygen 使用

這文值得一看： http://www.doc88.com/p-38771914275.html http://www.cnblogs.com/xuxm2007/archive/2010/11/05/1870108.html 1、expor

2020-07-07 19:20:17

論文筆記之Fully Convolutional Networks for Semantic Segmentation

最近了解到了Image Semantic Segmentation方面的知識，在此做一個記錄。這篇論文是2015cvpr的best paper，可以說是在cnn上做圖像語義分割的開山之作。 1.語義分割定義：語義就是指物體的

2020-07-08 10:23:34

MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications論文閱讀筆記

論文地址：MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications MobileNet是爲移動和嵌入式設備提出的輕量級網絡

2020-07-07 12:29:52

24小時熱門文章

關於遊戲付費的一點想法

最新文章

最新評論文章