《Detecting sequences of system states in temporal networks》

原創

2020-06-26 15:28

文章目錄

論文地址

https://www.nature.com/articles/s41598-018-37534-2

bibtex

@article{DBLP:journals/corr/abs-1803-04755,
  author    = {Naoki Masuda and
               Petter Holme},
  title     = {Detecting sequences of system states in temporal networks},
  journal   = {CoRR},
  volume    = {abs/1803.04755},
  year      = {2018},
  url       = {http://arxiv.org/abs/1803.04755},
  archivePrefix = {arXiv},
  eprint    = {1803.04755},
  timestamp = {Mon, 13 Aug 2018 16:46:49 +0200},
  biburl    = {https://dblp.org/rec/journals/corr/abs-1803-04755.bib},
  bibsource = {dblp computer science bibliography, https://dblp.org}
}

代碼地址

https://github.com/naokimas/state_dynamics

主要內容

動態網絡是由網絡快照（snapshot）的序列來描述，這篇文章主要考慮網絡的鏈路是動態變化的，比如通訊網絡中，節點之間的通訊狀態是時斷時續的。

假設一個快照的持續時間爲 $T$ ，在這段時間內存在通訊的節點對之間具有連邊，用網絡的鄰接矩陣表示。動態網絡序列由網絡快照的鄰接矩陣組成。

接下來要識別這些鄰接矩陣的狀態，核心思想就是（層次）聚類。

聚類算法的核心是求元素之間的距離，即網絡鄰接矩陣間的距離。

網絡的距離度量

圖編輯距離

$d = N(G_1) + N(G_2) - 2N(G_1 \cap G_2) + M(G_1) + M(G_2) - 2M(G_1 \cap G_2)$ 其中， $N(\cdot), M(\cdot)$ 分別代表節點數和邊數。

DeltaCon

@article{10.1145/2824443,
author = {Koutra, Danai and Shah, Neil and Vogelstein, Joshua T. and Gallagher, Brian and Faloutsos, Christos},
title = {DeltaCon: Principled Massive-Graph Similarity Function with Attribution},
year = {2016},
issue_date = {February 2016},
publisher = {Association for Computing Machinery},
address = {New York, NY, USA},
volume = {10},
number = {3},
issn = {1556-4681},
url = {https://doi.org/10.1145/2824443},
doi = {10.1145/2824443},
journal = {ACM Trans. Knowl. Discov. Data},
month = feb,
articleno = {28},
numpages = {43},
keywords = {node attribution, anomaly detection, graph classification, culprit nodes and edges, Graph similarity, network monitoring, graph comparison, edge attribution}
}

The quantum spectral Jensen-Shannon divergence

JS 散度解決了 KL 散度不對稱的問題：

KL散度：
$KL(P||Q) = \sum_x P(x)\log\frac{P(x)}{Q(x)}$
KL散度具有正定性和非對稱性。

JS 散度：
$JS(P||Q) = \frac{1}{2}KL(P||M) + \frac{1}{2}KL(Q||M), \\ M = \frac{1}{2}(Q+P)$
熵的定義爲：
$H(P) = -\sum_x P(x)\log P(x),$
從熵的角度來看JS散度： $\begin{array}{rl} JS(P||Q) =&\frac{1}{2}KL(P||M) + \frac{1}{2}KL(Q||M) \\\\ =& \frac{1}{2} \left(\sum_x P(x)\log P(x) - \sum_x P(x)\log M(x) + \sum_x Q(x)\log Q(x) - \sum_x Q(x)\log M(x) \right) \\\\ =& H(M)-\frac{1}{2} \left( H(P) + H(Q)\right) \end{array}$
JS散度具有:

正定性且值域爲 $[0,1]$ ；

對稱性。

JS散度是比較兩個分部的距離，怎樣用來計算兩個網絡的相似度呢？

首先定義密度矩陣：
$\rho = e^{-\beta L}/\sum_{i=1}^N e^{-\beta \lambda_i}$
其中， $L = D-A$ ， $e^{-\beta L} = I -\beta L + \frac{1}{2!}\beta^2L^2 - \frac{1}{3!}\beta^3L^3 +\cdots$ ，怎麼理解這個式子呢？

其實， $e^{-tL}$ 是網絡擴散過程：
$\dot{x} = -Lx = (A-D)x$ 的基本解矩陣，該方程的通解爲： $x = e^{-tL}x_0$ ，而 $\beta$ 控制了網絡中擴散的時間。
所以 $\rho$ 可以反映網絡中的擴散過程，因而可以作爲網絡的特徵表示。另一方面， $\rho$ 的特徵值之和相加爲1，所以 $\rho$ 可以視爲量子力學中的密度矩陣（？暫時不懂）。

對於密度矩陣定義馮紐曼熵（von Neumann entropy）：
$S(\rho) = -\sum_{i=1}^N \tilde\lambda_i \log_2\tilde\lambda_i,$ 其中， $\tilde\lambda_i$ 是 $\rho$ 的第 $i$ 個特徵值.

根據熵和JS散度的關係，得到兩個密度矩陣之間的距離度量：
$d = \sqrt{S(\frac{\rho_1 + \rho_2}{2}) - \frac{1}{2}[S(\rho_1)+S(\rho_2)]}$

其餘四種頻域距離

對於兩種拉普拉斯矩陣：
$L = D - A, \\ L' = I - D^{-1/2} A D^{-1/2}$
分別取如下兩種頻域距離度量：
$d_1 = \sqrt{\sum_i^n(\lambda_i(G_1) - \lambda_i(G_2))^2}$ $d_2 = \sqrt{\frac{\sum_i^n(\lambda_i(G_1) - \lambda_i(G_2))^2}{\max\{\sum_i^n\lambda_i(G_1)^2 , \sum_i^n\lambda_i(G_2)^2 \}}}$
其中 $\lambda_i$ 表示第 $i$ 大的特徵值.

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

《Detecting sequences of system states in temporal networks》

文章目錄

論文地址

bibtex

代碼地址

主要內容

網絡的距離度量

圖編輯距離

DeltaCon

The quantum spectral Jensen-Shannon divergence

其餘四種頻域距離

《日本蠟燭圖》讀書筆記 & 技術分析回測

《期貨-市場技術分析》讀書筆記

Python多線程編程深度探索：從入門到實戰

mongodb處理json數據很好

[轉帖]cpupower

35K*14 薪，入職了！這公司只要不裁員，我能一直呆下去！

求最大李雅普諾夫指數（Largest Lyapunov Exponents，LLE）的 Rosenstein 算法

學習筆記（2):大數據之Hive-基本查詢

敲黑板！數據分析師的基本素養

學習筆記（1):大數據之Hive-Hive安裝配置和簡單命令

學習筆記（1):大數據之Hive-Hive安裝配置和簡單命令

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結