筆記(4)——Analyzing Communities and Their Evolutions in Dynamic Social Networks

摘要:
提出一個新方法,與傳統的兩步方法相區別。

我們提出FaceNet來分析社區和它們的演化通過一個強大的統一過程。我們的方法是對問題採用MAP估計,社區結構的估計同時考慮觀察到的網絡數據和由歷史社區結構提供的先驗分佈。


關於動態網絡的研究情況……,它們共同的缺點是:(1)社區和它們的演化是分開來研究的。通常,社區結構獨立的用連續的時間步來提取,然後演化的屬性用來解釋隨着時間的變化社區之間的區別。當社區結構是清楚的時候(例如:社區中聯繫是可用的)兩步的方法是有意義的。但是,現實中的數據都是模糊的,而且含有大量的噪聲。我們提出的是在同一個框架中分析社區和它們的演化。(2)個人通常劃歸到一個單獨的社區中,我們認爲比如一個博客作者他可能是一個專業的舞蹈者也可能是個業餘的歌唱愛好者,所以我們提出的是軟社區,即個人可以同時屬於不同的社區。

我們的貢獻是:(1)我們用FacetNet框架來統一的分析社區和他們的演化。在我們的框架中,在給定的時間點T的社區結構由在時間點T觀察到的網絡數據和由歷史社區結構的先驗分佈同時決定。算法上,我們提出了第一概率生成模型來分析社區和他們的演化。我們表明,該模型可以從概率(貝葉斯)的角度解決進化的聚類問題。發現的社區和它們的演化對噪聲更魯棒,並且更合理。(2)我們採用一種隨機塊體模型來產生社區和一種基於狄利克萊分佈(Dirichlet distribution)的概率模型來抓取社區演化。這些概率模型自然的分配軟社區成員給節點,並且這些模型不具有非參數可辨識這個缺點,這是大多數模型都具有的缺點。基於由模型計算出的概率分佈,我們進一步提出兩種新穎的概念——社區網絡和演化網絡——分別用來解釋社區級別的交互和過渡。(3)我們提供了迭代的EM算法,這可以用來保證收斂到擬定的最佳解決方案。我們證明了算法的正確性和收斂性,並且表明當數據稀疏的時候,算法具有低時間複雜度。我們還提供了一個實際問題原則上的解決方法,比如怎麼樣決定社區的個數和怎麼樣在動態的網絡中把握增加和去除個體。
論文結構:第2部分,詳細介紹我們的模型。第3部分,描述了怎麼樣抽取社區和他們的演化從我們的概率模型的。第4部分,我們提出了迭代的EM算法來解決我們的模型和討論時間複雜度。第5部分,我們介紹了我們框架的擴展部分來解決實際的問題。第6部分,我們提供了實驗的數據。最後第7部分,我們給出了結論和未來的方向。
--------------------------------未完待續--------------------------------
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章