筆記:複雜網絡的關鍵技術及應用

點擊查看原網頁,下面寫的是個人總結

1.複雜網絡與圖

複雜網絡與圖是同一種事物,由節點和連邊構成。圖是數學領域的研究內容,“圖論”的算法是普適性的,側重於理論。複雜網絡側重於工程,是將“圖論”的理論帶入到現實的生活生產中,結合圖算法理論、應用場景以及科學技術等方面能力,幫助觀察和理解真實的客觀世界。

2. 複雜性

哲學思想還原論認爲萬事萬物都有更基本的元素構成,通過研究更基本的元素可以理解複雜的整體,這個思想已經取得了許多成果,比較突出的有基因工程等。
不過,有時從簡單的元素入手卻不能理解複雜的整體,比如一隻螞蟻與蟻羣的行爲,說明現實世界系統具有“複雜性”,而複雜性背後是網絡關聯。

具有自組織、自相似、吸引子、小世界、無標度中部分或全部性質的網絡稱爲複雜網絡。(錢學森)

複雜網絡主要有以下幾個特點:
  第1,結構複雜,不用解釋太多,自然界就是複雜的,抽象出來的網絡也是複雜的。
  第2,網絡進化,世界在發展,代表它的網絡也是在變化,網絡中會不斷地產生新的節點,也會產生新的關係,同樣,也會在消失着一些節點和關係。今天我們是朋友,明天你們和他們也會成爲朋友。
  第3,連接多樣,連接邊不是隻代表一種類別的關係,只要能代表事物和事物之間關係的都可以描述成邊,只要是屬於我們所要研究範疇的。你和她是朋友關係,也可能還存在着同事關係。
  第4,動力學複雜性,它代表一種動態的特性,事物之間的影響是可以傳播的,一個事物發生了改變,可能會影響與它有關聯的其它事物的改變,並將這種改變傳播出去,把這種傳播變成可計算化,正是動力學所要研究的方向。
  第5,多重複雜性結合,正是多種事物相互關聯和互相影響,體現出它的變化複雜性和未知性,未來發展趨勢,並非一個簡單的線性公式所能解釋的。
  第6,節點的多樣性,和連接多樣性一樣,網絡中的節點可以代表任何事物,只要是屬於我們所要研究的範疇。


3. 實現技術

數據結構:矩陣結構與關係型數據庫結構,矩陣結構效率更高(NoSQL數據庫),關係型結構信息更完善。Neo4j圖查詢數據庫,適合中小規模的圖。

大數據:分佈式存儲與分佈式處理。爲實現分佈式需切分網絡,常用切分有三種:

按點切,切度值大的節點;

按邊切,切弱連接;

隨機切,結構不明顯的網絡可用,不太實用。

可行方案:基於Hadoop+Spark技術,把算法轉換爲分佈式計算,在集羣上運行。

大規模圖查詢展現:InfiniteGraph、OrientDB、InfoGrid和HypergraphDB等

4. 應用

社團檢測:潛在客戶挖掘、關聯羣體風險分析等;

網絡中心性分析:網頁排名(PageRank),供應鏈核心企業識別,信息傳播樞紐節點識別等;

網絡傳播預測:流行病傳播,金融風險傳播,輿論傳播;

網絡關係滲透:節點之間的關係(三度影響);

關聯交易分析及投融資黑洞:虛假交易,擔保圈分析等。




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章