複雜網絡研究常用載體集

原文出處:http://blog.sciencenet.cn/home.php?mod=space&uid=237587&do=blog&id=228595


複雜網絡的研究常常是和實際的複雜系統緊密結合的。從小世界和無尺度現象的發現開始,人們就逐漸認識到,包括社會網絡中人與人之間的交際網絡和Internet, web等大量現實網絡在內的系統中隱含了大量的祕密等待人們去發現。這裏總結了複雜網絡研究的常用載體的集合,這些載體大部分是在複雜網絡的論文中使用頻度很高的。當然,很多時候,我們的網絡研究也許會針對某一項特定的實證研究展開,而且這些實證研究的網絡是需要自己根據實際情況抽取、構建的。但是無論怎麼樣,公用的載體集總是可以爲我們提供一些幫助的,比如Mark Newman, Barabasi等人的個人網頁上就提供了一些載體集合。這裏將複雜網絡的載體分成四大類:社會學網絡,生物學網絡,計算機網絡,人造技術網絡,最後列舉了網絡上公開的其他一些網絡研究載體集。[特別提醒]每一個特定載體集合的出處均標明,正常引用這些資料的時候需要尊重原始作者的知識產權。

1. 社會學網絡

1.1 ZACHARY空手道俱樂部成員關係網絡
【簡介】Zachary空手道俱樂部成員關係網絡是複雜網絡、社會學分析等領域中最常用的一個小型檢測網絡之一。從1970到1972年,Wayne Zachary用三年時間觀察了美國一所大學空手道俱樂部成員間的社會關係,並構造出了社會關係網(Zachary’s karate club network)。網絡中的每個節點分別表示某一個俱樂部成員,節點間的連接表示兩個成員經常一起出現在俱樂部活動(如空手道訓練、俱樂部聚會等)之外的其他場合,即在俱樂部之外他們可以被稱爲朋友。調查過程中,該俱樂部因爲主管John A.(節點34)與教練Mr. Hi(節點1)之間的爭執而分裂成2個各自爲核心的小俱樂部,不同顏色與形狀的節點代表分裂後的小俱樂部成員。規模:34個節點,78條邊
【數據集】zarchary
【出處】Zachary W W. An information flow model for conflict and fission in small groups. Journal of Anthropological Research, 1977, 33:452–473

1.2美國政治書網絡
【簡介】由V. Krebs從Amazon上銷售的美國政治相關書籍頁面上建立起來的網絡。其節點代表在Amazon在線書店上銷售的美國政治相關圖書,邊代表一定數量的讀者同時購買了這兩本圖書(由抽取網頁上的“購買了這本書的讀者同時也購買了一些圖書”指示得到)。節點分成了三類:l, n和c, 分別代表“自由派”、“保守派”和“中間派”。這些派別的劃分是由Mark Newman根據Amazon上對於圖書觀點以及評價情況的人工分析得到的。規模:105個節點,441條邊
【數據集】polbooks
【出處】Mark Newman,http://www-personal.umich.edu/~mejn/, and V. Krebs website。

1.3演員合作網絡
【簡介】國內學者構建了一個2006年中國電影演員合作網絡:該數據來自國內著名的網絡電影社區——MTime網站,網絡中每個節點代表一個演員,邊代表兩個演員共同出演過同一部電影,即存在合作關係。規模:網絡共有587個節點1725條邊。
【數據集】暫無
【出處】赫南, 淦文燕, 李德毅. 一個小型演員合作網的拓撲性質分析[J]. 複雜系統與複雜性科學. 2006, vol.3(4):1-10.
淦文燕,數據場方法及其在網絡化數據挖掘中的應用研究,清華大學博士後研究報告,2007年6月

1.4高能物理學理論文獻引文網絡
【簡介】高能物理學理論文獻引文網絡這是規模較大的、同時也是非常有名的合作網絡實證載體,不少有影響力的文獻裏面曾經對它進行過研究。KDD CUP2003競賽的數據源之一。其數據來源於arXiv.org,涵蓋的論文入庫(arXiv數據庫)時間從1993年1月到2003年4月. 網絡邊的構建方式是:如果一篇論文i引用了另一篇論文j,在兩者之間加上一條從i指向j的有向邊。(如果被一篇數據庫之外的論文引用或者引用了一篇數據庫之外的文獻,不做任何處理)。附件提供了300個節點規模的網絡,這是按照時間排序,從1993年1月開始添加進arXiv數據庫的最初的300篇高能物理理論文獻。規模:網絡共有29,555個節點,352,807條邊。
【數據集】HEPCitation 300
【出處】KDDCUP2003

1.5悲慘世界人物關係網絡
【簡介】D. E. Knuth根據Victor Hugo(維克多.雨果)的小說Les Misèrables,《悲慘世界》,整理了其中的人物關係網絡。網絡中的節點表示小說中的角色,邊表示兩個角色同時出現在一幕或多幕中。網絡中有六個主要人物,主人公Jean Valjean(冉阿讓),探長Javert(賈維),神父Bishop Myriel(米里哀),女工Fantine(芳汀)及其女兒Cosette(珂賽特)。研究人際網絡中關鍵的邊(即人物之間的聯繫)對網絡整體性能的影響,發現網絡內關鍵的邊,將對輿情和疾病等的傳播具有非常重要的意義。規模:網絡共有77個節點,508條邊。
【數據集】lesmis
【出處】Knuth D E, The Stanford Graph Base: A Platform for Combinatorial Computing. Addison-Wesley, Reading, MA,1993

1.6卓越亞馬遜手機在線銷售網絡
【簡介】根據Amazon-joyo的手機在線銷售數據整理而得,具體統計時間爲2008年10月到2009年4月,後續的數據正在收集中。手機在線銷售數據的節點爲手機(由“品牌+型號+顏色”三個屬性加以區別)。邊由“查看此商品的顧客也查看了(下列商品)”的屬性得到。取每天銷售量前20名的手機進行統計。規模:每天小於20個,隨着天數不斷演變。
【數據集】mobilephone
【出處】張海粟,複雜網絡研究常用載體集,
http://www.sciencenet.cn/m/user_content.aspx?id=228595

1.7美國大學足球俱樂部網絡
【簡介】【數據集】【出處】

1.8美國南部婦女活動網絡
【簡介】美國南部“Old City”市18位婦女參加被當地報紙所報道的社會活動(諸如俱樂部集會、教會晚宴等)的數目。圖中藍色方塊節點爲事件,紅色圓圈爲婦女,這是一個二模圖。規模:18個節點,邊數根據二模向一模轉化的結果而定。
【數據集】暫無
【出處】Davis, A. Gardner B. B. and Gardner, M. R. 1941, Deep South: A social anthropological study of caste and class. Chicago: University of Chicago Press.
Martin Kilduff and Wenpin Tsai 著,王鳳彬等譯,社會網絡與組織,中國人民大學出版社,2007.1.

2.生物學網絡:
2.1海豚家族關係網絡
【簡介】D. Lusseau等人對棲息在新西蘭Doubtful Sound峽灣的一個寬吻海豚羣體(該羣體由2個家族共62只寬吻海豚組成)進行長達7年的觀察所構造出的海豚關係網。圖中節點代表一個海豚,邊表示兩個海豚之間接觸頻繁,圖不同顏色與形狀的節點代表屬於不同家族的海豚成員。規模:共有62個節點159條邊
【數據集】dolphins
【出處】Lusseau D, Newman M E J. Identifying the role that animals play in their social networks, Proceedings of the Royal Society of London Series B-biological Sciences, 2004,271:477-481

2.2新陳代謝網絡
[簡介]
[數據集]
[出處]

3.計算機網絡:
3.1AS級網絡
[簡介]
[數據集]
[出處]

3.2mushups應用網絡
[簡介]
[數據集]
[出處]

3.3服務描述單詞網絡
[簡介]
[數據集]
[出處]

4.人造技術網絡:

附:網絡上其他一些可用的網絡數據:
科學家合作網:
http://www-personal.umich.edu/~mejn/


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章