WGCNA方法簡介

加權基因共表達網絡(weighted gene co-expression network analysis)是一種廣泛使用的數據挖掘方法,用兩兩變量間相關係數研究生物網絡。

大致步驟:

1、基因共表達定義兩向量間的距離,選定β值(冪函數評估連接強度),生成鄰接矩陣;
2、模塊中心分析:拓撲重疊指標、模塊特徵向量;
3、建立共表達網絡,判斷特定模塊的模塊間樞紐基因。

詳細介紹:

1、
用sij表示基因i和j之間的基因共表達相似性,有兩種表示方法:
(1)無符號共表達相似指標:
sijunsigned=cor(xi,xj)sij^{unsigned} = |cor(xi, xj)|
此種類型會造成生物信息損失(抑制或激活)
(2)有符號的共表達指標:
sijsigned=0.5+0.5cor(xi,xj)sij^{signed} = 0.5 + 0.5cor(xi, xj)

生成鄰接矩陣:
1)若生成無權重基因共表達網絡,則設定閾值τ,對共表達相似矩陣S=[sij]S = [sij],如果sij > τ,無權重網絡鄰接矩陣設定爲1,否則設定爲0.,此種方法對閾值的選擇較爲敏感,會造成共表達信息的損失。
2)若不設固定閾值,加權基因共表達網絡分析使用以下的冪函數評估連接強度:
aij=(sij)βaij = (sij)^{β}
其中,鄰接矩陣A=[aij]A = [aij]定量確定兩個基因相互連接的程度。
無符號和有符號網絡分別使用β=6和β=12作爲默認值,最終得到加權鄰接矩陣,之後的分析稱爲加權基因共表達網絡分析。

2、用網絡拓撲指標將基因集聚爲網絡模塊:
加權基因共表達網絡分析使用拓撲重疊指標作爲距離,並將此指標輸入平均連鎖層次聚類,形成模塊。
3、在模塊特徵向量之間建立共表達網絡,即以節點爲模塊的網絡;
判斷特定模塊的模塊間樞紐基因,有兩種連接指標:
(1)kMEi
(2)kIN
(待補充)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章