各種檢驗

基於16s測序的差異分析無外乎就是物種差異,α 多樣性差異以及β 多樣性差異分析。最多,也就是基於PICRUSt,BUGBASE這類型的軟件預測完功能後,再做一些功能差異分析。
常見的差異檢驗方法,可以分爲兩大類,一類是最基本的差異檢驗方法,只輸出p值,例如t檢驗,秩和檢驗等。另外一類是可以輸出p值的同時,也可以輸出R值(R值是什麼?往下看吧),如Anosim,Adonis等。下面來簡單介紹一下這些方法。

  1. 基本檢驗方法

對於只輸出p值的檢驗方法,它的目的很簡單,就是檢驗比較組之間的相似性距離是否有差異,從而反映出不同環境對羣落結果的影響是否有作用。常用的分析方法有卡方檢驗、Student t檢驗、Wilcoxon秩和檢驗等等。

如果只有兩個樣本比較,適合用卡方檢驗,不過說實在的,檢驗出來的結果沒什麼可靠性,因爲現階段16s研究不做重複實在“難以服衆”了。先不說價格便宜,做重複壓根沒有難度,就是從生物學、統計學角度考慮,也需要做重複,詳情可參考之前的文章《淺聊多樣性測序樣本重複問題》。

如果是兩組樣本(至少3重複),可以試一下Student t,Welch‘st以及Wilcoxon秩和檢驗。Student t檢驗需要樣本符合正態分佈,而且方差對齊。當組間樣本數不同,方差也不對齊的時候,Welch’s t檢驗是很好的選擇。

Wilcoxon秩和檢驗又叫Mann-Whitney U 檢驗,是基於變量排名的一種統計方法,不需要樣本符合正態分佈,也不需要樣本方差對齊,是更爲廣泛的檢驗方法,但同時也由於檢驗太寬鬆,容易帶來很多假陽性。

如果是多組樣本比較,可以選擇one way ANOVA、TURKEY以及Kruskal-Wallis H檢驗等方法。one way ANOVA和TURKEY其實都是基於方差分析,只不過後者帶有後驗,可以知道兩個分組對整體差異的貢獻度。

Kruskal-Wallis H檢驗本質也是一種秩和檢驗,與前兩者的區別在於,它不需要樣本數和方差的對齊,應用更爲廣泛。

這些方法哪種較好?這是個見仁見智的問題,如果在不確定數據模型的情況下,建議都可以試一下,畢竟也就是一行命令的問題。

  1. 基於矩陣的檢驗方法

上面所提及的檢驗方法,其實都只能告訴大家,這些分組是否有顯著差異(可以簡單理解爲有無)。那如果想同時知道這些差異的程度(可以簡單理解爲多少)呢,那需要Anosim,Adonis以及MRPP等檢驗方法。

這些方法不單可以輸出檢驗顯著性結果(p值),還有程度結果(R值),R值可以用來判斷分組貢獻度大小。

舉個例子,微生物生長受N、P等多種因素影響。如果有3組樣本,分別是對照、N處理以及P處理的土壤,在N和P處理相對於對照都顯著(p<0.05)的情況下,想知道到底是N還是P的處理更爲重要,那就是要看之前R值大小了。

Anosim

Anosim(Analysis of similarities)是一種非參數檢驗方法。它首先通過變量計算樣本間關係(或者說相似性),然後計算關係排名,最後通過排名進行置換檢驗判斷組間差異是否顯著不同於組內差異。

這個檢驗有兩個重要的數值,一個是p值,可以判斷這種組間與組內的比較是否顯著;一個是R值,可以得出組間與組內比較的差異程度。

R值範圍實際範圍是(-1,1),但一般介於(0,1)之間,R>0,說明組間存在差異,一般R>0.75:大差異;R>0.5:中等差異,R>0.25:小差異。 R等於0或在0附近,說明組間沒有差異。R偶爾也會<0,這種情況是組內差異顯著大於組間差異,這就說明我們的採樣或者分組出現大問題,可以認爲是無效數據(怎麼辦?重做實驗啊!)。

Anosim原理(左圖相似性,右圖爲關係排名)

Adonis

Adonis,這名字挺陌生的,但它其實就是大名鼎鼎的PERMANOVA,大家又熟悉起來了吧。它與Anosim的用途其實差不多,也能夠給出不同分組因素對樣品差異的解釋度(R值)與分組顯著性(P值)。

不同點是應用的檢驗模型不同,ADONIS本質是基於F統計量的方差分析,所以很多細節與上述方差分析類似。

MRPP

至於MRPP,其實與上述兩個差不多,只不過它所使用的模型是基於delta統計量的檢驗方法,詳細內容就不細說了。

  1. 應用情況

很多時候,我們做完PCoA,NMDS之後,雖然肉眼能大概分辨分組是否可以清晰分開,但實際上,嚴謹的統計學還是需要檢驗的,說明白這所謂的“清晰分開”到底顯著不顯著。

Anosim、Adonis這些可用於多元統計檢驗的模型就非常適合了。要值得注意的是,Anosim本質是基於排名的算法,其實與NMDS的配合效果最好。如果是PCoA分析,建議配合使用Adonis檢驗結果。

NMDS配合Anosim展示結果[1]
PcoA配合使用Adonis(PERMANOVA)分析[2]

  1. 小 結

上面嘮叨了一大堆,可以總結爲幾點:

a.第一小點所提及的T檢驗等只能分辨差異是否顯著,只有第二小點所提及的Anosim等方法纔能有差異程度的評價。

b.Anosim,Adonis(PERMANOVA)以及MRPP只是不同模型,基本上都需要配合PCoA等多元分析方法一起使用。Anosim與NMDS更配,Adonis與PCoA更配。

c. 這些檢驗方法,不是beta多樣性分析特有,它們能用於任何情況下的分析,只不過有一些是基於原始丰度數據,有一些是基於距離關係,有一些是基於排名等等。要注意的是它們的分析條件,不是分析對象。

參考文獻

[1] Marupakula S, Mahmood S, Finlay R D. Analysis of single roottip microbiomes suggests that distinctive bacterial communities are selected byPinus sylvestris roots colonized by different ectomycorrhizal fungi[J].Environmental microbiology, 2016, 18(5): 1470-1483.

[2] Edwards J, Johnson C, Santos-Medellín C, etal. Structure, variation, and assembly of the root-associated microbiomes ofrice[J]. Proceedings of the National Academy of Sciences, 2015, 112(8):E911-E920

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章