各種檢驗

基於16s測序的差異分析無外乎就是物種差異，α 多樣性差異以及β 多樣性差異分析。最多，也就是基於PICRUSt，BUGBASE這類型的軟件預測完功能後，再做一些功能差異分析。
常見的差異檢驗方法，可以分爲兩大類，一類是最基本的差異檢驗方法，只輸出p值，例如t檢驗，秩和檢驗等。另外一類是可以輸出p值的同時，也可以輸出R值（R值是什麼？往下看吧），如Anosim，Adonis等。下面來簡單介紹一下這些方法。

基本檢驗方法

對於只輸出p值的檢驗方法，它的目的很簡單，就是檢驗比較組之間的相似性距離是否有差異，從而反映出不同環境對羣落結果的影響是否有作用。常用的分析方法有卡方檢驗、Student t檢驗、Wilcoxon秩和檢驗等等。

如果只有兩個樣本比較，適合用卡方檢驗，不過說實在的，檢驗出來的結果沒什麼可靠性，因爲現階段16s研究不做重複實在“難以服衆”了。先不說價格便宜，做重複壓根沒有難度，就是從生物學、統計學角度考慮，也需要做重複，詳情可參考之前的文章《淺聊多樣性測序樣本重複問題》。

如果是兩組樣本（至少3重複），可以試一下Student t，Welch‘st以及Wilcoxon秩和檢驗。Student t檢驗需要樣本符合正態分佈，而且方差對齊。當組間樣本數不同，方差也不對齊的時候，Welch’s t檢驗是很好的選擇。

Wilcoxon秩和檢驗又叫Mann-Whitney U 檢驗，是基於變量排名的一種統計方法，不需要樣本符合正態分佈，也不需要樣本方差對齊，是更爲廣泛的檢驗方法，但同時也由於檢驗太寬鬆，容易帶來很多假陽性。

如果是多組樣本比較，可以選擇one way ANOVA、TURKEY以及Kruskal-Wallis H檢驗等方法。one way ANOVA和TURKEY其實都是基於方差分析，只不過後者帶有後驗，可以知道兩個分組對整體差異的貢獻度。

Kruskal-Wallis H檢驗本質也是一種秩和檢驗，與前兩者的區別在於，它不需要樣本數和方差的對齊，應用更爲廣泛。

這些方法哪種較好？這是個見仁見智的問題，如果在不確定數據模型的情況下，建議都可以試一下，畢竟也就是一行命令的問題。

基於矩陣的檢驗方法

上面所提及的檢驗方法，其實都只能告訴大家，這些分組是否有顯著差異（可以簡單理解爲有無）。那如果想同時知道這些差異的程度（可以簡單理解爲多少）呢，那需要Anosim，Adonis以及MRPP等檢驗方法。

這些方法不單可以輸出檢驗顯著性結果（p值），還有程度結果（R值），R值可以用來判斷分組貢獻度大小。

舉個例子，微生物生長受N、P等多種因素影響。如果有3組樣本，分別是對照、N處理以及P處理的土壤，在N和P處理相對於對照都顯著（p<0.05）的情況下，想知道到底是N還是P的處理更爲重要，那就是要看之前R值大小了。

Anosim

Anosim（Analysis of similarities）是一種非參數檢驗方法。它首先通過變量計算樣本間關係（或者說相似性），然後計算關係排名，最後通過排名進行置換檢驗判斷組間差異是否顯著不同於組內差異。

這個檢驗有兩個重要的數值，一個是p值，可以判斷這種組間與組內的比較是否顯著；一個是R值，可以得出組間與組內比較的差異程度。

R值範圍實際範圍是（-1，1），但一般介於（0，1）之間，R>0，說明組間存在差異，一般R>0.75：大差異；R>0.5：中等差異，R>0.25：小差異。 R等於0或在0附近，說明組間沒有差異。R偶爾也會<0，這種情況是組內差異顯著大於組間差異，這就說明我們的採樣或者分組出現大問題，可以認爲是無效數據（怎麼辦？重做實驗啊！）。

Anosim原理（左圖相似性，右圖爲關係排名）

Adonis

Adonis，這名字挺陌生的，但它其實就是大名鼎鼎的PERMANOVA，大家又熟悉起來了吧。它與Anosim的用途其實差不多，也能夠給出不同分組因素對樣品差異的解釋度（R值）與分組顯著性（P值）。

不同點是應用的檢驗模型不同，ADONIS本質是基於F統計量的方差分析，所以很多細節與上述方差分析類似。

MRPP

至於MRPP，其實與上述兩個差不多，只不過它所使用的模型是基於delta統計量的檢驗方法，詳細內容就不細說了。

應用情況

很多時候，我們做完PCoA，NMDS之後，雖然肉眼能大概分辨分組是否可以清晰分開，但實際上，嚴謹的統計學還是需要檢驗的，說明白這所謂的“清晰分開”到底顯著不顯著。

Anosim、Adonis這些可用於多元統計檢驗的模型就非常適合了。要值得注意的是，Anosim本質是基於排名的算法，其實與NMDS的配合效果最好。如果是PCoA分析，建議配合使用Adonis檢驗結果。

NMDS配合Anosim展示結果[1]
PcoA配合使用Adonis（PERMANOVA）分析[2]

小結

上面嘮叨了一大堆，可以總結爲幾點：

a.第一小點所提及的T檢驗等只能分辨差異是否顯著，只有第二小點所提及的Anosim等方法纔能有差異程度的評價。

b.Anosim，Adonis（PERMANOVA）以及MRPP只是不同模型，基本上都需要配合PCoA等多元分析方法一起使用。Anosim與NMDS更配，Adonis與PCoA更配。

c. 這些檢驗方法，不是beta多樣性分析特有，它們能用於任何情況下的分析，只不過有一些是基於原始丰度數據，有一些是基於距離關係，有一些是基於排名等等。要注意的是它們的分析條件，不是分析對象。

參考文獻

[1] Marupakula S, Mahmood S, Finlay R D. Analysis of single roottip microbiomes suggests that distinctive bacterial communities are selected byPinus sylvestris roots colonized by different ectomycorrhizal fungi[J].Environmental microbiology, 2016, 18(5): 1470-1483.

[2] Edwards J, Johnson C, Santos-Medellín C, etal. Structure, variation, and assembly of the root-associated microbiomes ofrice[J]. Proceedings of the National Academy of Sciences, 2015, 112(8):E911-E920

CORS error 但是 status code 是200 OK

壓縮上傳的GPU數據的方案

使用skopeo同步鏡像

NCBI測序數據批量下載與使用

科研工作日誌-2020年7月2日：宏基因組學之抗性基因分析

科研工作日誌-2020年7月5日：fastq轉化爲fasta以及Linux進程查看和殺死

統計學習-各種檢驗

Conda安裝與使用

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結