我們知道,不管是16S等擴增子測序,還是宏基因組,最後最重要的結果,就是物種的丰度情況了,qiime2給出的16S丰度結果是一個計數,對於許多軟件來說這是可用的,那麼如果我們想獲得一個直接的百分比數據應該怎樣做呢?
當然,有許多方法可以實現,比如用shell, R, python腳本,或者再簡單粗暴點,excel解決,透視表,公式,宏等。自己造輪子總是覺得不怎麼踏實,出錯咋辦。那麼,現成的軟件有哪些呢,在這裏,我拋磚引玉,提出一個曲線救國的方法,使用qiime2的前任qiime1解決,稍微做幾步處理即可。如果你有更好的方法,歡迎交流和推薦,我們共同學習的進步!
這裏我就從qiime2得出的結果直接開始,參考了生信菜鳥團大神的推文,這個大神的教程以全面著稱,推薦學習!
1.導出物種分類信息和置信度
獲得taxonomy.tsv,這個文件,其實把qza文件重命名爲zip解壓,或者qzv可視化文件導出,得到的文件也應該是一樣的。
qiime tools export \
--input-path taxa/taxonmony.qza --output-path taxa
文件是類似這樣一個:
Feature ID | Taxon | Confidence |
---|---|---|
#q2:types | categorical | categorical |
OTU_1 | k__Bacteria; p__Actinobacteria; c__Actinobacteria; o__Actinomycetales; f__; g__; s__ | 0.8316610949745203 |
2.導出 BIOM 表,並加入將物種分類註釋信息:
這一步就是處理下表頭,讓他兼容biom格式。注意,這個sed在mac下命令不能用,暫不確定是什麼原因,我是用docker-ubuntu解決的。
#處理表頭
sed -i -e '1 s/Feature/#Feature/' -e '1 s/Taxon/taxonomy/' taxa/taxonomy.tsv
#導出otu(feature)表
qiime tools export \
--input-path deblur_output/table_final.qza \
--output-path table_exported
#添加物種註釋信息
biom add-metadata \
-i deblur_output_exported/feature-table.biom \
-o deblur_output_exported/feature-table_w_tax.biom \
--observation-metadata-fp taxa/taxonomy.tsv \
--sc-separated taxonomy
#biom轉換成txt格式
biom convert \
-i deblur_output_exported/feature-table_w_tax.biom \
-o deblur_output_exported/feature-table_w_tax.txt \
--to-tsv \
--header-key taxonomy
3.qiime1獲利各級分類結果
其實只需要biom格式就好了,唯一不足的是沒有把上幾級別的分類去除,比如屬級別,還包括門綱目科,還不是usearch那種直接就是這個分類的結果。但是根據我的經驗,usearch的物種註釋結果可能不如qiime2的分類效果好,所以怎樣結合這兩個方法是個需要解決的問題。
#結果按門、綱、目、科、屬五個級別進行分類彙總,對應結果的L2-L6
summarize_taxa.py -i result/otu_table3.biom -o result/sum_taxa # summary each level percentage
好的,我的分享就到這裏,期待大家有更好的解決方案。