qiime2+biom+qiime1獲得16S物種丰度

原創

zd200572

2020-07-01 19:35

我們知道，不管是16S等擴增子測序，還是宏基因組，最後最重要的結果，就是物種的丰度情況了，qiime2給出的16S丰度結果是一個計數，對於許多軟件來說這是可用的，那麼如果我們想獲得一個直接的百分比數據應該怎樣做呢？

當然，有許多方法可以實現，比如用shell, R, python腳本，或者再簡單粗暴點，excel解決，透視表，公式，宏等。自己造輪子總是覺得不怎麼踏實，出錯咋辦。那麼，現成的軟件有哪些呢，在這裏，我拋磚引玉，提出一個曲線救國的方法，使用qiime2的前任qiime1解決，稍微做幾步處理即可。如果你有更好的方法，歡迎交流和推薦，我們共同學習的進步！

這裏我就從qiime2得出的結果直接開始，參考了生信菜鳥團大神的推文，這個大神的教程以全面著稱，推薦學習！

1.導出物種分類信息和置信度

獲得taxonomy.tsv，這個文件，其實把qza文件重命名爲zip解壓，或者qzv可視化文件導出，得到的文件也應該是一樣的。

qiime tools export \
   --input-path taxa/taxonmony.qza --output-path taxa

文件是類似這樣一個：

Feature ID	Taxon	Confidence
#q2:types	categorical	categorical
OTU_1	k__Bacteria; p__Actinobacteria; c__Actinobacteria; o__Actinomycetales; f__; g__; s__	0.8316610949745203

2.導出 BIOM 表，並加入將物種分類註釋信息：

這一步就是處理下表頭，讓他兼容biom格式。注意，這個sed在mac下命令不能用，暫不確定是什麼原因，我是用docker-ubuntu解決的。

#處理表頭
sed -i -e '1 s/Feature/#Feature/' -e '1 s/Taxon/taxonomy/' taxa/taxonomy.tsv
#導出otu(feature)表
qiime tools export \
   --input-path deblur_output/table_final.qza \
   --output-path table_exported
#添加物種註釋信息
biom add-metadata \
   -i deblur_output_exported/feature-table.biom \
   -o deblur_output_exported/feature-table_w_tax.biom \
   --observation-metadata-fp taxa/taxonomy.tsv \
   --sc-separated taxonomy
#biom轉換成txt格式
biom convert \
   -i deblur_output_exported/feature-table_w_tax.biom \
   -o deblur_output_exported/feature-table_w_tax.txt \
   --to-tsv \
   --header-key taxonomy

3.qiime1獲利各級分類結果

其實只需要biom格式就好了，唯一不足的是沒有把上幾級別的分類去除，比如屬級別，還包括門綱目科，還不是usearch那種直接就是這個分類的結果。但是根據我的經驗，usearch的物種註釋結果可能不如qiime2的分類效果好，所以怎樣結合這兩個方法是個需要解決的問題。

#結果按門、綱、目、科、屬五個級別進行分類彙總，對應結果的L2-L6
summarize_taxa.py -i result/otu_table3.biom -o result/sum_taxa # summary each level percentage

好的，我的分享就到這裏，期待大家有更好的解決方案。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

qiime2+biom+qiime1獲得16S物種丰度

1.導出物種分類信息和置信度

2.導出 BIOM 表，並加入將物種分類註釋信息：

MacOS Catalina 運行32位命令行程序的小經驗

2019已走，總結我有

ubiome類似數據dada2處理探索1

ubiome類似數據dada2處理探索2

2019新冠狀病毒學習筆記

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結