泛基因組分析流程psvcp:試着運行流程中提供的示例數據

流程github 主頁

https://github.com/wjian8/psvcp_v1.01

對應論文

A pangenome analysis pipeline provides insights into functional gene identification in rice

依賴軟件 除了mummer4.0以外都可以用conda安裝

mummer安裝遇到的報錯

運行如下命令

./configure --prefix=/home/myan/biotools/mummer-4.0.0beta

報錯信息

error: Compiler does not support std::this_thread::sleep_for

查了一下這個報錯信息,說可能是和gcc g++的版本有關,我在我的虛擬環境下運行了瞭如下命令

conda install gxx 

然後再運行如下命令就沒有報錯了

./configure --prefix=/home/myan/biotools/mummer-4.0.0beta

依賴軟件除了github主頁寫的,還有biopython 和 mosdepth

試着運行示例數據的時候還遇到了報錯

The following objects are masked from ‘package:parallel’:

clusterApply, clusterApplyLB, clusterCall, clusterEvalQ,
clusterExport, clusterMap, clusterSplit, makeCluster, parApply,
parCapply, parLapply, parRapply, parSapply, splitIndices,
stopCluster

Error in .set(h, keys = file_name, values = read.table(file = paste(depthfile_dir, :
could not find function ".set"

這部分是R腳本里的報錯,.set是hash這個R包裏的函數,自己之前是用conda install r-hash安裝的這個R包 查了一下安裝的版本是3.0.1,自己在筆記本電腦上用install.packages('hash')安裝這個R包,安裝的版本是2.2.6.2 可能是R包的版本對不上,最新版R包裏可能沒有.set()這個函數,在linux系統下直接用install.packages('hash')這個命令來安裝這個R包

還有一個問題是 使用conda 安裝Assemblytics這個軟件的時候會自動安裝一個3點幾版本的mummer

我把手動安裝的4.0版本的mummer添加到的環境變量,重新鏈接服務器再次運行這個流程,優先調用的還是conda環境下的3點幾版本的mummer, 還得source ~/.bashrc 纔會優先調用自己手動安裝的mummer4.0 這個暫時有些搞不明白

(這裏如果先安裝mummer4,添加到環境變量,然後再conda安裝Assemblytics應該就不會有這個問題了)

運行流程

python /mnt/sdc/chloro/biotools/psvcp_v1.01-main/psvcp.py ConstructPanAndCallPAV ../example7/genome_gff_dir_example ../example7/genome_list -fqd ../example7/fq_dir_example -o population_hmp

沒有遇到報錯

最後也沒有看到所有流程都運行完的提示

最終的輸出結果

結果文件對應的誰是誰還得好好研究

歡迎大家關注我的公衆號

小明的數據分析筆記本

小明的數據分析筆記本 公衆號 主要分享:1、R語言和python做數據分析和數據可視化的簡單小例子;2、園藝植物相關轉錄組學、基因組學、羣體遺傳學文獻閱讀筆記;3、生物信息學入門學習資料及自己的學習筆記!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章