流程github 主頁
https://github.com/wjian8/psvcp_v1.01
對應論文
A pangenome analysis pipeline provides insights into functional gene identification in rice
依賴軟件 除了mummer4.0以外都可以用conda安裝
mummer安裝遇到的報錯
運行如下命令
./configure --prefix=/home/myan/biotools/mummer-4.0.0beta
報錯信息
error: Compiler does not support std::this_thread::sleep_for
查了一下這個報錯信息,說可能是和gcc g++的版本有關,我在我的虛擬環境下運行了瞭如下命令
conda install gxx
然後再運行如下命令就沒有報錯了
./configure --prefix=/home/myan/biotools/mummer-4.0.0beta
依賴軟件除了github主頁寫的,還有biopython 和 mosdepth
試着運行示例數據的時候還遇到了報錯
The following objects are masked from ‘package:parallel’:
clusterApply, clusterApplyLB, clusterCall, clusterEvalQ,
clusterExport, clusterMap, clusterSplit, makeCluster, parApply,
parCapply, parLapply, parRapply, parSapply, splitIndices,
stopCluster
Error in .set(h, keys = file_name, values = read.table(file = paste(depthfile_dir, :
could not find function ".set"
這部分是R腳本里的報錯,.set是hash這個R包裏的函數,自己之前是用conda install r-hash安裝的這個R包 查了一下安裝的版本是3.0.1,自己在筆記本電腦上用install.packages('hash')
安裝這個R包,安裝的版本是2.2.6.2 可能是R包的版本對不上,最新版R包裏可能沒有.set()這個函數,在linux系統下直接用install.packages('hash')
這個命令來安裝這個R包
還有一個問題是 使用conda 安裝Assemblytics這個軟件的時候會自動安裝一個3點幾版本的mummer
我把手動安裝的4.0版本的mummer添加到的環境變量,重新鏈接服務器再次運行這個流程,優先調用的還是conda環境下的3點幾版本的mummer, 還得source ~/.bashrc 纔會優先調用自己手動安裝的mummer4.0 這個暫時有些搞不明白
(這裏如果先安裝mummer4,添加到環境變量,然後再conda安裝Assemblytics應該就不會有這個問題了)
運行流程
python /mnt/sdc/chloro/biotools/psvcp_v1.01-main/psvcp.py ConstructPanAndCallPAV ../example7/genome_gff_dir_example ../example7/genome_list -fqd ../example7/fq_dir_example -o population_hmp
沒有遇到報錯
最後也沒有看到所有流程都運行完的提示
最終的輸出結果
結果文件對應的誰是誰還得好好研究
歡迎大家關注我的公衆號
小明的數據分析筆記本
小明的數據分析筆記本 公衆號 主要分享:1、R語言和python做數據分析和數據可視化的簡單小例子;2、園藝植物相關轉錄組學、基因組學、羣體遺傳學文獻閱讀筆記;3、生物信息學入門學習資料及自己的學習筆記!