泛基因组分析流程psvcp:试着运行流程中提供的示例数据

流程github 主页

https://github.com/wjian8/psvcp_v1.01

对应论文

A pangenome analysis pipeline provides insights into functional gene identification in rice

依赖软件 除了mummer4.0以外都可以用conda安装

mummer安装遇到的报错

运行如下命令

./configure --prefix=/home/myan/biotools/mummer-4.0.0beta

报错信息

error: Compiler does not support std::this_thread::sleep_for

查了一下这个报错信息,说可能是和gcc g++的版本有关,我在我的虚拟环境下运行了了如下命令

conda install gxx 

然后再运行如下命令就没有报错了

./configure --prefix=/home/myan/biotools/mummer-4.0.0beta

依赖软件除了github主页写的,还有biopython 和 mosdepth

试着运行示例数据的时候还遇到了报错

The following objects are masked from ‘package:parallel’:

clusterApply, clusterApplyLB, clusterCall, clusterEvalQ,
clusterExport, clusterMap, clusterSplit, makeCluster, parApply,
parCapply, parLapply, parRapply, parSapply, splitIndices,
stopCluster

Error in .set(h, keys = file_name, values = read.table(file = paste(depthfile_dir, :
could not find function ".set"

这部分是R脚本里的报错,.set是hash这个R包里的函数,自己之前是用conda install r-hash安装的这个R包 查了一下安装的版本是3.0.1,自己在笔记本电脑上用install.packages('hash')安装这个R包,安装的版本是2.2.6.2 可能是R包的版本对不上,最新版R包里可能没有.set()这个函数,在linux系统下直接用install.packages('hash')这个命令来安装这个R包

还有一个问题是 使用conda 安装Assemblytics这个软件的时候会自动安装一个3点几版本的mummer

我把手动安装的4.0版本的mummer添加到的环境变量,重新链接服务器再次运行这个流程,优先调用的还是conda环境下的3点几版本的mummer, 还得source ~/.bashrc 才会优先调用自己手动安装的mummer4.0 这个暂时有些搞不明白

(这里如果先安装mummer4,添加到环境变量,然后再conda安装Assemblytics应该就不会有这个问题了)

运行流程

python /mnt/sdc/chloro/biotools/psvcp_v1.01-main/psvcp.py ConstructPanAndCallPAV ../example7/genome_gff_dir_example ../example7/genome_list -fqd ../example7/fq_dir_example -o population_hmp

没有遇到报错

最后也没有看到所有流程都运行完的提示

最终的输出结果

结果文件对应的谁是谁还得好好研究

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章