二代測序短序列mapping新選擇:Magic-BLAST

Magic-BLAST is a tool for mapping large next-generation RNA or DNA sequencing runs against a whole genome or transcriptome.

前面一段 時間看到NCBI上blast出了一個新系列,短序列的mapping。基本與blast使用體驗一致。也可以進行長片段的mapping,比如EST。默認參數最好要調下。

1、下載

官網下載(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/magicblast/LATEST

我下載的是編譯之後的,下載之後將magicblast和makeblastdb拷貝至系統全局變量路徑即可。

2、使用

對經常使用blast的人來說使用非常簡單。甚至不用將reference序列建庫,直接使用fasta格式的序列文件即可。比如:

magicblast -query SRR1228245_1.fastq.gz -query_mate SRR1228245_2.fastq.gz -infmt fastq -subject ref.fa  -outfmt sam -out SRR1228245_blast.sam -num_threads 10 -splice T

其實,如果前面使用過makeblastdb將參考基因組建庫,magicblast可以直接使用。比如

magicblast -query SRR1228245_1.fastq.gz -query_mate SRR1228245_2.fastq.gz -infmt fastq -db /data2/Fshare/IWGSC_v1.0_Formatdb/CS_v1.0_full -outfmt sam -out SRR1228245_blast.sam -num_threads 10 -splice T #如果是DNA_seq ,需要將 -splice  設爲 F

支持的輸入格式 SRA, FASTA, FASTQ, or FASTC 等。在NCBI上下載的SRA序列這次可以直接使用了

發佈了75 篇原創文章 · 獲贊 32 · 訪問量 30萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章