Magic-BLAST is a tool for mapping large next-generation RNA or DNA sequencing runs against a whole genome or transcriptome.
前面一段 時間看到NCBI上blast出了一個新系列,短序列的mapping。基本與blast使用體驗一致。也可以進行長片段的mapping,比如EST。默認參數最好要調下。
1、下載
官網下載(ftp://ftp.ncbi.nlm.nih.gov/blast/executables/magicblast/LATEST)
我下載的是編譯之後的,下載之後將magicblast和makeblastdb拷貝至系統全局變量路徑即可。
2、使用
對經常使用blast的人來說使用非常簡單。甚至不用將reference序列建庫,直接使用fasta格式的序列文件即可。比如:
magicblast -query SRR1228245_1.fastq.gz -query_mate SRR1228245_2.fastq.gz -infmt fastq -subject ref.fa -outfmt sam -out SRR1228245_blast.sam -num_threads 10 -splice T
其實,如果前面使用過makeblastdb將參考基因組建庫,magicblast可以直接使用。比如
magicblast -query SRR1228245_1.fastq.gz -query_mate SRR1228245_2.fastq.gz -infmt fastq -db /data2/Fshare/IWGSC_v1.0_Formatdb/CS_v1.0_full -outfmt sam -out SRR1228245_blast.sam -num_threads 10 -splice T #如果是DNA_seq ,需要將 -splice 設爲 F
支持的輸入格式 SRA, FASTA, FASTQ, or FASTC 等。在NCBI上下載的SRA序列這次可以直接使用了