bcftools的多个子命令中都有--collapse参数的身影,例如bcftools norm 和bcftools concat中 -d和-D这两个参数,这两个参数的作用是去重duplicate 位点,去除的方式将按照通用参数 --collapse中指定的几个可选参数进行,这些方式包括如下截图中的几种
可以看到参数none将会认为chr,pos,ref,alt也就是染色体号,位置,reference allele, altnative allele完全相同的情况下才认为是一个duplicate 的位点,而all/snps/indels/both参数则只要求chr,pos相同,就认为这些位点是完全相同的。