VCF文件的常見FILTER彙總

This field contains the name(s) of any filter(s) that the variant fails to pass, or the value PASS if the variant passed all filters. If the FILTER value is ., then no filtering has been applied to the records. It is extremely important to apply appropriate filters before using a variant callset in downstream analysis. See our documentation on filtering variants for more information on this topic. 

也就是說,除了 PASS,其他都是未通過的原因。

  1. FAIL:所有 alleles 都是 failed,但原因不同
  2. PASS
  3. base_qual:突變位點鹼基質量的中位數。SNV 是按突變位點算,InDel 按前一個鹼基算(如,AG>A, A<AG,都是按 A 的質量計算)。

    https://gatk.broadinstitute.org/hc/en-us/articles/360040098332-BaseQuality

  4. clustered_events:相同的局部組裝區域發生 co-occuring,200bp。https://www.jianshu.com/p/4e994a171555
  5. contamination:污染
  6. duplicate:因 dup 過表達
  7. fragment:支持突變的 reads 長度的中位數(非負,成對有效)
  8. germline: 證明是 germline,而不是 somatic
  9. haplotype:同一單倍型上已經被過濾的 var,本 var 在它附近
  10. low_allele_frac:等位基因分數低於閾值
  11. map_qual
  12. multiallelic:有太多 alt alleles 通過了 tumor LOD
  13. n_ratio:N 含量過高
  14. normal_artifact:artifact 是非自然的異象,可能是由於實驗or數據處理等因素引起的,而不是真實的生物學現象導致的
  15. orientation:方向偏差僞影。主要是在文庫製備時,由核酸中發生化學變化引起的。如,G A 配對現象。

    https://gatk.broadinstitute.org/hc/en-us/community/posts/360075017111-strand-bias-and-orientation-bias

  16. panel_of_narmals:PON 中的黑名單
  17. position:突變到 read 末尾的距離的中位數
  18. possible_numt:深度過低,可能是NuMT
  19. slippage:(滑動)縮小的短串聯重複區域
  20. strand_bias:等位基因的證據僅來自一個 read 方向
  21. strict_strand:證據不是雙向的
  22. weak_evidence:突變不符合可能性閾值

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章