測序數據量:
常見的測序量概念有 M 和 G ,for example 10M 和 10G
解釋:
M 常用於描述reads 的數量。 例如 10M 就是 10 *10^6 條reads
G 常用於描述這一批次測序共有的鹼基數量。 例如 10G 就是10*10^9個鹼基
M 和 G 之間的關係
比如說對於3G測序量的理解:
3G指有 5*10^9 個鹼基,假如採取illumia的PE150測序,即150bp雙端測序,算有多少M測序量的公式爲 3*10^9 / 150 / 2 =10 M
測序深度
測序深度 = 測序得到的鹼基總個數 / 參考基因組大小
比如說對於30G測序量的人類基因組測序深度是多少?(人類參考基因組3G)
測序深度 = 30*10^9 / 3*10^9 =10X
測序覆蓋度
測序獲得的序列佔整個基因組的比例
測序深度 | 覆蓋率 | SNP檢出率 | 研究目的 |
6-10X | 90%-99% | 70%-90% | 羣體結構,羣體選擇分析等等 |
30X | 99.9%-100% | 95%-99% | 個體基因組信息 |
50X | 99.9%-100% | >99% | BSA、癌細胞樣本測序、關心突變頻率的研究類型 |