高通量測序中常見名詞解釋

測序數據量:

常見的測序量概念有 M 和 G ,for example  10M  和 10G

解釋:

M 常用於描述reads 的數量。 例如 10M 就是 10 *10^6 條reads

G 常用於描述這一批次測序共有的鹼基數量。 例如 10G 就是10*10^9個鹼基

M 和 G 之間的關係

比如說對於3G測序量的理解:

3G指有 5*10^9 個鹼基,假如採取illumia的PE150測序,即150bp雙端測序,算有多少M測序量的公式爲 3*10^9 / 150 / 2 =10 M

 測序深度

測序深度 = 測序得到的鹼基總個數 / 參考基因組大小

比如說對於30G測序量的人類基因組測序深度是多少?(人類參考基因組3G)

測序深度 = 30*10^9 / 3*10^9 =10X

測序覆蓋度

測序獲得的序列佔整個基因組的比例

測序深度 覆蓋率 SNP檢出率 研究目的
6-10X 90%-99% 70%-90% 羣體結構,羣體選擇分析等等
30X 99.9%-100% 95%-99% 個體基因組信息
50X 99.9%-100% >99% BSA、癌細胞樣本測序、關心突變頻率的研究類型

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章