高通量測序中常見名詞解釋

原創

2020-06-16 02:01

測序數據量：

常見的測序量概念有 M 和 G ，for example 10M 和 10G

解釋：

M 常用於描述reads 的數量。例如 10M 就是 10 *10^6 條reads

G 常用於描述這一批次測序共有的鹼基數量。例如 10G 就是10*10^9個鹼基

M 和 G 之間的關係

比如說對於3G測序量的理解：

3G指有 5*10^9 個鹼基，假如採取illumia的PE150測序，即150bp雙端測序，算有多少M測序量的公式爲 3*10^9 / 150 / 2 =10 M

測序深度

測序深度 = 測序得到的鹼基總個數 / 參考基因組大小

比如說對於30G測序量的人類基因組測序深度是多少？(人類參考基因組3G)

測序深度 = 30*10^9 / 3*10^9 =10X

測序覆蓋度

測序獲得的序列佔整個基因組的比例

測序深度	覆蓋率	SNP檢出率	研究目的
6-10X	90%-99%	70%-90%	羣體結構，羣體選擇分析等等
30X	99.9%-100%	95%-99%	個體基因組信息
50X	99.9%-100%	>99%	BSA、癌細胞樣本測序、關心突變頻率的研究類型

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

一些有用的UNIX命令

你將從這裏發現一些有用的UNIX命令，它們將會是你探索下一代測序數據的有力支撐。此外，從這裏你還可以發現更多更有用的命令.直接在命令行處敲這些命令將會詳細介紹它們. clear or Ctrl-l: clear screen上下箭

2020-07-04 20:48:10

使用preseq計算文庫複雜度以及估計加測量

在評估下機數據的時候，如果發現數據去重複之後無法達到目標覆蓋度，那麼就需要進一步加測。然而，有些文庫複雜度很低，即使加測很多數據也無法得到更多的有效信息。那麼如何評估文庫複雜度，判斷是否有加測的必要呢？使用preseq軟件可以實現根據現

2020-07-03 09:29:18

解析 pumbed的xml

meta分析中需要調研大量文獻, pubmed數據庫是主要來源, 但是pubmed 導出的文本文件,可讀性非常差,並且考慮到需要對文獻進行篩選和標記,xlsx是個很好的選擇. 下面代碼是把 xml 轉化爲 xlsx #!/usr/

2020-07-03 09:29:18

BWT 算法和序列比對的基本實現

昨天晚上和今天抽空實現了Burrows Wheleer Tansform,並且嘗試利用BWT，將短序列比對到長序列中。BWT的核心我覺得是要理解兩個原則： 1. F序列的每個元素是下標對應的L元素的後一位。 2. 排序後，F中第一個A和L

2020-07-03 09:29:18

改bam文件的樣本id

問題描述：有時經常遇到重測序的數據加測的問題，或者NCBI上下載的數據中一個樣本測了幾個庫，這個時候一個樣本就會有兩對或多對fastq文件。如果你把每個樣本分別比對，使用了不同的ID，那麼合併之後的ID就需要重新修改成樣本名，才能

2020-06-17 10:26:20

生物信息名稱備忘錄

生殖系突變（Germline mutation）與體細胞突變（Somatic mutation）生殖系突變（英語：Germline mutation）是指在生殖細胞中發生的任何可檢測、可遺傳的突變。在生殖細胞系以外的細胞中發生的

2020-06-16 02:01:42

plink格式的坑

2020-03-31 07:42:59

10X genomics scRNA_Seq 原理概念解說

2020-02-21 19:45:50

PICRUSt工具使用過程中的概念理解

2020-02-21 19:45:50

10X cellranger count 後的數據認識和使用

2020-02-21 19:45:50

10X_Genomics_scRNA_Seq 名詞解釋

2020-02-21 19:45:50

一些有用的UNIX命令

你將從這裏發現一些有用的UNIX命令，它們將會是你探索下一代測序數據的有力支撐。此外，從這裏你還可以發現更多更有用的命令.直接在命令行處敲這些命令將會詳細介紹它們. clear or Ctrl-l: clear screen上下箭

2020-07-04 20:48:10

使用preseq計算文庫複雜度以及估計加測量

在評估下機數據的時候，如果發現數據去重複之後無法達到目標覆蓋度，那麼就需要進一步加測。然而，有些文庫複雜度很低，即使加測很多數據也無法得到更多的有效信息。那麼如何評估文庫複雜度，判斷是否有加測的必要呢？使用preseq軟件可以實現根據現

2020-07-03 09:29:18

解析 pumbed的xml

meta分析中需要調研大量文獻, pubmed數據庫是主要來源, 但是pubmed 導出的文本文件,可讀性非常差,並且考慮到需要對文獻進行篩選和標記,xlsx是個很好的選擇. 下面代碼是把 xml 轉化爲 xlsx #!/usr/

2020-07-03 09:29:18

BWT 算法和序列比對的基本實現

昨天晚上和今天抽空實現了Burrows Wheleer Tansform,並且嘗試利用BWT，將短序列比對到長序列中。BWT的核心我覺得是要理解兩個原則： 1. F序列的每個元素是下標對應的L元素的後一位。 2. 排序後，F中第一個A和L

2020-07-03 09:29:18

24小時熱門文章

最新文章

最新評論文章