Illumina測序原理

illumina二代測序平臺特點:基於可逆終止的、熒光標記dNTP,實現邊合成、邊測序的工作
文字描述着實有很多侷限性,文章起草基於這份視頻(雙端index),想要更輕鬆的閱讀體驗建議配合視頻一起看:http://www.bilibili.com/video/av13107081/?share_source=copy_link&p=1&ts=1610448077&share_medium=iphone&bbid=a68e072c29d899785ac6735b234b9654](http://www.bilibili.com/video/av13107081/?share_source=copy_link&p=1&ts=1610448077&share_medium=iphone&bbid=a68e072c29d899785ac6735b234b9654)
注意⚠️:文章內容純屬個人見解,如有錯誤歡迎批評指正~

1. 文庫製備

DNA文庫的定義:所謂的DNA文庫,實際上是許多個DNA片段,在兩頭接上了特定的DNA接頭。

DNA文庫的特點

  • 中間插入的DNA片段:是未知的各式各樣的DNA片段,也正是測序儀要檢測的序列片段
  • 接頭序列:是人工特地加上去的,其序列是已知的

如何製作DNA文庫:

基因組DNA用超聲波打斷(也可以用通過酶切的方法)獲得短的DNA片段,其粘性末端使用T4-DNA聚合酶補成平末端,然後用klenow酶在3'端加上polyA鹼基(方便接頭嫁接到DNA片段),最後,連接酶將特定的接頭連接上去。連接好接頭的DNA片段混合物,我們稱爲文庫。


2. 成簇反應

瞭解flowcell
flowcell(流動池)爲一個載玻片大小的芯片,裏面做了8條通道,通道的內表面做了專門的化學修飾:主要是用2種寡核苷酸(oligo)通過“共價鍵”種在玻璃表面-在flowcell通道有液體流動時不會輕易沖掉,這2種寡核苷酸(oligo)後面會和測序DNA文庫的接頭序列相互互補。

1)文庫片段附着到“flowcell上的oligo”
DNA文庫兩頭的序列和芯片上的引物鹼基互補,因此可以通過氫鍵力互補雜交。待測序的DNA片段通過氫鍵力與第一種oligo配對從而固定在flowcell上。
2)被文庫片段附着的oligo延伸出互補的DNA鏈
加入DNA聚合酶和dNTP,flowcell上的oligo做引物,以文庫片段爲模版,合成出一條全新的DNA鏈(和原來的文庫片段序列完全互補)
3)沖走文庫片段
加入NaOH鹼溶液,破壞氫鍵力,模版鏈(文庫片段)被沖走,只剩下與芯片通過共價鍵連接的DNA鏈
4)通過“橋式PCR”將序列信息複製到第2種oligo
加入中性液體,中和鹼液,創造可以產生氫鍵力的環境。
此時,第一種oligo所在DNA鏈上的自由端,會通過成橋的方式和flowcell上的第二種oligo互補配對(形成“單鏈橋”)。我們加入聚合酶和dNTP,聚合酶就沿着第二個oligo合成出一條新的鏈來(形成“雙鏈橋”)。
5)DNA鏈線性化
加入NaOH鹼溶液,破壞氫鍵力,“雙鏈橋”解開(兩個單鏈被固定在flowcell)
6)重複“橋式PCR”
再加入中性液體,中和鹼液。DNA鏈的遊離末端又和flowcel上新的oligo成橋,再加酶和dNTP,在尚未被佔用的oligo上合成新的DNA鏈。
連續重複以上過程,DNA鏈的數量以指數方式增長
7)形成測序鏈
多次橋式PCR完成之後,實現了DNA文庫序列在flowcell上的成倍擴增(實則是爲了放大測序階段的熒光信號)
後面要把合成的雙鏈,變成可以測序的單鏈
方法:把反義鏈上的特定基團切斷,即斷開了反義鏈與oligo的連接,然後用鹼溶液沖洗,被切斷了的DNA鏈被沖掉,只留下通過共價鍵連接的正義鏈。
同時,DNA鏈的3'端被封鎖,以防止與oligo的非特異結合。

3. 測序階段

瞭解 可逆終止、熒光標記的dNTP

  1. 熒光標記的dNTP:不同鹼基的識別信號(4種dNTP,每一種上面標的熒光素都不一樣)
  2. 阻斷基團:通過控制 3'羥基,控制鹼基的合成節奏


1)read1讀取
溶液狀態:加入中性溶液,使其適應測序階段。
所需原料:加入read1測序引物,熒光標記的dNTP,DNA聚合酶
測序過程:

  • 合成一個鹼基:根據鹼基互補的原理,DNA聚合酶將正確的dNTP合成到新的鏈上,合成一個鹼基後即停止
  • 激光掃描:用溶液把多餘的dNTP和酶沖掉,然後激光掃描,根據發出來的熒光判斷它是那個鹼基,根據鹼基互補的原則,反推模版鏈上的鹼基
  • 切掉熒光基團和阻斷基團:加入化學試劑,把疊氮鹼基和旁邊標記的熒光基團切掉(暴露出3'羥基)
  • 加入新的dNTP和酶:又延長一個鹼基,把多餘的酶和dNTP沖掉,激光掃描判斷鹼基類型
  • 重複以上過程,把上百個鹼基讀出來(循環的次數取決於讀長)
  • read1讀完之後,讀段產物會被鹼液沖洗掉

2)讀 index1 序列
因爲測序儀的測序通量很大,一個樣本用不到幾百萬條DNA,因此常常多個樣本的DNA文庫混在一起在同一條lane測序。而每一個樣本,都有一個特定的索引序列相互區分(也就是我們常說的index序列)。

  • 加入index1引物,與模版鹼基互補雜交
  • 與reads1的判讀過程類似,加入熒光標記的dNTP和DNA聚合酶判讀鹼基,讀完後用鹼液沖洗掉

3)讀 index2 序列

  • 3'端解除封鎖
  • 正義鏈摺疊結合到flowcell上的第2個oligo(形成“單鏈橋”)
  • 加入熒光標記的dNTP和DNA聚合酶,讀取index2

4)讀read2序列
形成反義鏈:
index2讀完之後,聚合酶繼續延伸,形成雙鏈橋
然後加入鹼液將DNA雙鏈線性化
正義鏈上的特定基團被切除並洗掉,只留下反義鏈

加入read2的測序引物,與reads1的讀取一樣,重複測序步驟

4. 數據分析

測序獲得的數百萬個讀段序列都通過 index序列 分離歸類到對應的樣本。

具有相似延伸鹼基的reads被聚類在一起,正向和反向reads配對形成連續序列,它們與參考基因組比對,用於突變識別(variant identification)


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章