Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome

Oxford Nanopore sequencing, hybrid error correction, and de novo assembly of a eukaryotic genome

牛津納米孔測序,雜交錯誤糾正,和重新組裝的真核生物基因組

幾十年來,通過膜孔來監測DNA分子的進展一直被認爲是DNA測序的一種方法。最近,一種基於納米孔的測序儀器——牛津納米孔(Oxford Nanopore MinION)問世了,我們用它對釀酒酵母(Saccharomyces cerevisiae)基因組進行了測序。爲了利用這些數據,我們開發了一種新的開源混合錯誤校正算法Nanocorr,專門針對牛津納米孔讀取,因爲現有的包無法在如此高的錯誤率(5%到40%的錯誤率)下裝配長讀取長度(5 50 kbp)。使用這種新方法,我們能夠執行一個混合糾錯的納米孔讀取使用互補MiSeq數據和產生一個新創裝配高度連續、準確:在疊連羣將軍一個長度超過10倍Illumina-only組裝(678 kb和59.9 kbp)和> 99.88%一致認同相比,參考。此外,具有長納米孔reads的裝配更完整地表達了基因組的特徵,並正確地裝配了基因盒、rRNAs、轉座元件和其他基因組特徵,而這些特徵在純illumina的裝配中幾乎完全不存在。

       大多數DNA測序方法是基於DNA分子的化學裂解(Maxam和Gilbert 1977)或新的DNA鏈的合成(Sanger等人1977),這些方法在當今的大多數測序例程中被使用。在更常見的基於合成的方法中,一種或另一種形式的鹼基類似物被合併到一個新生的DNA鏈中,該DNA鏈要麼標記在其起源的引物上,要麼標記在新合併的鹼基上。這是目前大多數測序儀所使用的測序方法的基礎,包括Illumina, Ion Torrent,和Pacific Biosciences (PacBio)測序,以及它們的早期前輩(Mardis 2008)。另一種方法是,人們觀察到,通過監測不同類型孔隙的進展,可以對單個DNA分子進行測序(Kasianowicz等,1996年;Venkatesan和Bashir 2011)最初設想的是來自噬菌體顆粒的孔隙(Sanger et al. 1980)。這種方法的優點包括潛在的非常長的無偏置序列讀取,因爲在測序中既不需要擴增,也不需要化學反應(Yang et al. 2013)。

  最近,我們開始使用來自牛津納米孔技術公司(ONT)的nanopore技術,通過他們的early access項目(Eisenstein 2012)測試一種測序設備。這個設備,小黃人,是一個基於納米孔的設備,孔被嵌入在放置在電檢測網格上的膜中。當dna分子穿過這些小孔時,它們會在離子流中產生可測量的變化。波動是序列相關的,因此可以通過鹼基調用算法來推斷每個分子中的核苷酸序列(Stoddart et al. 2009;Yang et al. 2013)。作爲庫準備協議的一部分,髮卡髮卡適配器連接到雙股dna樣本的一端,而一個“運動蛋白”與另一個結合,解開DNA並控制核苷酸通過小孔的速度(Clarke等,2009年)。在理想的條件下,前導模板鏈通過孔隙,然後是髮夾接頭,然後是補鏈。在這樣的運行中,兩個鏈都被測序,一個分子的共識序列可以產生;這些共識讀被稱爲“2D讀”,通常有比單次讀取分子(“1D讀取”)的精度更高。

       手持式測序儀產生超長讀取長度的能力爲基因組學的許多重要應用打開了潛力,包括新基因組的從頭基因組組裝,健康或患病樣本的結構變異分析,甚至當應用於cDNA測序時的亞型解析。然而,目前1D和2D讀取類型都有很高的錯誤率,這限制了它們直接應用於這些問題,需要一套新的算法。在這裏,我們報告了我們的經驗排序酵母菌(酵母)基因組與儀器,包括深入分析數據特徵和誤差模型。我們也描述了我們新的混合誤差校正算法,Nanocorr,它利用高質量的短讀MiSeq測序來計算拋光長納米孔讀。經過錯誤糾正後,我們重新組裝基因組使用錯誤糾正的長讀產生一個非常高質量的基因組與每個染色體組裝成一小部分的疊架在非常高的序列身份。我們進一步證明了我們的誤差校正幾乎是最優的:我們用錯誤修正的真實數據方法得到的結果與直接從參考基因組中提取的理想化的模擬讀的結果是一致的。最後,我們通過糾正在不同機構測序的大腸桿菌K12基因組的長牛津納米孔的錯誤來驗證這些結果,併產生一個本質上完美的基因組從頭組裝。因此,我們相信我們的混合糾錯和裝配方法將普遍適用於許多其他排序項目。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章