基因測序儀發展史.

NGS十年發展史,看這篇就夠了 | Nature綜述解讀

日前 Nature Reviews Genetics 刊出了一篇綜述,盤點近十年來測序技術的發展。從最初的“高山仰止”到如今走進尋常百姓家,正是測序公司和科研人員們孜孜不倦的努力,推動了行業不斷向前發展,而其中的佼佼者,也在特定的歷史時期留下了屬於自己的印記。

自2003年人類基因組計劃完成之後,測序技術發展迅猛,多種測序原理產品在市場上出現,接受市場的檢驗。測序讀長不斷加長、通量不斷提升、時間不斷縮短,促進測序成本快速下降,大量基因組序列被破譯,測序物種數量和物種多樣性與日俱增。

“基因科技造福人類。”從時間的縱軸上看,NGS測序儀的出現具有非凡意義,測序技術的發展自此勢如破竹、高歌猛進。最初個人全基因組測序費用高達令人咋舌的1億美金,發展到2008年,一個100Gb數據量的人基因組只需幾十萬美金,降幅達99%。到今天,一個100Gb數據量的人基因組只需要1000美金左右,僅相當於1億美金的五萬分之一!

一、NGS技術發展史

在測序技術發展初期,就像是春秋戰國時期的百家爭鳴,各種idea都會受熱捧,大家都很有熱情去嘗試新技術。比較有代表性的是以下幾種:

第一臺NGS測序儀是在2005年出現的,454公司推出第一個基於焦磷酸測序原理的高通量基因組測序系統——Genome Sequencer 20 System,這是核酸測序技術發展史上里程碑式的事件。隨後,羅氏公司以1.55億美元收購了454公司,並在2006年推出了更新的GS FLX測序系統。

隨着其他測序技術的出現,454技術讀長長(最長可以到1000bp),且準確度高,在二代測序中屬於佼佼者,卻因其成本較高,市場接受度不高,導致2013年羅氏公司表示,它將在未來3年內關閉454生命科學測序業務,並裁掉約100名員工。今年年中其位於美國康涅狄格州布蘭福德的454工廠也將最終關閉。

2006年,Solexa公司也推出了自己的NGS系統——Genome Analyzer,簡稱GA。這套基於DNA簇(DNA cluster)、橋式PCR(Bridge PCR)和可逆阻斷(Reversible terminator)等核心技術的系統具有高通量、低錯誤率、低成本、應用範圍廣等優點。2007年,Illumina公司以6億美元的高價收購了Solexa,使GA得以商品化。

GA最早期的版本一次運行可獲得1Gb的數據,因此也有1Gb Analyzer的含義,而最新的HiSeqX10平臺則能夠在3天的運行中獲得16Tb以上的數據,讀取的鹼基長度達到150bp。

在上述兩家公司之前,測序市場的壟斷地位一直由美國應用生物系統公司(ABI)牢牢掌控。自公司的共同創始人Leroy Hood在上世紀80年代中期設計了第一臺自動熒光測序儀之後,生命科學研究就擺脫了手工測序的繁瑣和辛勞,驕傲地邁入自動測序的新時代。

但是,2005年454推出了FLX焦磷酸測序平臺,ABI的領先地位被撼動,於是,後者迅速收購了一家測序公司——Agencourt Personal Genomics,並在2007年底推出了SOLiD 新一代測序平臺。從SOLiD到SOLiD 3,短短一年多時間,它已經上演了一出精彩的“一級方程式賽車”。到SOLiD 5平臺的測序通量已達到30Gb/天,成本低於60美元/Gb,準確率高達99.99%。並且由於SOLiD系統採用的不是PCR反應進行DNA合成與測序,因此對於高GC含量的樣本,SOLiD系統具有非常大的優勢。

可以說,測序市場在2010年前後形成了454、Solexa和SOLiD三足鼎立的局面。但是後續SOLiD系統通量難以提升,且讀長短、成本高,現已退出了歷史舞臺。

後續還出現了Complete Genomics公司的Black Bird測序儀、Life Technologies 公司的Ion Proton(如今被Thermo Fisher收購)系列測序儀等,不過都由於自身的短板導致市場份額逐漸縮小。

直至2013年3月18日,華大基因宣佈以1.176億美元完成對美國納斯達克上市公司Complete Genomics的全額收購。歷經兩年的技術改進和研發,在第十屆國際基因組學大會(ICG-10)上,華大基因正式發佈了自主研發的新型桌面化測序系統BGISEQ-500。

BGISEQ-500具備精準、簡易、快速、靈活、經濟等特點,單項應用最快可在24小時內完成,針對個人基因組檢測精度可達99.99%,充分滿足科研和臨牀領域的不同測序需求,在測序準確度、一致性等關鍵指標上達到甚至超過成熟商業測序系統。

在研發過程中,華大基因不斷突破技術壁壘,持續獲得關鍵技術和核心應用的自主知識產權,包括DNA納米球文庫構建技術、Pattern Array模版陣列技術、cPAS測序技術等一系列全球頂尖的測序原理和配套軟硬件,爲BGISEQ-500提供最出色的測序性能和最堅實的技術支持。基於BGISEQ-500的應用也已經逐步推出,首個面世的RNA-Seq產品因其優異的準確性、重複性和一致性,獲得科研用戶的一致好評和熱忱推薦。

爲了解決大多數科研用戶日益增長的測序需求與現有的測序瓶頸之間的矛盾,華大基因基於BGISEQ-500提出了測序應用整體解決方案BGISEQ-500n。其針對不同的測序應用需求,通過對n臺BGISEQ-500的優化配置,構建靈活的大、中、小型測序平臺,力求爲廣大科研工作者提供最高效、最便捷的一體化測序解決方案。BGISEQ-500n不僅具備BGISEQ-500的樣品處理、樣品檢測、測序結果分析等一系列軟硬件工具,還將整合包括實驗室構建、平臺運行測試、樣本數據庫構建、數據分析、人員培訓等一系列標準化的配套應用模板。此外,BGISEQ-500n還將提供強大的多組學測序網絡,並連通生物信息分析雲平臺BGI Online,提供靈活的存儲和計算解決方案,支持流暢的異地化部署。

二、NGS原理特點(短讀長測序)

模板擴增

模板需要放大信號,即我們通常說的建庫,需要把待測序的核酸擴增,如下圖所示,NGS技術模板擴增主要有以下四種策略:

1.乳液PCR【454(Roche),SOLiD(Thermo Fisher),GeneReader(Qiagen),Ion Torrent(Thermo Fisher)】

在乳液PCR,片段DNA模板與dNTP、引物和DNA聚合酶包在一個油滴中。在凝膠中進行PCR擴增,最後得到成千上萬份相同的DNA序列。

2.固相橋式擴增【Illumina】

片段DNA分散到Flowcell上,與固定的引物結合,進行橋式擴增,從而形成很多DNA簇。

3.固相的模板移位【SOLiD Wildfire(Thermo Fisher)】

片段DNA與固定的引物結合,PCR擴增延長引物得到第二天鏈。然後部分變性,使得自由端可以與鄰近的引物結合,再次擴增,起到放大的效果。

4.DNA納米球【Complete Genomics】

片段DNA加兩次接頭,然後進行滾環擴增,形成一個DNA納米球,最後納米球通過雜交的原理固定在陣列的flow cell。

測序原理

1.基於連接的測序原理(SBL)——SOLiD & Complete Genomics

簡單說,SBL測序就是用1-2個已知鹼基標記的探針與目標DNA雜交,然後再與下一個標記的探針連接,檢測標記探針的信號,從而知道目標DNA的序列信息。

SOLiD的全稱是Sequencing by Oligo Ligation Detection,即寡聚物連接檢測測序,其基本原理是通過熒光標記的8鹼基單鏈DNA探針與模板配對連接,發出不同的熒光信號,從而讀取目標序列的鹼基排列順序。

CG的測序原理叫組合探針錨定連接(cPAL),利用四種不同顏色標記的探針去讀取接頭附近的鹼基,探針能夠與DNA片段結合,T4 DNA連接酶連接探針和anchor,使探針穩定結合,從該探針攜帶的熒光基團的顏色爲判斷出該位置是何種鹼基。當一輪反應結束後,去除anchor-prob產物,重複上一輪步驟測序下一個鹼基。

2.基於合成的測序(SBS)

SBS這個術語是用來描述依賴DNA聚合酶來測序的方法,但是SBS方法又可以分爲循環可逆終止(CRT)和單鹼基添加(SNA)。

雖然Qiagen公司的GeneReader也是採用CRT的測序原理,但我們熟知的還是Illumina的CRT測序原理。四種dNTP被不同的熒光標記,每個循環就結合一個互補的鹼基,拍四次照,四個照片重合,出現哪種熒光標記就可以確定是哪個鹼基。反應之後熒光基團會被切除,這樣就露出了3’羥基基團(-OH),可以與下一個鹼基連接。

另一種SBS測序方法叫單鹼基添加(SNA),454焦磷酸測序和Ion Torrent都屬於這種測序原理。SNA的方法依賴單個信號來標記每個測序的鹼基。因爲它不能終止反應,所以每次只能允許進一種鹼基來防止繼續延長。這樣要是單鹼基重複就會繼續讀取。

454是第一臺NGS測序儀,它的SNA系統是含有特定引物的珠子連同酶混合物一起進入PicoTiterPlate,當有一個鹼基連入DNA鏈,就會產生一個生物熒光信號,通過相機捕獲。

Ion Torrent是第一臺不用光學傳感的測序儀。它是通過測序過程中產生的氫離子,使用CMOS-ISFET檢測器來檢測PH值來識別不同鹼基。所以要是有連續鹼基重複的情況下,準確度不高。

三、長序列讀取技術

讀長短一直是二代測序的軟肋,對於高度雜合的基因組、高度重複序列、高GC的區域、拷貝數變異、大的結構變異等問題,二代測序都解決不了。讀長長也有利於轉錄組的研究,可以直接獲得全長轉錄組。

目前市場上出現的長讀長技術主要有兩類:一是單分子實時測序技術,主要有兩家公司:Pacific BioScience和Oxford Nanopore;二是標記大片段,通過短讀長數據拼接形成大片段,CG公司早在2012年就發表了這個技術,但後續推出商業化試劑盒的是Illumina和10X Genomics。

單分子長片段測序

2013年英國Oxford Nanopore Technologies公司宣佈將啓動MinION測序儀的試用計劃,參與者只需支付1000美元的押金以及運費,就可以收到一臺MinION測序儀,包括測序USB裝置、流動槽和軟件。測序儀很小,是真正的掌上測序儀。但兩年多了,市面上還沒有看到這個測序儀的大規模使用,可能在性能方面沒有達到預期。

目前開發者利用該測序儀體積小、建庫快、實時產生數據等特點獲得資本投資。2014年埃博拉病毒爆發,MinION測序儀以最快的速度破譯病毒序列,這可能是目前爲止它最突出的應用,希望未來會有新的突破。

目前比較受市場熱捧的三代測序是PacBio的RSⅡ。該測序技術不需要對目標DNA進行PCR擴增,而是直接在目標片段兩端加上兩個髮卡結構的接頭,形成一個連續的環狀。單個DNA片段分佈到Pacific Biosciences公司發明的一種直徑只有幾十納米的納米孔【zero-mode waveguides (ZMWs)】,單分子的DNA聚合酶被固定在這個孔內。A、T、C、G這四種熒光標記的脫氧核苷酸非常快速地從外面進入孔內又出去,當某一種熒光標記的脫氧核苷酸被摻入到DNA鏈時,這種特定顏色的熒光會持續一小段時間,直到新的化學鍵形成、熒光基團被DNA聚合酶切除爲止。共聚焦顯微鏡實時、快速地對集成在板上的無數的納米小孔同時進行記錄。

人工合成長片段測序

另外一種長片段測序技術就是先把大片段DNA(>10Kb)用接頭標記,然後建小片段文庫得到短序列,根據接頭信息拼接還原大片段。

Illumina採用384孔板對大片段進行物理分離,使得每個孔裏儘量只有一條DNA片段,每個孔分別標記,單獨建小片段文庫,最後所有文庫混合形成一個文庫,在HiSeq測序平臺上測序。

10X Genomics則採用了乳液PCR的方法在單管裏面操作,大片段DNA與凝膠珠子、引物、酶、dNTP等分佈在一個個油滴裏面,形成一種物理分隔。每個油滴裏面有一種標籤,形成一個小片段文庫,最後加熱使凝膠溶解、解除油滴封閉,混合產物在HiSeq測序平臺上測序。這個平臺的好處是採用了14個鹼基的標籤,油包水的方法可以使標籤使用率最大化,且減少耗材和人工操作,更加利於推廣。

單分子實時測序VS合成大片段測序

四、與NGS存在競爭或互補關係的技術

測序不是萬能的,不能解決所有問題。除了NGS之外,下面這4種技術各有優點,可以彌補它的不足之處。

1. DNA芯片

基因芯片早在上世紀80年代就在生命科學領域應用了。利用鹼基互補原理,以單鏈DNA(ssDNA)作爲探針,與目標DNA雜交,檢測熒光信號來確定目標分子的強度。應用很廣泛,SNP分型芯片可以用於疾病篩查(如心血管疾病、癌症、病原菌)和GWAS分析;低分辨度的芯片還可以做結構變異、拷貝數變異、蛋白與DNA互作研究。表達譜芯片可以檢測已知基因的表達量。

因芯片具有可重複性高、價格低、操作簡單等特性,目前在基因組研究中應用廣泛。表達譜芯片有可能被RNA-seq取代。

2. NanoString

美國NanoString 是繼生物芯片技術和新一代測序技術(NGS)後,在基因表達譜分析上展示出強大應用前景的新技術公司。nCounter Analysis System是直接對基因表達進行多重計數的全新數字式技術,利用分子條形碼和單分子成像來檢測及統計每一個反應體系中特定轉錄本的數量,表現出極高的靈敏度、精確度和重複性。該技術上無需使用酶,無需反轉錄,也不需要做PCR 擴增,可進一步減少誤差的產生,因此nCounter 在表達譜定量分析領域具有無可比擬的優勢。

3. qPCR

實時熒光qPCR早在上世紀90年代就在臨牀和科研領域廣泛推崇使用了。因它具有高靈敏性和特異性,被美國FDA承認並推崇,是當今世界用於臨牀的最先進核酸分子診斷技術。

4. Optical Mapping

Optical Mapping技術是基於限制性內切酶圖譜的技術,可以稱之爲光學化或數字化酶切指紋圖譜技術。將DNA固定在界面上,在界面表面進行酶切反應,然後將DNA進行熒光染色,並在顯微鏡下觀測。每條DNA被酶切後的片段大小及順序形成單分子限制性酶切指紋。軟件利用酶切指紋組裝成最終的指紋圖譜。

該技術主要是用來輔助基因組序列組裝:輔助延伸scaffold,使基因組圖譜更精細;發現染色體的倒置、插入、缺失和置換;識別並糾正錯誤組裝序列;檢測gap大小及位置。

美國BioNano 公司開發的Irys系統在它的基礎上進行改進,只是在DNA單鏈上切口(不切斷),加入熒光基團,然後讓整條DNA鏈通過納米通道。他們的理想是最終真實展現染色體的情況,最新研發結果是可以讓酵母12M的染色體完整展現。

五、結語

雖然目前測序技術處於快速發展的階段,新技術層出不窮,週期不斷壓縮、成本逐年下降,使得臨牀醫生可以把基因組數據轉化成具有臨牀指導意義的結果。但我們還面臨新的挑戰,如果想在臨牀上進一步擴大應用,那麼時間是一個問題。因爲目前測序技術從樣品準備到數據分析完成還是需要幾周的時間,但是對於惡性腫瘤的診斷和一些疑難雜症的診斷,可能只有幾天的時間。

另一個挑戰就是數據存儲和數據分析。2013年有研究者推測,全球每年會新增15PB的數據。這麼龐大的數據需要有創新性的存儲系統和生物信息分析解決方法。

此外,消費者會對遺傳檢測結果作何反應?假陰性和假陽性結果對患者會帶來什麼影響?這些基因組數據的使用效果和倫理問題,是每一個業內人士都需要思考的

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章