Nature綜述:臨牀宏基因組學的應用與挑戰

導讀

臨牀宏基因組學(mNGS)是對患者樣本中微生物和宿主遺傳物質(DNARNA)進行綜合分析的一種新興的診斷技術,這種新興的方法正在改變醫生診斷和治療疾病的方式,其應用範圍廣泛,其應用範圍包括抗菌素耐藥性研究、微生物組學、人類宿主基因表達(轉錄組學)和腫瘤學。

本文在此回顧了mNGS目前在臨牀和公共衛生領域的各種應用。並討論了臨牀實驗室實施mNGS所面臨的挑戰,包括驗證和監管方面的考慮,並提出了克服這些挑戰的步驟。最後,本文展望了臨牀宏基因組學領域的未來發展方向,並預測了未來5年的發展方向。

論文ID

原名:Clinical metagenomics

譯名:臨牀宏基因組學

期刊:Nature Reviews Genetics

IF:43.704

發表時間:2019327

通信作者:Charles Y. Chiu

通信作者單位:美國加州大學舊金山分校實驗醫學系 

綜述框架

綜述框架

主要內容

1  mNGS在臨牀上的發展史

臨牀微生物學領域包括診斷微生物學、從臨牀樣本中鑑定病原體以指導感染患者的管理和治療策略、公共衛生微生物學和監測社區內的傳染病暴發源等。微生物實驗室的傳統診斷技術包括培養中微生物的生長和分離、病原特異性抗體(血清學)或抗原的檢測以及微生物核酸(DNARNA)的分子鑑定,即PCR雖然大多數分子分析只針對使用特定引物或探針的有限數量的病原體,但宏基因組方法表徵了樣本中存在的所有DNARNA,從而能夠分析整個微生物組以及患者樣本中的人類宿主基因組或轉錄體。幾十年來,宏基因組方法被廣泛應用於識別細菌感染,發現新的病毒病原和鑑定在健康和疾病狀態下人類病毒羣,以及用於法醫學應用。

儘管宏基因組學具有潛力並取得了很大成功,但由於許多因素,臨牀診斷應用仍落後於研究進展:

1. 微生物和宿主因素的複雜相互作用影響着人類的健康,例如微生物在調節宿主免疫反應中的作用,通常不清楚被檢測到的微生物是污染物、定殖者還是真正的病原體。

2. 此外,通用參考標準並且缺乏證明臨牀宏基因組分析的試驗驗證、重複性和質量保證的有效方法。

3. 考慮到成本、報銷、週轉時間、監管因素,也許最重要的是,臨牀效用也是在患者護理環境中常規實施臨牀mNGS的主要障礙。

本文在此回顧了mNGS目前在臨牀和公共衛生領域的各種應用。並討論了臨牀實驗室實施mNGS所面臨的挑戰,包括驗證和監管方面的考慮,並提出了克服這些挑戰的步驟。最後,展望了臨牀宏基因組學領域的未來發展方向,並預測了未來5年的發展方向。

 

2  臨牀宏基因組學的應用

到目前爲止,臨牀宏基因組學的應用包括各種綜合徵和樣本類型的傳染病診斷,疾病和健康狀態下的微生物組分析,以及人類宿主對感染的轉錄組學反應及腫瘤相關病毒及其基因組整合位點的鑑定(圖1。除傳染病診斷外,臨牀實驗室採用mNGS的速度很慢,大多數應用還沒有納入常規臨牀實踐。儘管如此,這些應用的廣度和潛在臨牀實用性很可能在不久的將來改變診斷微生物學領域。

 

1 宏基因組測序的臨牀應用。(A)在傳染病診斷中的應用包括直接鑑定原始臨牀樣本中的微生物(Aa);通過鑑定耐藥基因預測抗生素耐藥性(Ab);檢測物種或菌株水平的毒力決定因素,如分泌特定的內毒素或外毒素(Ac);抗病毒抗性預測(Ad)。(B )微生物組分析可在急性和慢性疾病狀態下告知疾病預後,併爲益生菌療法的發展奠定基礎。(C) RNA測序的轉錄組學可以在人類宿主反應的基礎上提高對感染性和非感染性疾病的診斷水平。利用NGS進行宿主轉錄組分析,可以構建一個分類指標,以高精度區分感染患者和未感染患者(Ca)。聚類熱圖分析確定了與感染相關的個體差異表達的宿主基因和與未感染相關的宿主基因(Cb)。(D)在腫瘤學中,病毒性腫瘤測序或液體活檢分析可用於同時檢測病原體和鑑定宿主基因突變。mNGS可用於檢測Merkel細胞多瘤病毒,該病毒與Merkel細胞癌的發生有關。宿主DNA的同時測序可以識別由包含T抗原(LT)的病毒基因組整合、隨後的LT抗原(Da)或病毒基因組整合前的LT抗原(Db)引起的突變。這兩種突變導致細胞轉化,從而推動腫瘤增殖。雖然這些基於測序的應用很有前途,但其中許多已經被納入常規臨牀實踐中。

 

2.1 傳染病診斷

傳統的診斷病人感染性疾病的臨牀模式是由醫生制定鑑別診斷,然後進行一系列測試,試圖找出病因。臨牀樣品中病原體常規檢測的範圍包括鑑定培養中生長的微生物(例如,通過生化表型檢測或基質輔助激光解吸/電離(MALDI)飛行時間質譜法),檢測生物體特異性生物標記物(例如抗原用乳膠凝集試驗或酶聯免疫吸附試驗(ELISA)抗體試驗或用PCR對單個試劑進行核酸試驗。這些通常包括與確定的臨牀綜合徵有關的最常見病原體,如腦膜炎和腦炎、急性呼吸道感染、敗血症或腹瀉病。

分子診斷分析爲診斷最常見的感染提供了一種相當經濟有效和快速的方法(通常< 2 h的週轉時間)。然而,目前使用的幾乎所有常規微生物試驗一次只能檢測一種或有限的病原體,或者要求從臨牀樣本中成功培養微生物。相比之下,雖然目前使用的NGS分析方法在速度上無法與傳統的檢測方法相比——在標準的Illumina儀器上單獨進行的測序需要超過18小時——mNGS可以使多種病原體——病毒、細菌,真菌和/或寄生蟲——根據唯一可識別的DNA/RNA序列從培養物或直接從臨牀樣本中識別。NGS方法的另一個關鍵優點是,測序數據可能被用於除了鑑定致病病原體之外的其他分析,例如通過RNA測序(RNA-seq)對轉錄組進行分析,從而確定微生物組特徵和人類宿主反應的平行分析。

因此,NGS在診斷中的臨牀應用可能是在最難診斷的病例中,或者對於潛在病原體譜較大的免疫功能低下的病人。最終,mNGS可能與多重分析具有成本競爭性,或用作排除感染性病因的預先“排除”分析。當然,通過多重PCR檢測或NGS檢測核酸,本身並不能證明被鑑定的微生物是致病的原因,而且這些發現必須在臨牀上加以解釋。特別是,在臨牀樣本中發現非典型或新的傳染源隨後進行驗證性研究,如組織活檢樣品的正交試驗和血清轉化證明,或酌情使用細胞培養或動物模型,以確定其真正的致病潛力。在研究實驗室或臨牀實驗室進行的臨牀樣品的NGS涉及許多步驟,包括核酸提取、DNA/RNA富集、文庫製備、PCR擴增(如果需要)、測序和生物信息學分析(圖2。任何能產生足夠核酸的體液或組織都可以進行NGS分析,這種分析既可以是靶向的,也可以是豐富單個基因或基因組區域的,即非靶向的,就像宏基因組鳥槍方法一樣(圖2。具體步驟的細節因實驗室而異,在其他地方有詳細描述。

 

2 靶向與非靶向鳥槍基因組一代測序方法。可以使用靶向或非靶向的下一代宏基因組測序(mNGS)方法對各種患者樣本以及培養的微生物菌落進行分析,以進行病原體鑑定、微生物組分析和/或宿主轉錄組分析。通用PCR(左)是一種靶向mNGS方法,它使用從保守區域設計的引物,例如在細菌(16S23S rRNA)或真菌和寄生蟲(18S rRNA28S rRNA或內部轉錄間隔區(ITS))中普遍保守的核糖體RNArRNA)基因。其他的引物可以設計成針對一組特定的病原體和/或基因,並用於多重反轉錄PCRPCR(多重擴增PCR)。NGS文庫的製備和擴增子的測序使病原菌的鑑定達到屬或種的水平。宏基因組測序(右)需要對臨牀樣本中的所有微生物和宿主核酸進行無偏鳥槍測序。構建了分離的DNARNA文庫;DNA文庫用於鑑定細菌、真菌、DNA病毒和寄生蟲,而RNA文庫用於鑑定RNA病毒和基於RNA測序的人類宿主轉錄組分析(熱圖,右下角)。由於在無偏mNGS中沒有使用任何引物或探針,因此絕大多數操作與人類宿主相對應,因此,從宏基因組文庫中檢測病原體是一項大海撈針的工作。使用磁珠的選擇性捕獲探針富集步驟可使來自宏基因組文庫的病原體和/或基因的靶向mNGS成爲可能。所有這些方法都與傳統臺式儀器(如Illumina HiSeq)和便攜式納米孔測序儀(如Oxford nanopore Technologies MinION)上的測序兼容。

 

2.1.1 靶向宏因組NGS分析

有針對性的方法有利於增加序列數據中病原體讀取的數量和比例。這一步驟可以提高對目標微生物的檢測靈敏度,儘管它限制了可以識別的潛在病原體的廣度。

1. 靶向方法的一個例子是使用高度保守的引物對臨牀樣本中與特定類型相對應的所有微生物進行通用PCR擴增和檢測,例如對細菌18S rRNA進行16S核糖體RNArRNA)基因擴增(圖2。靶向NGS方法的另一個例子是設計橫跨基因組的引物,以促進PCR擴增和擴增,從而直接從臨牀樣本中恢復病毒基因組。該方法已被用於跟蹤美國寨卡病毒(ZIKV)和西非埃博拉病毒的演變和傳播,並展示了實時監測對公共衛生干預措施的影響。

2. 另一種有針對性的方法是捕獲探針富集,即利用捕獲“誘餌”探針對宏基因組文庫進行雜交。這些探針的長度一般爲30-120 bp,探針的數量可以從小於50到大於200萬不等。儘管這種富集方法已被證明在研究環境中提高了宏基因組檢測的靈敏度,特別是對於病毒,但它還沒有被常規用於臨牀診斷。這一方法的一個有希望的應用可能是豐富臨牀樣本以表徵抗生素耐藥性,這是醫院中的一個相當大的問題,也是美國國家打擊抗生素耐藥性細菌行動計劃的主要重點。然而,與非靶向傳染病診斷方法相比,捕獲探針富集的缺點包括偏向於靶向微生物、增加步驟、增加成本和由於最大效率所需的額外處理而導致雜交時間長(24-48小時)。

 

2.1.2 非靶向宏因組NGS分析

非靶向mNGS分析放棄使用特異性引物或探針。相反,整個DNA/RNA(在反向轉錄到cDNA之後)被測序。利用細菌或真菌的純培養物,mNGS-reads可以組裝成部分或完整的基因組。這些基因組序列隨後被用於亞型和/或監測醫院爆發,以支持感染控制和/或公共衛生監測工作。

臨牀樣本的非靶向mNGS可能是綜合診斷感染最有希望的方法。原則上,幾乎所有的病原體,包括病毒、細菌、真菌和寄生蟲,都可以在一次檢測中識別。mNGS的一個侷限性是,該方法的靈敏度嚴重依賴於背景水平。例如,與無細胞體液相比,組織增加了人類宿主背景,導致微生物讀長的數量和比例減少,從而降低了對mNGS的敏感性。此外,定義診斷或預測疾病發展的特定微生物圖譜可能很困難,特別是在含有複雜微生物羣的非滅菌部位,如呼吸道分泌物或糞便。儘管如此,有幾個小組已經在臨牀實驗室改進修正案(CLIA)中成功地驗證了mNGS——經認證的診斷感染的臨牀實驗室,包括腦膜炎或腦炎、膿毒症和肺炎,這些分析現在可用於患者的臨牀參考試驗。

 

2.2 臨牀微生物組分析

許多研究人員現在使用mNGS而不是16S rRNA基因的靶向測序來深入鑑定微生物組。公衆越來越認識到微生物組及其可能參與急性和慢性疾病的狀態。然而,目前還沒有一種基於微生物組學的檢測方法被臨牀用於疾病的診斷或治療,部分原因是人們對微生物組學的複雜性及其在疾病發病機制中的作用認識不足。

微生物組學分析在Clostridium difficile 相關疾病的治療和治療中有着廣闊的應用前景。C. difficile 能感染腸道,產生毒素,可導致腹瀉、脫水、敗血症和死亡。C. difficile 難治性感染只發生在微生物羣的環境中,而微生物羣的環境會因暴露於廣譜抗生素或最近的胃腸道手術等因素而改變。糞便移植治療和潛在治療C. difficile 感染的有效率爲80%-90%,這突出了微生物羣在艱難梭菌感染中的重要性。在多個研究中使用mNGS來表徵微生物組分有助於細菌-益生菌混合物的開發,這種混合物可以作爲預防或治療艱難梭菌相關疾病的藥丸使用(圖1b

微生物組的另一個潛在應用是分析細菌多樣性,這可以提供病人的疾病是傳染性的還是非傳染性的線索。例如,一項用於鑑別肺炎患者呼吸道病原體的mNGS研究發現,經培養證實感染的個體其呼吸道微生物組的多樣性顯著降低。這種被稱爲失調的微生物羣的改變也被證明與對於肥胖、糖尿病和炎症性腸病,微生物羣的操作可能是治療這些病理狀況的一個途徑。

 

2.3 人類宿主對感染的轉錄組學反應

臨牀mNGS通常側重於微生物丰度;然而,在研究人類宿主對感染的反應中,基因表達分析具有互補作用(圖1C。用於檢測病原體(如臨牀樣本中的RNA病毒)的RNA文庫的mNGS偶然產生用於轉錄組(RNA-seq)分析的宿主基因表達數據。儘管RNA-seq分析通常是在全血或外周血單個核細胞(PBMC)樣本上進行的,但任何體液或組織類型都可能適合這些分析。通過RNA-seq表達譜對基因進行分類已被用於描述幾種感染,包括葡萄球菌菌血症、萊姆病、念珠菌病、結核病(區分潛在和活動疾病風險)和流感。基於機器學習的RNA-seq數據分析已被用於癌症分類,這些方法的翻譯可能有希望用於傳染病。含有數量有限的宿主生物標記物正在發展成爲流感、結核和細菌性敗血症的診斷分析。

雖然迄今爲止還沒有一種基於RNA-seq的分析方法被臨牀證實可用於患者,但RNA-seq分析的潛在臨牀影響是很高的。從與活性微生物基因表達相對應的微生物中提取的RNA的詢問可能能夠區分感染與定殖和活組織與死組織。此外,人類宿主的RNA-seq分析可用於直接從臨牀樣本中識別新的或未被充分認識的宿主-微生物相互作用,如之前對萊姆病、登革熱或瘧疾患者所示。RNA-seq在病原菌僅短暫存在的臨牀病例中可能特別有用(例如早期萊姆病或蟲媒病毒感染,包括西尼羅河病毒);類似於血清學檢測,根據病原體特異性人類宿主反應,間接診斷感染是可能的。對病原體特異性宿主反應的分析也可能有助於在複雜的臨牀亞基因組樣本(如多微生物膿腫或呼吸道流感)中鑑別真正的病原體。RNA-seq的另一個有前途的應用是在區分急性疾病的傳染性和非傳染性病因。例如,如果根據宿主反應判斷一種疾病更可能是非傳染性的(例如,自身免疫性疾病),臨牀醫生可能更願意停止使用抗生素,並用類固醇和其他免疫抑制藥物積極治療患者。隨着大規模測序數據的不斷產生,也許是由常規的臨牀mNGS測試驅動的,對人類閱讀的二次挖掘可能通過合併微生物和宿主基因表達數據來提高臨牀診斷的準確性。

 

2.4 在腫瘤學中的應用

在腫瘤學中,全基因組或定向NGS方法識別突變基因可用於同時發現與癌症相關的病毒(即皰疹病毒、乳頭狀瘤病毒和多瘤病毒)和/或收集病毒相互作用的數據。例如,mNGS對發現Merkel細胞多瘤病毒(圖1D至關重要,目前認爲Merkel細胞癌是一種罕見的皮膚癌,最常見於老年患者。迄今爲止,美國食品和藥物管理局(FDA)已批准臨牀使用兩個NGS小組測試腫瘤樣本中可操作的基因組畸變。在這些樣本中檢測與整合病毒和外源病毒相對應的讀碼,可以在面板上添加特定的病毒探針,也可以在對整個腫瘤基因組或菲氏體進行測序時偶然完成。

對癌症中的綜合性或活動性病毒感染及其參與信號傳導途徑的額外瞭解,可爲靶向抗病毒和/或化療藥物的預防和治療干預提供信息,這一點可通過治療後丙型肝炎病毒相關性肝細胞癌的風險降低來證明直接作用的抗病毒藥物。在未來,液體活檢標本(如血漿)中無細胞DNAmNGS可用於免疫功能低下患者早期癌症的同時鑑別和感染的診斷

 

3  臨牀宏基因組學NGS的實施

在臨牀實驗室實施mNGS是一項複雜的工作,需要使用符合監管標準的質量管理方法定製研究方案。準備試劑、測序儀器和生物信息學工具在研究環境中不斷變化。然而,在臨牀實驗室中,分析需要遵循標準化協議來實施。對的任何組件所做的更改在對患者進行檢測之前,需要對檢測進行驗證並證明其具有可接受的性能。定期更新和重複驗證研究被認爲是必要的,以納入NGS試劑、協議和儀器的臨時技術進步。

病原體檢測的宏基因組方法對於臨牀驗證來說是一個特別具有挑戰性的場景(圖3,因爲對於要被認爲是有效的分析來說,對本質上無限數量的不同生物體進行測試是不現實的。儘管FDA已經爲NGS感染性疾病試驗的臨牀驗證提供了一般指南,但是對於mNGS試驗的臨牀實施沒有明確的建議,也沒有提到具體的要求。然而,可以採取一種最佳實踐方法,包括使用具有代表性的有機體進行失效模式分析和性能特性評估,並持續進行分析監測和獨立確認意外結果。

 

3 在臨牀環境中對宏基因組測序常規實施的挑戰。在這一過程的每一步,實施用於診斷感染的臨牀宏基因組步驟時,必須考慮到多個因素,以最大限度地提高準確性和臨牀相關性。尤其是,作爲臨牀微生物測序委員會(類似於腫瘤學中的腫瘤委員會)的一部分,在臨牀環境中解釋和討論宏基因組下一代測序(mNGS)測試的結果通常是必要的。

 

3.1 靈敏度和富集方法

mNGS的一個關鍵限制是其在高背景下的敏感性降低,主要來自人類宿主(例如,在組織活檢中)或微生物組(例如,在糞便中)。該背景可能與臨牀相關,因爲感染的病原體負荷可能非常低。

已開發出用於RNA文庫的宿主缺失方法,並證明其有效性,包括提取後的DNase I處理以去除殘留的人類背景DNA;使用RNA探針然後進行RNase H處理;抗人類和線粒體rRNA抗體(臨牀樣本中最豐富的宿主RNA類型);和/或基於CRISPR-Cas9的方法。

遺憾的是,目前還沒有比較有效的DNA文庫並行方法。使用抗甲基化人類宿主DNA的抗體可以在3-5倍的範圍內實現有限的富集,因爲在大多數病原體基因組中缺乏甲基化的DNA,從而豐富了微生物的序列。人類細胞的差異裂解,然後用DNase Ⅰ降解背景DNA,從而保留和富集有細胞壁的生物體(包括一些細菌和真菌)中的核酸,已被證明可提供高達1000倍的微生物富集量。然而,微分分析方法的性能會受到許多因素的限制。這些侷限性包括:對沒有細胞壁的微生物,如支原體或寄生蟲的敏感性可能降低;使用額外的試劑可能會使外源性背景污染增加,這可能是矛盾的;以及無法從人體宿主在體內溶解的死生物體中檢測遊離核酸免疫細胞或抗生素治療。

在某種程度上,人類宿主背景的限制通過增加可用測序器的容量來實現。例如,通過對腦組織進行超深測序,在一名腦炎患兒身上檢測到一種星形病毒,在約1.34億次檢測中,僅檢測到1612(0.0012%)序列。另一種提高靈敏度的方法是利用一種混合方法進行富集,例如用帶尖峯引物的宏基因組測序。結合靶向測序和非靶向測序,該方法使用可變大小的短引物板(100-10000)添加到反應混合物中以富集特定靶生物,同時保留宏基因組測序廣度。當反向轉錄時,一組ZIKV特異性引物被發現可使ZIKV的讀寫次數增加10倍以上,而不會明顯降低對其他病原體的廣泛的亞基因組敏感性,使全基因組病毒測序能夠確定ZIKV從巴西傳播到中美洲和墨西哥的特徵。

 

3.2 實驗室工作流程注意事項

mNGS分析的複雜性要求在樣品處理方面有訓練有素的人員和極爲謹慎的態度,以避免錯誤和交叉污染。即使是在樣本採集、等分、核酸提取、文庫製備或彙集過程中引入的微量外源DNARNA,也會從污染的讀長中產生可檢測的信號。此外,實驗室表面、消耗品和試劑都不是不含DNA的。通常需要維護在mNGS數據中檢測到的、由正常菌羣或實驗室污染引起的背景微生物數據庫,以便進行準確的mNGS分析。

臨牀實驗室操作的特點是有一個確定的工作流程和預定的人員配置水平,並且比研究實驗室更不適合按需測試。由於樣品通常是分批處理的,分批分析的頻率是總週轉時間的主要決定因素。除非完全自動化的樣品處理系統是現成的,實驗室操作mNGS需要相當多的動手時間來執行,以及臨牀工作人員誰是在分子生物學程序的高度培訓。對於重複性的工作,如移液管,存在人體工程學的問題,也可能會無意中混淆樣本或遺漏工作流程中的關鍵步驟。在複雜的mNGS中保持高質量程序可能會給工作人員帶來壓力,因爲樣本處理中的輕微偏差可能導致產生的結果發生重大變化。通過輪班將分析工作流程分爲多個離散步驟,有助於避免實驗室誤差。

 

3.3 參考標準

需要特徵良好的參考標準和控制,以確保隨着時間的推移mNGS分析質量和穩定性。大多數可用的宏基因組參考材料高度定製以用於特定應用(例如,酶生物學微生物羣落標準用於微生物組分析和細菌和真菌亞基因組)和/或聚焦於更有限的生物體譜(例如,國家標準與技術研究所(NIST)混合微生物DNA檢測參考材料,其中僅包含細菌)。因此,這些材料可能不適用於非靶向的mNGS分析。

可以開發由一個微生物庫(模擬微生物羣落)或其核酸組成的定製混合物作爲外部控制,以確定mNGS檢測的檢測極限。內部的頂級控制標準可用於其他NGS應用,如RNA-seq的轉錄組分析,External RNA Controls ConsortiumERCCRNA標準由跨越一系列核苷酸長度和濃度的合成RNA寡核苷酸組成。整套或部分ERCC RNA標準(或其DNA等效物)可用作內對照,以控制分析抑制,並通過標準曲線分析量化檢測到的病原體的滴定度。然而,由於缺乏公認的mNGS參考標準,很難比較不同實驗室之間的分析性能。迫切需要標準化的參考生物體和基因組材料來促進這種比較,並確定最佳的分析方法。

 

3.4 生物信息學挑戰

用於分析mNGS數據的用戶友好的生物信息學軟件目前仍然沒有。因此,用於臨牀mNGS數據分析的定製生物信息學流程仍然需要訓練有素的編程人員來開發、驗證和維護用於臨牀的需要。實驗室可以在本地託管計算服務器,也可以將生物信息學分析和數據存儲轉移到雲平臺。在這兩種情況下,硬件和軟件設置都可能很複雜,必須採取適當措施保護患者序列的機密數據和信息,特別是在雲環境中。測序數據的存儲需求會很快變得相當大,臨牀實驗室必須決定數據存儲的數量、位置和持續時間。

用於mNGS分析的生物信息學流程使用許多不同的算法,通常是爲研究環境開發的,並且由軟件開發人員不斷更新。對於實驗室程序,通常需要對軟件進行自定義修改,然後鎖定軟件和參考數據庫以進行臨牀驗證。典型的生物信息學由一系列來自原始輸入FASTQ文件的分析步驟組成,包括質量和低複雜度過濾、接頭序列剪切、人類宿主移除、通過與參考數據庫對齊進行微生物識別、可選的序列組裝和分箱的分類,在諸如科、屬和種的水平上的連續序列(圖4。必須仔細評估流程中的每個步驟,以確保數據處理的準確性和完整性,同時考慮誤差的傳播。敏感性分析應包括電子數據和臨牀樣本數據。可以準備定製的數據集,以模擬輸入序列數據,並擴大檢測到的微生物的範圍。使用標準化參考資料和NGS數據集也有助於不同生物信息學流程的比較評估。

 

4 一個典型的宏基因組下一代測序生物信息學流程。下一代測序(NGS)數據集,通常採用FASTQ或序列比對結果(SAM)格式,在計算服務器、便攜式筆記本電腦或臺式電腦或雲端上進行分析。初始預處理步驟包括低質量、低複雜度和接頭序列過濾。計算宿主移除是通過將序列比對到宿主(例如,人類)基因組,並留出宿主操作用於隨後的轉錄組(RNA)或基因組(DNA)分析來執行的。其餘未比對的讀取直接與大型參考數據庫對齊,如National Center for Biotechnology InformationNCBIGenBank數據庫或微生物參考序列或基因組集合或者首先將組裝成更長的連續序列,然後與參考數據庫比對。在物種註釋分類之後,讀長或重疊羣被分配到特定的分類單元(例如,物種、屬和科),數據可以以多種不同的格式進行分析和可視化。其中包括覆蓋圖和成對鑑定圖,以確定有多少微生物基因組已被恢復,其與數據庫中參考基因組的相似性;Krona圖,以可視化宏基因組庫中的分類多樣性;系統發育分析,以比較組裝的基因、參考序列的基因區域或基因組;以及顯示臨牀樣本中檢測到的微生物的熱圖。

 

此外,微生物參考基因組的公共數據庫正在不斷更新,實驗室除了處理潛在的錯誤註釋和其他數據庫錯誤外,還需要跟蹤所使用的確切版本。包含公開存放序列的更大、更完整的數據庫,如National Center for Biotechnology InformationNCBI)核苷酸數據庫,比FDA-ArgosFDA Reference Viral Database (RVDB)等更精確、更有限的數據庫更全面,但也包含更多錯誤。一種結合多個數據庫註釋序列的組合方法可以提高微生物鑑定的敏感性和特異性。

生物信息學分析的性能驗證是一項耗時的工作,包括對照組和患者數據集的分析和比較,以及用正交臨牀試驗確定最終結果的準確性。建立閾值可以將真陽性匹配從背景中分離出來,並且這些閾值可以包含諸如與檢測到的微生物對比序列讀長數、標準化爲百萬讀長數、外部無模板控制樣本或內部標準材料等度量;覆蓋的非重疊基因組區域的數量;以及相對於陰性對照樣品的臨牀樣品的讀長豐度(以避免報告污染生物體)。受試者曲線(ROC)分析是一種有用的工具,可以確定具有已知結果的臨牀樣本訓練集的最佳閾值,並使用獨立的驗證集驗證預先設定的閾值

在實驗室工作流程中,分析軟件和參考數據庫最好在驗證和臨牀使用前確定。許多實驗室同時維護臨牀參考數據庫的生產版本和最新開發版本(例如,NCBI核苷酸數據庫每兩週更新一次),數據庫定期按預先指定的間隔更新。應使用標準化數據集在任何更新後驗證數據庫,並確保分析結果準確且可重複,因爲新保存的序列和臨牀元數據可能會引入錯誤。

 

3.5 成本考慮

雖然在序列數據的生成方面已經有了實質性的成本降低,但是用於測序的每個樣本試劑的總成本仍然相當高。大多數實驗室缺乏自動設備在一次運行中多路傳輸大量患者樣本的自動化協議。因此,大多數mNGS的庫準備方法都是手動執行的,因此需要大量的工作人員時間。運行和維護生物信息學分析流程的成本也相當可觀,爲確保監管監督而採取的措施也會顯著增加成本。這導致每個分析樣本的總成本爲數百到數千美元,比許多其他臨牀試驗的成本都要高。

mNGS樣品處理需要在硬件上進行技術改進,以提高吞吐量和降低成本。隨着NGS程序變得更加標準化,隨着液體處理生物機器人的使用,自動化程度不斷提高。通常情況下,臨牀MNG需要兩個生物設備來完成前擴增和後擴增步驟,以避免PCR擴增子交叉污染。隨着最新一代測序儀(如Illumina NovaSeq instruments)的輸出大大增強,增加混樣測序也是可能的。但是,由於批量處理的要求以及樣本工作流程和計算分析的考慮,每次運行大量樣本的潛在限制是臨牀使用的總週轉時間更長。此外,只有在參考實驗室中才能對NGS的臨牀樣品進行高通量處理。用於NGS樣品庫製備的微流控裝置,如VolTRAX,最終可以使臨牀醫生在醫院實驗室或護理點更廣泛地使用mNGS

 

3.6 政策與監管考慮

臨牀實驗室受到高度監管,一般實驗室和測試要求適用於爲患者護理報告的所有分子診斷分析。質量控制是最重要的,必須開發方法以確保整個分析工作流程的分析精度。重要的質量控制步驟包括初始樣本質量檢查、庫參數(濃度和大小分佈)、序列數據生成(聚類密度和Q-分數)、內部控制的恢復和外部控制的性能。應記錄分析開發和實施過程中產生的驗證數據,並提供給實驗室檢查員(用於實驗室開發的測試)或提交給監管機構,如美國的FDA或歐洲的歐洲藥品管理局(EMA),以供批准。

持續的監測對於mNGS分析尤其重要,它可以隨着時間的推移驗證可接受的性能,並調查非典型的發現。監測是通過樣本內部控制、運行中控制樣本、污染刷卡測試和定期能力測試來完成的。通過回顧患者的臨牀圖表或使用正交法進行實驗室驗證試驗,進一步調查意外或異常結果。實驗室對以前未經鑑定的微生物的鑑定,一般應通過臨牀參考或公共衛生實驗室檢測進行獨立鑑定。應評估非典型或新生物的臨牀意義,並應報告這些發現,並與衛生保健提供者討論,同時考慮其潛在的致病性以及進一步的檢測和治療選擇。臨牀微生物測序委員會,以腫瘤學中的腫瘤委員會爲模型,可以通過實時電話會議召集,在臨牀環境中與治療提供者討論mNGS結果(圖3。如發現有公共衛生影響的微生物,如Sin Nombre漢坦病毒或埃博拉病毒,應酌情向相關公共衛生機構報告。

 

4  總結與未來展望

文庫的製備方法、序列生成和計算生物信息學方面的技術進步,使以較低成本進行更快速和更全面的宏基因組分析成爲可能。測序技術及其應用不斷髮展。實時測序技術在臨牀醫學和公共衛生中的應用可能是一種突破的技術,因爲實驗室已經開始應用這些工具來診斷非典型感染和跟蹤病原體的爆發。

儘管如此,在實施常規病人護理的mNGS時,仍然存在巨大的挑戰。特別是,在高核酸背景或極低病原體滴度的臨牀樣本中,病原體檢測的靈敏度降低;這一問題是隨着成本持續下降,增加每個樣本的測序深度只能部分緩解這種情況。作爲一種綜合性的直接檢測方法,mNGS可能最終取代臨牀微生物學中的培養、抗原檢測和PCR方法,但病毒血清學檢測等間接方法將繼續在感染診斷工作中發揮關鍵作用,而功能分析,如培養和表型敏感性測試,將可能永遠有用的研究研究。總之,雖然目前的侷限性表明,mNGS不太可能在短期內取代傳統的診斷方法,但在某些臨牀情況下,它可能是一種補充性的,也許是必要的測試。

儘管在多個病例報告和小病例系列中已證明使用mNGS通知臨牀護理,但幾乎所有的研究都是回顧性的,臨牀實用性尚未在大規模前瞻性臨牀試驗中得到證實。前瞻性臨牀研究對於瞭解何時進行mNGS以及如何將診斷結果與其他方法進行比較至關重要。例如,mNGS轉錄組學方法可能實現有效的治療分類,即僅對顯示基因表達傳染性特徵的患者需要抗菌藥物,而具有非傳染性特徵的患者可因其他原因進行治療。特別是,需要前瞻性臨牀試驗和經濟數據來證明這些相對昂貴的試驗在改善患者預後方面的成本效益,以證明其使用的合理性。這些數據還將爲監管機構批准和臨牀報銷提供途徑。高質量的證據表明,臨牀亞基因組分析在指導患者管理方面是有效的,這需要儘可能減少潛在分析和患者選擇偏差,並使用大患者隊列生成的數據集比較相關的健康結果。

本文預測,在未來5年內,評估mNGS臨牀實用性和成本效益的前瞻性臨牀試驗數據將變得可用;mNGS的總體成本和週轉時間將繼續下降;mNGS的其他方面,如納入人類宿主反應和微生物組羣數據,將被證明具有臨牀應用價值;自動樣本處理和微流控設備將被開發用於按鍵操作;計算分析平臺將在本地和雲端更廣泛地可用,從而消除對專用生物信息學專業知識的需求;至少有一些基於mNGS的傳染病診斷分析將獲得監管機構的批准,並得到臨牀補償。我們將見證mNGS的廣泛民主化,因爲基因組分析不僅對醫生和研究人員開放,而且通過對患者和公衆開放。此外,在一個病原體不斷出現的世界裏,我們設想基於mNGS的檢測將在監測和跟蹤新的疾病爆發方面發揮關鍵作用。隨着監測網絡和測序等快速診斷平臺在全球的部署,將有可能在更早的階段發現並控制傳染病爆發,從而拯救生命和降低成本。在不久的將來,隨着我們與傳染病的長期鬥爭,mNGS將不再是一種奢侈品,而是臨牀醫生醫療設備中的必需品。

猜你喜歡

10000+:菌羣分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公衆號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧祕  

寫在後面

爲鼓勵讀者交流、快速解決科研困難,我們建立了“宏基因組”專業討論羣,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入羣,務必備註“姓名-單位-研究方向-職稱/年級”。PI請明示身份,另有海內外微生物相關PI羣供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決羣內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注“宏基因組”

點擊閱讀原文

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章