微生物研究十問十答

轉自公衆號《宏基因組》

Q1:基於高通量測序的微生物多樣性檢測技術優勢以及原理是什麼?

A:常規的微生物研究方法包括基因克隆文庫、變性梯度凝膠電泳DGGE等,但這些方法的通病是信息量太小,且自然界中99%的微生物在實驗室都沒有辦法純化培養,不能充分反映複雜的環境微生物多樣性和分佈,且程序繁瑣,效率低下,也無法檢測到稀有菌羣的種類,因此其重複性和分辨率都不甚理想。
    二代高通量測序無需構建質粒克隆文庫,這避免了文庫構建過程中利用宿主菌對樣品進行克隆而引起的系統偏差,可以直接對環境樣品中的基因組片段進行測序,簡化了基本操作,提高了測序效率,它能夠對一個羣落中微生物的多樣性做更加深入和全面的描述,且具有通量高,重複性好,精確度高的優點,因而在微生物生態學研究中逐漸佔據了優勢。技術原理:16S rDNA普遍存在於原核細胞中,且含量較高、拷貝數較多,便於獲取模板,適於作爲細菌多樣性分析的標準。通常利用保守區域設計引物來擴增單個或多個可變區,進而通過測序分析得到微生物多樣性。

Q2:微生物組測序設置生物學重複的意義是什麼,一般情況下,設置多少個重複合適?

A:生物學重複是指樣本所有的環境因素、處理條件、採樣時間都完全一致。生物學重複對於測序的實驗設計以及後續信息分析都非常重要,設置生物學重複主要有以下幾個作用:
1)能夠消除組內誤差:生物學重複可以測量變異程度
2)增強結果的可靠性:測序的樣本越多,越能夠降低背景差異,從而增加結果可信度
3)檢測離羣樣本:異常樣本的存在,會嚴重影響測序結果的準確性,通過後續信息分析可以發現異常樣本,將其排除。
    一般情況下,自然環境中(比如土壤,根系,植物等)及模式動物(比如大鼠,小鼠等)建議每組至少5個生物學重複,一般推薦10個生物學重複;若是人類腸道,糞便等樣品,由於個體之間差別較大(比如環境,飲食,遺傳條件,健康狀態等影響),建議加大取樣量,每組不少於30個生物學重複(取樣少,可能會導致組內差異大於組間差異則項目無意義)。值得注意的是,如果將多個樣本混在一起建庫測序,多個樣本則變成了一個樣本,仍是無生物學重複的。

Q3:什麼是嵌合體,嵌合體是否需要去除?

A:嵌合體,遺傳學上用以形容不同遺傳性狀的嵌合或混雜表現的個體。嵌合體序列是由來自兩條或者多條模板鏈的序列組成,見下圖: 

圖:嵌合體示例圖

PCR反應中,在延伸階段,由於不完全延伸,就會導致嵌合體序列的出現。在擴增序列X的過程中,序列延伸階段,只產生了部分X序列延伸階段就結束了,在下一輪PCR的反應中,這部分序列Y的引物接着延伸,擴增就會形成X和Y的嵌合體序列。在PCR過程中,大概有1%的機率會出現嵌合體序列,嵌合體在正常生物體中是不存在的,所以在16S擴增子測序的分析中,需要去除嵌合體序列。將去除後的cleandata再進行後續OTU聚類及分析。

Q4:Alpha多樣性和Beta多樣性在微生物檢測中的意義?

A:Alpha多樣性是指一個特定環境或生態系統內的多樣性,主要用來反映物種豐富度和均勻度以及測序深度。Beta多樣性主要是爲了研究不同樣品或處理組之間的物種羣落結構差異,是生物多樣性的重要組成部分。Beta多樣性與Alpha多樣性差異在於alpha多樣性只是用來描述單個樣品的物種多樣性,而beta多樣性則是比較不同樣品(生態系統)之間的多樣性差異。Beta多樣性與alpha多樣性一起構成了總體多樣性或一定環境羣落的生物異質性。 Alpha多樣性包括Chao1、Observed_species、Goods_coverage、Shannon、Simpson指數,綜合考量態系統的豐富度與多樣性,Beta多樣性分析通常由計算環境樣品間的距離矩陣開始,該矩陣包含任意兩個樣品間的距離,主要通過主座標分析(Principal coordinates analysis,PCoA)、主成分分析(Principal component analysis,PCA)、多維尺度分析(Multidimensional scaling,MDS)、聚類分析(Clustering analysis)、相似性分析(Analysis of similarities,ANOSIM)等方法,對羣落數據結構進行自然分解並通過對樣本排序(Ordination),從而觀察樣本之間的差異。

Q5:Alpha多樣性指數之間有什麼區別嗎?

A:Alpha多樣性包括Chao1、Observed_species、Goods_coverage、Shannon、Simpson等5個指數。其中Chao1,Observed_species指數主要關心樣本的物種豐富度(Richness)信息;Goods _coverage反映樣本的低丰度OTU覆蓋情況;Simpson/Shannon主要綜合體現物種的多樣性(Diversity)和均勻度(Eveness)。其中Chao1和observed_species主要是估計羣落中包含物種的數目;Goods _coverage是指各樣品文庫的覆蓋率,其數值越高,則樣本中序列沒有被測出的概率越低,該指數實際反映了本次測序結果是否代表樣本的真實情況;Shannon指數來源於信息熵,Shannon指數越大,表示不確定性大。不確定性越大,表示這個羣落中未知的因素越多,也就是多樣性高;Simpson數值範圍在0-1之間,當羣裏只有一種物種的時候,此時Simpson值最小爲0,同時也是我們直觀理解的多樣性最小。當物種種類無限多(豐富度最高),並且每個物種數目都一致(均勻度最高)的時候,Simpson值爲最大爲1。根據我們的計算公式可得:observed_species、chao1指數高,說明樣品物種數目多;shannon、simpson指數高,說明物種丰度以及均勻度都很高。

Q6:如何查找感興趣的物種信息及其丰度

A:所有樣本中每個OTU對應的物種註釋信息以及丰度信息(絕對丰度)文件路徑

summary/6_taxonomy_community/OTU_table_with_taxonomy.xlsx

所有樣本各層級相對丰度top20的結果路徑:

summary/6_taxonomy_community/*/1_abundance_stats/all/*_abund_top20.xlsx

分組樣本(取平均值)各層級相對丰度top20的結果路徑:

summary/6_taxonomy_community/*/1_abundance_stats/Group/*_abund_Group.xlsx

Q7:16S測序物種註釋常用的數據庫有哪些?這些數據庫的特點(或優缺點)是什麼?

A:16S測序物種常用的數據庫有RDP, SILVA ,Greengenes等,其中SILVA 數據庫由於更新比較及時,因此也是目前最常選用的參考數據庫之一。Greengenes數據庫相對於其它經常更新的數據庫,劣勢比較突出。

   聯川目前使用的註釋庫是RDP+NT-16S。RDP數據庫是目前較常用的比對、註釋的參考數據庫,版本更新比較快,16S序列信息較全,但由於該數據庫註釋結果只到屬水平,而部分客戶還是想通過16S得到種水平註釋信息,因此我們使用NT-16S(基於NT庫提取整理的16S數據庫)數據庫做爲種水平註釋結果的補充,並以RDP數據註釋結果爲優先級。

Q8:16S物種註釋中爲什麼會出現葉綠體?

A:本身的葉綠體含量會比較高,而葉綠體和所研究16S擴增區段的序列相似性很高,也是能被擴增出來的。因此該從實驗端用普通的引物是無法避免該問題的。

   對葉綠體本身就很高的樣本(如葉片等)給出如下建議:

1)預先處理減少葉綠體含量的提前處理,以減少後期測序結果裏面的葉綠體序列;

2)使用去除葉綠體的特異性引物擴增,以減少可能產生的葉綠體序列。

Q9:16S測序與其他項目關聯原理及注意要點?

A:衆所周知,16S rDNA 測序主要用於研究某一特定環境中微生物結構組成,及其在不同處理條件下微生物種類及丰度差異,主要優勢在物種多樣性層面。由於PICRUSt等分析軟件也可以得到功能上的註釋結果,但功能預測的結果只能作爲參考。如果想對基因層面對微生物代謝功能更深入的研究,就需要結合其他研究手段(宏基因組,宏轉錄組等)研究複雜微生物羣落變化,基因功能層面差異及挖掘潛在的新基因。
   16S測序相比宏基因組、宏轉錄組測序來說,價格上有不少落差。對於經費有限的課題,可以採取分步走策略。首先利用16S技術對大量樣本進行測序分析,發現不同條件下樣本的物種組成結構以及差異情況,然後挑選個別有代表性的樣本(注意:樣本挑選的時候,挑選同一條件下樣本組成相似,且與其他條件下樣本組成差別較大的樣本,爲了差異分析具有統計學意義,建議每組至少挑取3個樣本),進行宏基因組或宏轉錄組測序,從而更加深入的闡明羣落的功能。
    宏轉錄組興起於宏基因組之後,從整體水平上研究某一特定環境,特定時期羣體生命全部基因組轉錄情況以及轉錄調控規律,它以生態環境中的全部RNA爲研究對象。與宏基因組學相比,宏轉錄組學能從轉錄水平研究複雜微生物羣落變化,能更好地挖掘潛在的新基因。聯合16S、宏基因組、宏轉錄組三者分析,可以在羣落水平,DNA和RNA水平上同時進行研究,實現多重角度互相驗證,爲全面解析微生物環境羣落中的重要物種和基因信息提供了一種有效的手段。

   除了與宏基因組和宏轉錄組聯合分析外,16S和代謝組學聯合分析也是近年來研究的熱點。由於微生物羣落的複雜性,研究微生物如何通過功能改變對宿主產生的影響是很困難的。通過測定微生物代謝物發生的改變來研究菌羣功能狀態是一種有效的方法。通過一定的數據篩選規則,找到可能相關的菌羣臨牀指標以及代謝物。如加上做一些單菌實驗以及羣體驗證,前期猜想將更加好地得到證實。

Q10:測序前通過一代測序鑑定了菌株的信息沒有問題,一定能判斷菌的純化就完全沒有問題嗎?

A:答案是否定的,以細菌完成圖爲例。我們一般會在建庫前對提供的菌株進行菌種鑑定,鑑定的方法通常是通過引物擴增出細菌的16S片段,通過一代測序獲得該菌的16S序列,然後與NCBI數據庫進行比對得到該菌株的信息,如果獲得的信息確實是需要測定的菌株,只能說明沒有其它細菌的污染,且前提是一代鑑定是結果中峯圖屬於單峯,無其它雜峯污染。且細菌完成的菌種鑑定是單菌,僅能說明無其它細菌的污染,並不能說明無真菌混在其中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章