Nature子刊:快速準確的微生物來源追溯工具FEAST


FEAST: 快速準確的微生物來源追溯工具

FEAST: 快速期望最大化的微生物來源追溯

FEAST: fast expectation-maximization for microbial source tracking

Nature Methods    [IF:28.467]

2019-06-10  Articles

DOI: https://doi.org/10.1038/s41592-019-0431-x

第一作者:Liat Shenhav1

通訊作者:Eran Halperin1,2,5,6*

其它作者:Mike Thompson 2, Tyler A. Joseph3, Leah Briscoe2, Ori Furman4, David Bogumil4,
Itzhak Mizrahi4, Itsik Pe’er3

作者單位:

1加州大學洛杉磯分校加計算機科學系(Department of Computer Science, University of California Los Angeles, Los Angeles, CA, USA.)

2加州大學洛杉磯分校人類遺傳學系(Department of Human Genetics, University of California Los Angeles, Los Angeles, CA, USA.)

3哥倫比亞大學計算機科學系,紐約(Department of Computer Science, Columbia University, New York, NY, USA.)

4本古裏安大學生命科學院,以色列,貝兒舍瓦(Life Sciences, Ben Gurion University, Be’er Sheva, Israel.)

5加州大學洛杉磯分校麻醉學和圍手術期醫學部(Department of Anesthesiology and Perioperative Medicine, University of California Los Angeles, Los Angeles, CA, USA.)

6加州大學洛杉磯分校計算醫學系(Department of Computational Medicine, University of California Los Angeles, Los Angeles, CA, USA.)

*電子郵件:[email protected]

劃重點

  1. 快速準確的微生物來源分析一直是本領域的難點,之前發佈的SourceTracker仍有速度慢,準確率不高的問題;

  2. 本文提出一種新的方法FEAST,可以實現快速、更準確的微生物來源追蹤;

  3. 軟件基於R語言開發,保證了方法跨平臺的可用性;

  4. 應用於嬰兒和廚房兩個微生物組項目,結果的微生物來源解釋比例更合理;

  5. 此方法在分類問題中,也比JSD、加權UniFrac指標有更好的AUC值,在醫學診斷中有更好的應用前景。

摘要

分析微生物組數據的組成結構的一個主要挑戰是確定其潛在來源。在這裏,我們介紹了快速期望最大化微生物源跟蹤工具(Feast),這是一個隨時可用的可擴展框架,可以同時及時估計數千個潛在源環境的貢獻,從而幫助解開復雜微生物羣落的起源。源代碼見 https://github.com/cozygene/feast 。從Feast獲得的信息可以爲量化污染、跟蹤發展中微生物羣落的形成,以及區分和表徵與細菌相關的健康狀況並提供見解。

A major challenge of analyzing the compositional structure of microbiome data is identifying its potential origins. Here, we introduce fast expectation-maximization microbial source tracking (FEAST), a ready-to-use scalable framework that can simultaneously estimate the contribution of thousands of potential source environments in a timely manner, thereby helping unravel the origins of complex microbial communities (https://github.com/cozygene/FEAST). The information gained from FEAST may provide insight into quantifying contamination, tracking the formation of developing microbial communities, as well as distinguishing and characterizing bacteria-related health conditions.

結果

圖1. 方法比較

Fig. 1 | Methods comparison.

基於模擬數據,使用FEAST與SourceTracker、隨機森林分類器評估結果比較。每個模擬樣品都是使用20個真實的源環境(Source)和模擬的滲入(Sinks)樣本。

a、準確性比較,FEAST方法明顯優於另兩種方法。X軸是已知來源的Jensen–Shannon平均發散值(即來源之間完全相同到完全不同的比例)。Y軸表示真實混合比例和估計混合比例之間所有源環境的相關性;誤差條顯示平均值的標準誤差(n=30)。b,通過不同水平的未知來源比例對Feast和SourceTracker進行評估。Feast假陽性率低,與真實情況較接近;而之前的SourceTracker無關來源時也會預測到假陽性的來源

圖2. 當前最先進方法的運行時間比較

Fig. 2 | Running time comparison to current state-of-the-art

所有模擬研究的運行時間(對數刻度,以秒爲單位)比較,使用每個源深度爲10000條序列。看到新方法使用時間是10幾倍至30幾倍的下降。對於SourceTracker之前要需等幾天的項目,現在幾小時即可搞定

圖3. 1歲嬰兒腸道微生物來源估計

Fig. 3 | FEAST estimations of source contribution to the sink; that is, gut microbiome of focal infant at 12-months of age.

左圖爲剖腹產、右圖爲順產。來原樣本有母親腸道樣本、嬰兒出生及4個月時間樣本。明顯看到順道主要來源於母體,而剖腹產最大末知來源如環境。目標樣本量爲98個。

圖4. 廚房樣品中末知來源的比例

Fig. 4 | The proportion of the unknown sources in kitchen counter samples using FEAST and SourceTracker.

使用Feast和SourceTracker的廚房櫃檯樣品中未知來源的比例分析。A,來源估計,考慮到12個已知的人類來源(四個居民的手、腳和鼻子),使用來自LAX等人文章的數據(參考文獻15)。B. FEAST估計第一時間點一個家庭廚房櫃檯微生物來源,使用來自地球微生物組項目的額外來源數據。

圖5. 使用FEAST、加權UniFrac和Jensen-Shannon差分法對健康個體和ICU中生態失調患者分類的ROC曲線

Fig. 5 | The receiver operating characteristic curve using FEAST, weighted UniFrac and Jensen–Shannon divergence to classify healthy individuals and patients in ICU with dysbiosis.

ROC曲線下面積(AUC)分別爲:FEAST,0.91;加權UniFrac,0.78;Jensen–Shannon divergence(JSD,0.87。

可以看到本方法有最高的分類準確度和最低的假陽性率

圖6. 94例接受造血幹細胞移植的患者移植前和中的未知來源比例有顯著差異。

Fig. 6 | Significant differences in the distribution of the unknown source between sink samples before and during the first event of intestinal domination across 94 patients undergoing allo-HSCT.

箱線展示中位數(中心線)、IQR(百分位數)和第5和95百分位(鬍鬚線終點)。

總結

在微生物來源分析中,隨機森林和基於貝葉斯的SourceTracker有較廣泛應用,但運行速度和準確度一直不盡人意。基於模擬數據測試,本軟件的優勢是與之前的方法相比即快又準。此外在嬰兒和廚房的自然樣本數據中,也看到了較合理的結果。此外它也可應用於分類診斷中的應用,也比JSD和UniFrac方法更準確。同時提出了將未知來源比例可能用於疾病恢復過程中的診斷指標。方法到底多好用,還需要在更多的實戰項目中檢驗。過幾天,我們將推送此軟件的實戰教程,帶大家從輸入、分析過程,以及結果的全面解讀。

新聞稿

《Nature Methods》新工具:追溯腸道細菌起源

新聞稿轉自生物通,有修改

由加州大學洛杉磯分校領導的研究小組開發出了一種更快、更準確的方法來確定寄宿在人類體內的細菌來自何處。從理論上講,這個工具能推斷出任何微生物羣的起源。

新工具被命名爲“FEAST”(https://github.com/cozygene/FEAST),可以在短短几個小時內分析過去需要在幾天或幾周才能處理完的大量遺傳信息。該軟件可用於醫療保健、公共衛生、環境研究和農業,研究結果發表在《Nature Methods》。

一個微生物羣通常包含成百上千種微生物。微生物羣隨處可見,從人類的消化道到爲我們提供水源的湖泊和河流。組成這些羣落的微生物可以來自周圍的環境,包括食物。

瞭解這些生物體來自何處以及如何形成羣落,可以讓科學家更詳細地瞭解影響人類健康的未知生態過程。研究人員開發這個項目,爲醫生和科學家提供了一個更有效的工具來研究這些現象。

追源程序可以給出來自其他地方的微生物羣的百分比。這在概念上與人口普查相似,人口普查揭示移民人口來自哪些國家,以及每個羣體佔總人口的百分比。

例如,對廚房櫃檯樣本使用追源工具可以指示樣本中有多少來自人類,有多少來自食物,具體是哪種類型的食物。

有了這些信息,醫生就可以通過簡單分析微生物羣來區分健康人和患有某種疾病的人。科學家可以使用這個工具來檢測水資源或食物供應鏈中的污染。

該研究的主要研究人員Eran Halperin說:“微生物組與人體生理和健康的許多方面有聯繫,但是現階段仍處於研究早期,我們正在瞭解許多物種動態網絡的臨牀意義,以及它們如何相互作用。”

Halperin補充說:“微生物組數據空前擴大,這迅速增加了我們對微生物生命的不同功能和分佈的認識。然而,如此龐大和複雜的數據集帶來了統計和計算上的挑戰。”

研究人員說,與其他追源工具相比,FEAST的速度快了300倍,而且非常準確。

此外,目前的工具只能分析較小的數據集,或者只針對被認爲是有害污染物的特定微生物。研究人員說,新工具可以處理更大的數據集,並提供更完整的微生物概述,以及這些微生物來自何處。

研究人員通過對比先前發表的數據集,證實了FEAST的可行性。

例如,他們使用這個工具來確定廚房櫃檯上微生物的類型,與以前分析相同數據集的工具相比,它提供了更多的細節。

他們還使用這個工具來比較剖宮產嬰兒的腸道微生物羣和陰道產嬰兒的腸道微生物組。

加州大學洛杉磯分校計算機科學研究生、該研究的第一作者Liat Shenhav說:“我希望科學家們能利用FEAST來診斷與細菌有關的健康狀況。例如,如果一種特定的癌症具有某種微生物特徵,那麼FEAST可能會被用於早期診斷。”

Reference

Shenhav, L. et al. FEAST: fast expectation-maximization for microbial source tracking. Nature Methods, doi:10.1038/s41592-019-0431-x (2019).

《Nature Methods》新工具:追溯腸道細菌起源 https://mp.weixin.qq.com/s/IZ1DAUXJxIxrvRz3t041cQ

猜你喜歡

10000+:菌羣分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦

系列教程:微生物組入門 Biostar 微生物組  宏基因組

專業技能:學術圖表 高分文章 生信寶典 不可或缺的人

一文讀懂:宏基因組 寄生蟲益處 進化樹

必備技能:提問 搜索  Endnote

文獻閱讀 熱心腸 SemanticScholar Geenmedical

擴增子分析:圖表解讀 分析流程 統計繪圖

16S功能預測   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在線工具:16S預測培養基 生信繪圖

科研經驗:雲筆記  雲協作 公衆號

編程模板: Shell  R Perl

生物科普:  腸道細菌 人體上的生命 生命大躍進  細胞暗戰 人體奧祕  

寫在後面

爲鼓勵讀者交流、快速解決科研困難,我們建立了“宏基因組”專業討論羣,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入羣,務必備註“姓名-單位-研究方向-職稱/年級”。PI請明示身份,另有海內外微生物相關PI羣供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決羣內討論,問題不私聊,幫助同行。

學習16S擴增子、宏基因組科研思路和分析實戰,關注“宏基因組”

點擊閱讀原文,跳轉最新文章目錄閱讀

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章