Picrust作爲擴增子測序功能預測的工具已經被廣泛使用了。但是它會與真實情況存在較大的偏差,詳見前文對Picrust侷限性的介紹:
此文中我推斷預測的準確性和測序深度有很強的關係。
Picrust2在Picrust基礎上擴大了數據庫,增加了預測的準確性。宏基因組公衆號之前已經介紹過:
PICRUSt2:OTU/ASV等16S序列隨意預測宏基因組,參考數據庫增大10倍
最近一篇Microbiome重新評估了Picrust,Picrust2和Fax4Fun的效果。巧了,微生態公衆號寫了介紹,正好省的我寫了:
科研 | Microbiome:微生物羣落功能預測的準確性與樣本類型和功能類別的關係
結論是再次表明了針對環境樣本使用時會產生較大的誤差,用於人效果會好一些。
這又讓我想到不同環境本身的物種池是否也對功能預測產生影響。
來了來了,又要開始瞎猜了~~~~
在此引用之前PNAS的數據:
人類腸道中的微生物數量大約在1014左右,遠遠低於全球土壤中微生物的數量1030。兩者物種池的差異造成了功能池的差異。本身人體微生物多樣性低,功能多樣性正常來說也比全球土壤微生物低,因此預測正確的機率更大。
除了人和土壤,Microbiome的結果還包括了猩猩,鼠,雞的微生物。這些樣本的準確性與土壤差不多。我查到2014年一篇PNAS證明了人類腸道微生物多樣性要比猩猩的低很多,而多樣性的降低在美國人身上非常明顯:與黑猩猩、倭黑猩猩或大猩猩相比,美國人在2萬條序列的測序深度上平均少了30個細菌屬。
Andrew H. Moeller, Yingying Li, Eitel Mpoudi Ngole, Steve Ahuka-Mundeke, Elizabeth V. Lonsdorf, Anne E. Pusey, Martine Peeters, Beatrice H. Hahn & Howard Ochman. (2014). Rapid changes in the gut microbiome during human evolution. Proceedings of the National Academy of Sciences 111, 16431-16435, doi: https://doi.org/10.1073/pnas.1419136111原文圖3 功能預測結果和宏基因組之間的相關性
隨便搜了下沒找到雞的和鼠的信息。但是雞、鼠、猩猩這些動物在自然生存狀態下很容易和土壤中的物種池發生聯繫。即使他們本身的微生物多樣性可能不高,但是這種更爲“開放”的系統會給微生物羣體帶來更大的動態波動,預測會更難。
以上一頓分析猛如虎,一看數據我愣住:
專門查了下這篇Microbiome中這些擴增子和宏基因組測序深度,都是別人的數據,此文章彙總進行了功能預測分析。但是,我又刨根問底的看了每一個研究對象的原始文獻。
鼠,16S 每個樣本只保留1000條序列,宏基因組每個樣本1000多萬條序列。
雞,16S 每個樣本9000多序列,宏基因組每個樣本有5000萬條序列。
猩猩,16S每個樣本1000條序列,宏基因組每個樣本有2700萬條序列。
人,其中一批數據16S每個樣本180萬條序列(這個應該是是每個樣本原始序列,不是生成OTU之後保留的序列。保留的序列數沒看到),宏基因組每個樣本有15萬多條序列。另一批數據正文裏也沒有呈現。可能在補充材料裏藏得很深沒注意。
從數據就能大致看出來,動物的16S數據那麼少,宏基因組卻那麼多,這麼點16S做預測跟宏基因組相關,沒關係纔是正常的吧,有關係我倒是覺得奇怪了。
而人的數據宏基因組序列跟前面比少得多,16S卻同時多很多。預測的更準確也是理所應當。
所以本文的結論我非常懷疑。同時也再次印證了測序深度的影響。
總結:
1.功能預測用於環境樣本,以及用於比較不同處理之間差異的時候,要非常非常小心。
2.對於文章的結果正確與否,或者說相不相信,還得仔細看他的方法及方法的適用性,不能迷信發表了的文章。像這類文章,發在了Microbiome上,肯定很多人不會仔細看他的方法,只看結論就引用在自己文章或者根據他人結論選擇自己的分析方法。但是這可能會帶來一些不好的後果。
3.時隔很久又對一篇文章進行了負面的評價。幾年前剛建公衆號不久,我介紹過一篇EST,材料方法中有一個很小的描述性錯誤我指了出來。作者是中國人,但是我沒想到作者因爲這找到了我。最後我道歉,把文章刪了。從那以後再寫中國人的文章的時候,我會比較小心,遇到錯誤我直接就忽略了,我害怕指出來之後又觸碰到作者的神經,人家又氣勢洶洶的找上門來了。如果這次作者再找到我,也不知會怎麼樣。哎,言盡於此吧。
猜你喜歡
10000+:菌羣分析 寶寶與貓狗 梅毒狂想曲 提DNA發Nature Cell專刊 腸道指揮大腦
文獻閱讀 熱心腸 SemanticScholar Geenmedical
16S功能預測 PICRUSt FAPROTAX Bugbase Tax4Fun
生物科普: 腸道細菌 人體上的生命 生命大躍進 細胞暗戰 人體奧祕
寫在後面
爲鼓勵讀者交流、快速解決科研困難,我們建立了“宏基因組”專業討論羣,目前己有國內外5000+ 一線科研人員加入。參與討論,獲得專業解答,歡迎分享此文至朋友圈,並掃碼加主編好友帶你入羣,務必備註“姓名-單位-研究方向-職稱/年級”。PI請明示身份,另有海內外微生物相關PI羣供大佬合作交流。技術問題尋求幫助,首先閱讀《如何優雅的提問》學習解決問題思路,仍未解決羣內討論,問題不私聊,幫助同行。
學習16S擴增子、宏基因組科研思路和分析實戰,關注“宏基因組”
點擊閱讀原文,跳轉最新文章目錄閱讀