在前幾天的介紹當中,我們通過一篇綜述瞭解到了tRNA的功能。其中在那篇綜述當中提到了四個和tRNA有關的數據庫。但是綜述當中介紹的數據庫基本上都是用於查詢tRFs的基本信息或者查看tRFs在腫瘤當中的作用。在綜述當中,我們也知道tRFs還有還有類似於調控的作用,因此就需要預測tRFs的靶標。對於這類的數據庫在綜述當中沒有進行相關的介紹,所以今天我們就來介紹兩個用於tRFs靶標預測的數據庫。
tRFTar
tRFTar[http://www.rnanut.net/tRFTar/#]是一個基於CLIP-seq來預測tRFs有關的靶基因數據庫。在這個數據庫當中,作者一共鑑定出12103個tRFs和5688個靶基因。
。
背景數據集介紹
由於目前對於tRFs的研究沒有像普通基因那樣有很權威的類似gene、ensemble這樣的數據庫把基因序列註釋好。所以在進行測序數據分析的時候,使用不同的tRFs序列數據庫可能比對到的tRFs的結果就不一樣。在tRFTars。作者首先使用的是MINTBase V2.0[https://cm.jefferson.edu/MINTbase/]進行測序數據的比對。
在昨天的綜述當中,我們介紹了xtRFs主要發揮作用也是通過AGO蛋白髮揮作用的。所以作者通過SRA數據當中的AGO CLIP-seq數據以及CLASH的數據來交叉分析預測tRFs主要是和哪些基因進行結合。同時爲了更好的瞭解tRFs表達和基因之間的關係。作者還使用了TCGA的數據庫對其進行了共表達分析。
數據庫操作
這個數據庫一共提供了三種不同的功能:1) 檢索功能:篩選目標tRFs和目標mRNA是否存在相互作用關係;2) 富集分析:對目標tRFs進行富集分析研究; 3) 瀏覽功能和下載功能
檢索功能
如果我們有目標基因,但是想要預測這些基因是否收到tRFs的調控。就可以使用這個檢索功能。
在輸入完之後,就可以獲得可能調控這個基因的tRFs。在結果當中,我們可以具體哪些tRFs可以調控目標基因。同時可以可以看到具體的調控方向是高表達還是低表達了。
同時,如果我們點擊Detail就可以獲得關於這目標tRFs以及目標基因的具體信息。
富集分析
如果想要從tRFs研究入手的話,可以通過富集分析的方式來來了解具體tRFs的功能。進而來選擇目標靶基因進行研究。在tRFTar當中。提供了GO、KEGG、WikiPatyway三個背景數據庫用來分析。經過分析之後,就可以獲得相對應的富集分析結果了。
數據下載
除了以上基於數據庫的分析。數據庫也提供了原始的數據的下載。方便我們使用。
tRFTars
除了上面介紹的tRFTar。和這個數據庫一起發表的還有一個tRFTarshttp://trftars.cmuzhenninglab.org:3838/tar/。同樣的數據庫,在功能上和上一個比起來就稍微少了一些了
背景數據集介紹
tRFTars在tRFs註釋上使用的是tRFdb[http://genome.bioch.virginia.edu/trfdb/]數據庫的資料。相較於上面的MINTBase V2.0,這個數據庫註釋的內容相對來說較少。同時。tRFTars在測序數據的使用上,使用了一個細胞系的CLASH數據以及一個CLIP數據。但是在靶基因預測上,在以上的數據基礎上做作者使用了SVM這類的機器學習的算法來進行預測。
數據庫使用
數據庫的使用相對來說比之前的簡單了。這個數據庫主要就是用來預測靶基因的。所以我們在輸入相對應的tRFs/基因之後。就可以獲得相對應的結果了
總的來說
以上就是兩個用來預測tRFs靶基因的數據庫。由於使用的是不同的tRFs序列參考數據庫也沒辦法比較說那個可能更好一些。但是如果是從分析的數據量來說的話,相對來說還是tRFTar更大一些。如果有想要研究tRF的童鞋可以嘗試一下這兩個數據庫哈。