TCGA
有自己的一批工具,ICGC
也有自己的網站,但好的資源都是要整合起來,整合越多越好(雖然事實不一定如此,但有這個想法的人不少),用着才更方便。這就靠今天介紹的UCSC XENA
來實現了。
首先說下UCSC
,對於生物、醫學的研究者來說,並不陌生,無論是這個學校還是這個網站。
- 數據分析所用的參考基因組序列、基因註釋信息、重複序列信息、區域保守性信息、CpG島信息都可在UCSC的FTP服務器或TableBrowser獲取。當然也可以在ENSEMBLE,詳細閱讀 NGS基礎 - 參考基因組和基因註釋文件。
- UCSC基因組瀏覽器是基因組測序數據可視化的一個標誌性工作。漂亮的圖形展示,PDF出圖,便捷的在線操作,豐富的調控信息,繁多的公共數據集,特有的多樣品Overlay展示等,都是其特色。也可以在本地安裝UCSC基因組瀏覽器,用於測序數據可視化 (三) - UCSC genomebrowser。
然後就是隆重出場的UCSC Xena
了。
UCSC Xena
功能基因組瀏覽器是集分析、可視化、Galaxy與一體的新一代在線數據分析和可視化平臺。現有91個隊列的1098個公共數據集包括 TCGA, ICGC, TARGET, GTEx, CCLE等都進行了標準化處理。因此不同的數據集之間可以組合比較。
- 熱圖的方式可以進行單基因和多基因的表達、突變、拷貝數變異、樣品屬性的關聯展示。
- 對任何展示的變量(不同表型病人的比較,不同基因表達的比較,突變有無的比較,甲基化水平的變化)都可以進行生存分析,繪製KM-plot,計算其對病人生存率的影響。
- 熱圖可以根據任一變量排序,然後查看其它變量的變化。如根據藥物處理狀態排序,查看基因的表達或修飾的變化。
另外 Xena 提供了ICGC Data Portal
的Chrome
擴展,可以在ICGC
的界面加入XENA的Heatmap
展示,不過沒有測試成功。
這次測試Xena插件時,去ICGC的官網又看了下,網站又更新了。好在變化不是特別大,之前ICGC數據庫的使用和TCGA數據庫在線使用都還可以用。
數據庫的使用主要靠自己去多操作,仔細讀,多看文檔,不要想着一下就可以找到想要的內容,尤其是剛接觸時,就當看小說,多瀏覽幾頁,就知道都有什麼了。在熟悉了幾個基本操作,幾種常見的數據類型和展示方式之後,數據庫再怎麼改版也一樣操作了。
XENA
提供的這個視頻對熟悉XENA
的使用提供了很多幫助,剩下的就看你要解決什麼問題了。