在線聚類分析工具

對於高維度的數據分析而言,例如RNA-seq的數據。我們在得到數據想要解釋不同分組之間的差異的基因。往往都需要逐漸的降維來進行解釋。最普遍的方法通過差異分析—富集分析這樣的也算是一種逐步降維的操作。這樣這樣的分析,也有可能聚焦到很多個目標當中,比如一個通路當中有很多個基因。因爲爲了更好的解釋高維度的數據,也就有了基因分型這樣的分析方法。

簡單來說的基因分型,就是各種算法的無監督的聚類分析。對於一個RNA-seq的數據,基於每個樣本當中不同的基因特徵,把所有檢測的樣本分成不同的組(亞型)。例如昨天介紹的那個文獻,就是基於免疫相關基因把胰腺癌分成了5個亞型

對於聚類分析而言,如果要實現的話,用的最多的還是R或者python。涉及到代碼的話,就需要一定的門檻。所以今天就給大家介紹一個在線的用於基因聚類分析的網站: COMSUC([http://comsuc.bioinforai.tech/analysisTab])

內置算法和數據集

如果只是用來分析一些,基本的公共數據的話。例如,TCGA、ICGC、TARGET。在COMSUC當中提供了原始的數據。所以可以用來直接分析。

當然如果想要特異性的分析一些數據的話,那上傳自己的數據。具體格式要求的話,可以參照數據庫裏面的介紹:[http://comsuc.bioinforai.tech/manualTab/Html/General]

另外對於不同的聚類得到的結果是不一樣的。至於說那個聚類算法好,這個具體分析具體看。在這個數據庫當中,一共提供了8種不同的算法可以使用。

同時在共識聚類當中,也提供了三種算法。

數據庫使用

對於數據庫的時候的話,如果是使用內置數據集。就基於我們的想要分析的內容進行適當的選擇即可。例如,我想要分析: TCGA在ACC癌當中基於mRNA數據來進行Kmeans聚類分析的結果

結果展示的話,主要是成分成四個部分。

  1. 樣本網絡展示,這這個部分,我們可以查看不同樣本之間基於聚類的網絡是什麼樣子的。同時,我們在網站的右邊還可以自定義可視化結果。以及下載相關的圖片。


  2. 樣本相關性分析圖,除了網絡圖展示不同樣本之間的關係之外。還可以展示不同樣本之間的相關矩陣

  3. 如果是使用TCGA數據的話,裏面有預後信息。我們還可以分析不同分型和預後的關係。


  4. 不同分型之間存在差異基因。由於基因分型其實就是不同的分組。所以基於不同的分組我們可以尋找差異基因。這裏也就展示了那些基因是有差異的。

    以上就是這個數據庫可以展示出來的結果。對於數據庫分析的所有結果。我們都可以通過Download下載下來。

總的來說

這個網站,給我們提供了可以不用代碼就可以進行基因分型分析的方式。如果想要進行相關的基因分型分析的話。可以嘗試一下這個網站哦。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章