GEPIA2021: TCGA免疫細胞分析數據庫

又一個腫瘤免疫分析利器

關於TCGA表達數據的分析。之前我們我們介紹過。目前可能用的最多的也就是GEPIA了。之前在GEPIA2發表的時候,我們對這個數據庫進行了介紹。最近。GEPIA的團隊發表了一個對免疫細胞進行相關分析的數據庫—GEPIA2021(http://gepia2021.cancer-pku.cn/),所以今天就來給大家介紹一下。這個GEPIA2021是幹啥的吧。

背景數據集

和GEPIA數據庫一樣,這個數據庫也是使用TCGA/GTEx當中表達的數據來進行後續分析的數據庫。

和GEPIA不同的是,GEPIA是用來分析在兩個TCGA/GTEx當中基因的變化情況的。而在GEPIA2021當中,主要是用來分析免疫細胞在目標組織當中的變化的。

這個方面和TIMER數據庫有點兒類似,不過使用的算法不同。在在GEPIA2021當中,主要是作者使用三種算法來評價了組織當中的免疫細胞(CIBERSORT, EPIC, quanTIseq)。因此如果想用這三種算法來分析TCGA/GTEx數據庫當中的免疫細胞的話,可以使用GEPIA2021。

數據庫使用

在這個數據庫當中,總共分成了四個部分的分析。

1. 免疫細胞比例分析

在這個部分,我們可以分析不同的組織當中免疫細胞比例。我們需要做的就是選擇想要分析的組織已經想要分子的免疫細胞即可。

例如我們想要分析在乳腺癌當中基於CIBERSORT算法得到的兩種B細胞的變化。

在選擇好之後,點擊plot即可得到相關的結果。

結果主要包括兩個部分,一個是相同的組織當中免疫細胞比例是否存在差別。另外一個是在相同的免疫細胞在不同的組織當中是否存在差別

2.相關分析

在相關分析當中,主要用來分析組織當中候選免疫細胞是否有區別。在這個部分,如果選擇多種組織的話,也是把這些組織的表達水平融合到一起分析的。

這一部分的結果主要是通過散點圖來進行呈現的。同時對於不同的組織使用不同的顏色進行區分。同時在結果當中給出了相關分析的相關係數。

3. 基因表達亞組分析

分析基因在不同組織以及不同細胞之間的某一個表達情況。主要也是通過選擇想要分析的組織;想要分析的免疫細胞,同時輸入想要分析的基因即可。

在這個過程當中,作者通過數據的轉換。計算了候選基因和免疫細胞之間的關係。這樣就可以觀察在不同的免疫細胞當中基因的表達情況了。

關於具體的轉換方式,感興趣的可以看一下原始文獻。

我們點擊 Plot 之後。就可以得到相關在不同組織當中不同免疫細胞當中基因的表達情況。以及在不同的免疫細胞分組當中不同組織內基因的表達情況。

4.生存分析

分析免疫細胞在不同腫瘤當中對預後是否有影響。主要的分析方法是通過KM的算法進行分析的。在這個數據庫當中,除了以上的基本選擇,還可以選擇進行cutoff的比例(默認的是使用中位值進行cutoff選擇的)。

預後分析的結果是通過生存曲線圖來進行展示的。同時裏面也包括了預後分析的P值。

另外需要注意的是,對於免疫細胞的選擇,如果選擇兩個以上的細胞,不是對這兩個免疫細胞分別進行預後分析。而是來分析這些免疫細胞整體是否影響預後。對於其免疫評分是通過相加融合到一起的。

總的來說

以上就是這個數據庫的基本使用方式了。算是GEPIA數據庫在免疫浸潤方面的一個擴展。如果要和TIMER2數據庫比較的話。

  • 數據量方面:這個數據庫在TCGA數據的基礎上添加了GTEx數據,這樣可以更好的分析正常組織了。

  • 分析算法方面: TIMER2計算了多個算法的結果。GEPIA2021的話則使用了其中的三個

  • 分析內容方面:TIMER主要是用來分析不同組學和這些免疫細胞的相關性的(基因表達,突變,拷貝數以及預後)。GEPIA2021的話則是以免疫細胞爲主體進行分析。分析這些免疫細胞在不同組織當中的具體特徵。

因此,大家可以基於不同的目的來選擇不同的數據庫話。

對了,需要注意的是:在GEPIA2021當中,免疫細胞的選擇不能超過四個哈。要過了就不能分析了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章