組織特異性基因(Tissue-specific Genes)是指在不同類型的細胞中特異性表達的基因,其調節細胞特異的形態結構或生理功能。組織特異性基因的表達是理解生物學過程、生理環境和疾病產生的關鍵,對TissGenes的研究將有助於深入瞭解致病機制和特異性治療靶點,同時可以促進對臨牀相關的突變基因的發現。
關於TissGDB
Tissue-specific Gene DataBase in cancer (TissGDB),由德州醫學中心Zhao Zhongming教授實驗室開發,年初發表於NAR雜誌,是存儲了癌症中組織特異性基因的數據庫。
爲了獲得可靠的TissGenes,整合了三個代表性組織特異性基因表達數據庫,分別是人類蛋白質圖譜(HPA)、組織特異性基因表達和調節(TiGER)、基因型組織表達(GTEx),獲得與28種癌症相關的22種組織類型,最終選擇了2461個至少能在上述三種數據庫的兩個中檢索到的TissGenes,以確保組織表達的特異性,爲癌症和相關疾病研究提供了參考資源。
檢索方式
- 在搜索框中輸入Gene symbol、Entrez gene ID、UniProt accession進行索引
- 根據癌症類型進行搜索
編號 | 英文縮寫 | 中文名 |
---|---|---|
1 | ACC | 腺樣囊性癌 |
2 | BLCA | 膀胱癌 |
3 | BRCA | 乳腺癌 |
4 | CESC | 宮頸鱗狀細胞癌 |
5 | COAD | 結腸癌 |
6 | ESCA | 食管癌 |
7 | GBM | 腦癌 (膠質母細胞瘤) |
8 | KICH | 腎嫌色細胞癌 |
9 | KIRC | 腎透明細胞癌 |
10 | KIRP | 乳頭狀腎細胞癌 |
11 | LAML | 骨髓癌 |
12 | LGG | 腦膠質瘤 |
13 | LIHC | 肝癌 |
14 | LUAD | 肺腺癌 |
15 | LUSC | 肺鱗狀細胞癌 |
16 | OV | 卵巢癌 |
17 | PAAD | 胰腺癌 |
18 | PCPG | 腎上腺癌 |
19 | PRAD | 前列腺癌 |
20 | SARC | 軟組織癌 |
21 | SKCM | 皮膚癌 |
22 | STAD | 胃癌 |
23 | TGCT | 睾丸癌 |
24 | THCA | 甲狀腺癌 |
25 | THYM | 胸腺癌 |
26 | UCEC | 子宮內膜癌 |
27 | UCS | 子宮癌 |
28 | UVM | 眼癌 |
- 根據組織類型進行搜索
編號 | 英文名 | 中文名 |
---|---|---|
1 | Adrenal_Gland | 腎上腺 |
2 | Bladder | 膀胱 |
3 | Bone_Marrow | 骨髓 |
4 | Brain | 腦 |
5 | Breast | 乳房 |
6 | Cervix | 子宮 |
7 | Colon | 結腸 |
8 | Eye | 眼睛 |
9 | Kidney | 腎 |
10 | Liver | 肝 |
11 | Lung | 肺 |
12 | Ovary | 卵巢 |
13 | Pancreas | 胰腺 |
14 | Prostate | 前列腺 |
15 | Skin | 皮膚 |
16 | Soft_Tissue | 軟組織 |
17 | Stomach | 胃 |
18 | Testis | 睾丸 |
19 | Thymus | 胸腺 |
20 | Thyroid_Gland | 甲狀腺 |
21 | Uterus | 子宮 |
22 | Esophagus | 食道 |
- 根據疾病所在染色體號進行搜索
檢索結果
以TMPRSS2基因爲例來看一看如何解讀檢索結果。
TMPRSS:自1988年發現第一個TMPRSS基因,至今已發現十餘個家族基因,並且發現該基因的突變會引起耳聾、癌症(如前列腺癌症、卵巢腺瘤、乳腺癌、胰腺癌等)、貧血等疾病的產生。
下面是檢索結果頁面,點擊Symbol號進入基因詳情頁面。
詳情展示分爲7部分,藍色字體可點擊跳轉對應信息。具體見下:
1. TissGeneSummary
該部分展示了基因的基本信息(如Symbol號、別名、基因組位置);與基因表達、信號通路、調節機制相關的信息,藍色字體與各數據庫相關聯,同時展示了基因的組織和癌症類型以及相關的PubMed文章。
2. TissGeneExp
該部分根據基因的表達量進行了各種註釋。
2.1 基因在28種癌症類型中的表達情況,X軸是28種癌症類型,Y軸是經過標準化計算後的基因表達值
由圖可知TMPRSS2基因在前列腺癌(PRAD)、腎嫌色細胞癌(KICH)和結腸癌(COAD)中的表達相對較高。這個圖如果能按照表達量排序會看着更爲清楚。
2.2 基因在28種癌症類型中異構體表達情況,X軸是28種癌症類型,Y軸是經過標準化計算後的基因表達之值,不同顏色代表不同類型的異構體。可以看到TMPRSS2有一個轉錄本只在PRAD癌症中顯著表達。這個轉錄本有可能成爲潛在的檢測標記物。同一基因不同剪接體有不同的表達和功能是拓展已有基因功能研究的很好的路子。
2.3 根據GETx數據庫展示了基因在正常組織中的表達值(僅展示與28種癌症相關組織類型),X軸是組織類型,Y軸是經過標準化計算後的基因表達之值
發現TMPRSS2基因在前列腺(Prostate)、胰腺(Pancreas)和胃(Stomach)中的表達較高。這樣把癌症和正常割裂開來看,對判斷致癌性意義不大。
2.4 展示了基因在14種不同癌症類型中的表達情況,以在正常組織中的表達量作爲對照,X軸是癌症類型,Y軸是經過標準化計算後的基因表達之值。
直觀展示了TMPRSS2基因在14中不同癌症類型中相對於正常組織的上下調錶達情況。
發現該基因在頭頸部鱗狀細胞癌(HNSC)、腎透明細胞癌(KIRC)、乳頭狀腎細胞癌(KIRP) 癌組織中的表達量相對正常組織顯著下調,而在前列腺癌(PRAD)、腎嫌色細胞癌(KICH) 中的表達量明顯高於正常組織中的表達量。這個圖如果再能附加一個統計檢驗p-value就更好了。
2.5 TMPRS2基因在不同癌症類型中顯著差異表達情況,篩選標準 Log2(fold change)絕對值>1 and FDR<0.05。
3. TissGene-miRNA
在28種癌症類型中,TissGene相關的顯著抗性miRNA
4. TissGeneMut:TissGeneSNV, TissGeneCNV, and TissGeneFusions
4.1 TissGeneSNV
每個基因座的單核苷酸位點變異(SNV)統計,不同顏色代表不同的癌症類型,圓圈大小表示樣本數多少
由圖可知,不同癌症中,TMPRSS2基因DNA序列的不同位置發生核苷酸變異。這個圖只能看個大概,具體還是到TCGA的官網查看更清晰。TCGA數據庫使用。
TissGene的28種癌症類型的體細胞核苷酸變體,X軸是癌症類型,X軸括號中的數字表示具有突變的樣本數(nsSNV),Y軸是突變樣品的百分比
基因在不同組織中的不同突變類型,按突變頻率排列。
4.2 TissGeneCNV
展示了TMPRSS2基因在28種癌症類型中的基因拷貝數變異(CNV),X軸是癌症類型,Y軸是不同拷貝變異類型所佔的比例
4.3 TissGeneFusions
在腫瘤發生時,經常會發生基因組水平的斷裂和重新拼接。當兩個基因分別斷成兩半,並且發生了錯誤拼接時,就有可能形成新的基因片段,這就叫做融合基因。大多數情況下,融合基因可以導致異常序列或功能的蛋白質的產生,或者某些基因表達的失調,從而導致或促進腫瘤的發生。該表展示了包含TMPRSS2基因的融合基因類型。融合基因因爲本身不在正常細胞中出現,是絕好的檢測和治療靶點。
5. TissGeneNet
蛋白互作構成了細胞生化反應網絡的一個主要組成部分,對調控細胞及其信號有重要意義。研究蛋白互作一是可以驗證兩個蛋白之間是否存在相互作用,二是篩選某個感興趣蛋白的互作蛋白。
該部分基於蛋白質-蛋白質相互作用數據(CePIN)的共表達基因網絡,展現了與TMPRSS2基因相關的不同癌症類型中的蛋白互作情況,正常組織與癌症組織蛋白互作網絡的差異有助於找到感興趣的目標蛋白。
這個通過Cytoscape或R都可以繪製,見network3D 交互式網絡生成和新出爐的Cytoscape視頻教程。
6. TissGeneProg
通過對數秩檢驗,展現了TMPRSS2基因相關的28種癌症類型中的 Kaplan-Meier 總生存率曲線(overall survival, OS)和無復發生存率曲線(relapse free survival, RFS)。R語言學習 - 非參數法生存分析。
根據95%的置信區間繪製的28種癌症類型中總生存和無復發生存的風險率,括號中n是樣本量,中括號中的數值是風險率的區間,圓圈標出的是預估最可能的風險率。從圖中可見,TMPRSS2對大多數疾病的風險影響不大。
7. TissGeneClin: TissGeneDrug and TissGeneDisease
TissGeneDrug :針對該基因,治療癌症的藥物信息
TissGeneDisease:與該基因相關的疾病信息
這個數據庫整體看是信息比較全的數據庫,可以作爲我們瞭解一個基因的初始。但其可視化和細節展示方面做得並不太好,一方面我們自己做項目時引以爲戒,另一方面也需要配合更多數據庫去解讀結果。