可變剪切新模式: 外顯子內含子剪切

關於可變剪切,簡單而言就是,一個基因從DNA-mRNA的過程當中,由於剪切位點的不同,會形成不同的mRNA剪切變異體。對於可變剪切模式,之前的介紹TCGA SpliceSeq數據庫的時候提到了數據庫當中包含的其中7種可變剪切模式。

在這個數據庫當中提到的屬於經典的可變剪接模式。隨着二代測序的技術的使用,也會發現一些額外的剪切模式。比如這次我們要提到的外顯子內含子剪切(exitrons(exonic introns) splicing, EIS)。既然二代測序技術可以發現EIS。那麼就可以使用TCGA數據庫來尋找腫瘤擋着的EIS。因此也就可以對腫瘤擋着的EIS事件進行全面的分析。所以也就有了今天我們要介紹的這個文獻。

今天就簡單的來介紹一下這篇文獻吧。

關於EIS

在知道這個文獻講了什麼之前。還是要了解一下什麼是EIS的。簡單來說就是在基因的某一個外顯子當中存在5‘和3’剪切位點。因此在基因剪切的過程中,會發生外顯子從缺失一部分的情況。所以就形成了兩個不同的剪切體。

基於RNA-seq數據評價EIS的指標:PSO

爲了更好的評價TCGA當中的EIS。作者開發了一個軟件:ScanExitrons。使用這個軟件可以計算評價EIS的指標:PSO(percent spliced out)。PSO這個指標類似於評價可變剪切的一個常規指標PSI。也是代表EIS發生佔總的相關轉錄本的百分比。

文章主要內容

癌症中EIS事件的概況

在計算了一個新的指標之後,第一件事情首先肯定還是有在所有癌的組織當中觀察事件的具體分佈的。由於TCGA當中的正常組織較少。所以作者也把GTEx裏面的正常數據也納入進來進行分析。

在不同的組織樣本存在EIS的樣本個數

作者發現,在TCGA癌症樣本中,含有EIS基因百分比(62.7%)明顯高於GTEx健康人羣(17.1%)。這表明EIS在整個癌症轉錄組中都很普遍。

在腫瘤之間比較的時候,作者發現在卵巢癌(OV)、胃癌(STAD)、食管癌(ESCA)以及急性髓性白血病 (LAML)當中都存在較高的EIS發生率。

同時在正常組織大於40的腫瘤當中對EIS負荷進行meta分析。經過分析,發現腫瘤樣品中的EIS負荷比匹配的正常樣品中顯着更高。

分析了這麼多,肯定也是要看差異剪切事件的。所以作者還是對正常樣本大於40的這些癌種進行了差異剪切事件分析,經過分析,發現了16個EIS在多個腫瘤當中存在差異。

同時爲了分析,EIS事件和剪切因子的關係,作者提取了404個剪切因子的RNA-seq的fpkm表達量,利用這些剪切因子的表達量和EIS事件進行分析。最終發現癌症中的大量EIS事件可能歸因於剪接機制的部分破壞。

腫瘤特異性EIS使新型癌症驅動基因的發現成爲可能

以上是在整體的腫瘤當中的EIS的情況。爲了確定哪些是腫瘤特異性的EIS(TSEs)。作者將一組正常樣品(TCGA正常樣品和GTEx)與TCGA腫瘤數據進行了比較,以鑑定以下的TSE:(1)未在GTEx樣品中剪接,(2)在不超過3個TCGA正常樣品中剪接。結果,總共123,338(95.3%)個EIS被認定爲TSE。在多個癌種當中,OV,ESCA,STAD和LAML的TSE事件最多。

進一步,作者對這些TSE事件和腫瘤的預後進行了相關分析。經過分析,發現TSE在多個腫瘤當中和預後有關係。

爲了確定TSE剪切的功能的影響,作者基於頻率統計的方法統計了TSE的涉及的基因(significantly exitron-spliced genes, SEGs)。經過分析最終發現35個基因在COSMIC腫瘤基因譜當中存在差異。

最後作者在前列腺癌當中確定了一個新的驅動基因(NEFH)進行了後續的是實驗驗證。

SEGs和體細胞突變的關係

在確定了SEGs之後,作者使用SEGs和差異體細胞突變(significantly mutated genes, SMGs)進行了分析。經過分析發現,TSE的發生和SMGs存在互斥效應

爲了更詳細地研究SEG與SMG之間的關係,作者在PRAD隊列當中進行了詳細分析,經過分析發現,NEFH是排名最高的SEG,但未顯示突變。前列腺癌中已知的SMG(例如TP53和SPOP)未顯示EIS。

另外,爲了說明SEGs和SMGs對基因蛋白功能的影響。作者通過FOX A1基因對其蛋白結構域在2D和3D水平上進行了分析。經過分析發現FOXA1當中的EIS可能是一種新的功能機制。

另外,在檢查所有TCGA腫瘤中的TSE時,我們發現受EIS和體細胞突變影響的蛋白家族(Pfam)域存在顯着重疊(p <2.2e‑16),並且有很強的相關性(圖4E),表明EIS影響蛋白其功能類似於遺傳改變。

除了具體基因的突變。作者又分析了TSEs和TMB,變異等位基因頻率和表達突變的變異的關係。經過分析,發現在TSE高的腫瘤樣本當中,同時存在高的TMB,變異等位基因頻率。

爲了進一步瞭解EIS在腫瘤當中的功能,作者使用MsigDB當中的腫瘤核心基因集中的TSE情況。有趣的是,頻繁突變的途徑,例如磷脂酰肌醇3-激酶,在任何癌症中均未富含TSE改變。再次證實了EIS可能代表癌症中一種獨特但尚未探索的機制的觀點,該機制可能與基因組改變互補。

TSE相關的抗原新表位

由於EIS可以編碼新的蛋白,所以作者就鑑定出了168,206個推定的新抗原。在所有腫瘤類型中,OV被發現具有最高的TSE新抗原負擔(圖S6E)。

以上是通過RNA-seq的數據進行分析了。爲了準確的尋找新的抗原。作者使用了TCGA的蛋白組學數據來鑑定新抗原。最終鑑定了和TSE相關的28個新表位。最後分析了這28個抗原表位和免疫細胞的相關性。

總的來說

以上就是這個文章的大致內容了。其中有一些基礎實驗驗證的部分,限於篇幅就省略了。如果有興趣的可以去看一看哈。作者在獲得了EIS之後,對其進行了多腫瘤和多組學的分析。同時也發現了腫瘤特異性的EIS在免疫治療方面的相關性。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章