你憑啥寫“該基因在人體中高表達”--誰給你的勇氣,梁靜茹嗎?

摸着你的良心,你有沒有在文章的introduction裏面煞有介事的介紹過某基因,你寫“xxx基因是在人體中分佈廣泛、高表達且高保守的基因/蛋白,主要參與XXX等生物學過程”,套路,都是套路!

小編曾經也沒頭腦的寫過這樣的話,如今開始學了生信,好奇心就愈發控制不住了,那麼我們到底憑什麼才能明目張膽的下結論,認爲一個基因是高丰度的呢?

今天以以下這篇有趣的文章爲因子,我們來探索一下判定基因丰度的方法吧!

小聲比比,這篇文章非常精彩哦~你是不是做過很多實驗結果和主流的研究結果是矛盾的,做出來的結論和CNS文章的結論相反(淚流滿面)

一直以來,大多數文獻都報道MALAT1是一個促癌基因,而作者做出了相反結果,在一頓研究之後發現了之前報道文章的不妥之處,經過精心設計後,得到了一個圓滿的答案。MALAT1其實是一個抑癌基因,前人使用的小鼠MALAT1缺陷模型,雖然MALAT1的表達缺失了,但MALAT1相鄰基因的表達上調,正是這 上調的MALAT1相鄰基因造成了促癌的後果。在更換新的MALAT1缺陷模型後,解開了MALAT1功能的面紗。

基因數據庫

NCBI

凡是涉及到基因相關信息,我們就會想到各式各樣的基因數據庫,一說到基因數據庫就會忍不住想到NCBI,是的沒錯,我們打開NCBI查一查吧!結果如圖:

MALAT1在人體不同組織中的表達,橫座標爲sample,縱座標爲RPKM:RPKM是Reads Per Kilobase per Million mapped reads的縮寫,代表每百萬reads中來自於某基因每千鹼基長度的reads數。RPKM是將map到基因的read數除以map到基因組上的所有read數(以million爲單位)與RNA的長度(以KB爲單位)。

假如reads長度是150 bp,測序深度30X,按照(30億*30X的深度/150reads長度)=可得6億條reads,那麼根據圖可知emm...這個MALAT1的每百萬條reads裏就有5-150條有MALAT1(Jimmy說RPKM到達100就算是高的了)。

NIH-GTEX

GTEx是一個收錄正常人體組織的測序結果的基因數據庫。搜索MALAT1後結果如下,可見MALAT1在正常人體組織中的TPM(Transcripts per million)是非常高。

GeneCards®: The Human Gene Database

GeneCards類似於各大基因數據庫的搜索引擎和總結。搜索MALAT1--轉到Expression section後結果如下:

如圖可知MALAT1的RNAseq數據,其FPKM (Fragments Per Kilobase Million)含量也是非常高的。

綜上所述,從三個基因數據庫查閱得知,MALAT1確實是一個高丰度且分佈廣泛的基因。

只不過,RPKM、TPM、FPKM三個單位是不是讓你傻傻分不清楚這是啥玩意兒,沒錯我也很好奇,所以狠狠的擼了一把StatQuest的教學視頻,想要了解的小夥伴,留言讓我知道~那我們還可以出一波RPKM、TPM、FPKM解說推文~~

好了,掌握了基因丰度查閱的方法,再擼一把RPKM、TPM、FPKM的含義,終於可以吹牛打草稿了~拜拜~~

1

END

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章