代謝工程的相關術語

基因組註釋

基因組註釋(Genome annotation) 是利用生物信息學方法和工具,對基因組所有基因的生物學功能進行高通量註釋,是當前功能基因組學研究的一個熱點。基因組註釋的研究內容包括基因識別和基因功能註釋兩個方面。基因識別的核心是確定全基因組序列中所有基因的確切位置。從基因組序列預測新基因,現階段主要是3 種方法的結合: (1) 分析mRNA 和EST數據以直接得到結果; (2) 通過相似性比對從已知基因和蛋白質序列得到間接證據 ; (3) 基於各種統計模型和算法從頭預測。


開放

基因同源性分析

1.直bai向同源基因

直向同源基因(orthologous gene)又譯爲“垂直同源基因du”、“zhi正dao同源基因” 或“定向進化同源基因”、“直系同源基因”,是指從同一祖先垂直進化而來的基因。或者說,一個祖先物種分化產生兩種新物種,那麼這兩種新物種共同具有的由這個祖先物種繼承下來的基因就稱爲直向同源基因。直向同源基因通常是編碼生命必需的酶、輔酶或關鍵性的調控蛋白的基因,具有功能保守,進化緩慢,變化速度可覆蓋整個進化歷史,且序列變化速度與進化距離相當等特徵。大多數直向同源基因功能相同或相近,調控途徑也相似, 因此在基因組序列的註釋中,是最可靠的選擇,例如人α一珠蛋白基因與小鼠α一珠蛋白基因。

2.橫向同源基因

橫向同源基因(paralogous gene)又譯爲“旁系同源基因”、“並系同源基因”或“平行進化同源基因”,是指由於基因重複而產生的同源基因例如人γ一珠蛋白基因和β一珠蛋白基因。基因重複後,進化選擇壓力變小、其中一條基因丟失或發生沉默都是促使橫向同源基因分化產生新特性或新功能的原因。然而,雖然某些橫向同源基因轉錄區序列相似度不高,但它們的操縱子卻仍然具有較高的保守度。值得注意的是,橫向同源基因並不侷限於同一物種內,不同物種中由於始祖基因的複製而分化的基因也稱橫向同源基因,如鼠α一珠蛋白和雞β一珠蛋白基因。

3.異源同源基因

異源同源基因(xenologous gene)是由於基因在不同物種間的橫向轉移(horizontal transfer)而產生的。異源同源基因在原核生物中研究比較多。最近研究表明,異源同源基因的原位取代xenolo—gous gene displacement in situ)是細菌進化的強大推動力。另外,在比較真核基因組和原核生物基因組時發現,小部分脊椎動物基因在細菌中有同源序列,而在其他真核生物中卻沒有發現同源序列。一種解釋認爲,這些基因從細菌直接水平地轉移到脊椎動物的祖先,也是異源同源基因;另外一種解釋則認爲,是由於其他的真核生物丟失了這些基因。


基因註釋和篩選菌株有什麼關聯呢?

開放讀碼框(open reading frames, ORF)

在分子生物學中,開放閱讀框(Open Reading Frame, ORF)從起始密碼子開始,是DNA序列中具有編碼蛋白質潛能的序列,結束於終止密碼子連續的鹼基序列


ribosome profiling sequencing(also called ribo-seq) 核糖體圖譜 / 翻譯組

翻譯組--連接mRNA與蛋白的橋樑(上)_嗶哩嗶哩 (゜-゜)つロ 乾杯~-bilibili

引自[2]

measures mRNA that is associated with ribosomes by sequencing ribosome-protected fragments.

翻譯是非常重要的生物學過程,爲了獲取核糖體瞬時的翻譯狀態,需要獲取其翻譯的“足跡”信息。

核糖體足跡(Ribosome footprints,RFs )定義:
mRNA fragments of ~30 nucleotides that result from nuclease treatment of translating ribosomes. These are mRNA regions that are protected by the ribosome as the mRNA is decoded to a protein sequence.


DNA中的3‘端和5’端

DNA 中 3' 端、 5' 端是指每一條鏈du來說的。

在DNA分子的每一條鏈中zhi,磷酸基團那一邊屬於 5' 端,因爲在一個脫氧dao核苷酸中,磷酸連接在脫氧核糖的第5號碳原子上;而—OH端是 3' 端,因爲羥基連接在脫氧核糖的第3號碳原子上。

所以DNA分子的兩條鏈都有 3' 端、 5' 端。


外顯子、內含子、啓動子、終止子、cDNA、

引自[]

外顯子:它在剪接(Splicing)後會被保存下來,並可在蛋白質生物合成過程中被表達爲蛋白質。外顯子是最後出現在成熟RNA中的基因序列,又稱表達序列

內含子:斷裂基因的非編碼序列,可被轉錄,但在mRNA加工過程中被剪切掉,故成熟mRNA上無內含子編碼序列

v2-cfeb9ab420c0f633c720132f37fc026d_b.jpg

cDNA:

cDNA是以mRNA爲模板,在適當引物的存在下,由mRNA經過反轉錄而得到的DNA,是mRNA鏈互補的DNA鏈,其內部已無內含子等結構,值得說明的是,目前火熱的二代測序均是先將RNA反轉錄組成cDNA再進行測序的。

CDS、ORF

是Coding sequence的縮寫,是指編碼一段蛋白產物的序列,是與蛋白質密碼子一一對應的序列,注意其與mRNA序列的差異ORF是open reading frame的縮寫,翻譯成開放閱讀框,是指從一個起始密碼子開始到一個終止密碼子結束的一段序列,但並不是所有讀碼框都能表達出蛋白產物;CDS必定是一個ORF,但也可能包括多個ORF,相反,每個ORF不一定都是CDS。



RNA-seq(RNA sequencing) = RNA的高通量測序技術

bilibili.com/video/BV1X

氨基酸->多肽->蛋白質

enzyme commission (EC) numbers ? 酶委員會編號?

a novel secondary metabolite?新的次生代謝物?


wig、bigWig和bedgraph文件詳解

bio-info-trainee.com/18


原核生物(prokaryotes)

是指一類細胞核無核膜包裹,只存在稱作核區的裸露DNA的原始單細胞生物。


核苷酸

一類由嘌呤鹼或嘧啶鹼基、核糖或脫氧核糖以及磷酸三種物質組成的化合物。又稱核甙酸。五碳糖與有機鹼合成核苷,核苷與磷酸合成核苷酸,4種核苷酸組成核酸。核苷酸主要參與構成核酸,許多單核苷酸也具有多種重要的生物學功能,如與能量代謝有關的三磷酸腺苷(ATP)、脫氫輔酶等。某些核苷酸的類似物能干擾核苷酸代謝,可作爲抗癌藥物。根據糖的不同,核苷酸有核糖核苷酸脫氧核苷酸兩類。根據鹼基的不同,又有腺嘌呤核苷酸(腺苷酸,AMP)、鳥嘌呤核苷酸(鳥苷酸,GMP)、胞嘧啶核苷酸(胞苷酸, CMP)、尿嘧啶核苷酸(尿苷酸,UMP)、胸腺嘧啶核苷酸(胸苷酸,TMP)及次黃嘌呤核苷酸(肌苷酸,IMP)等。核苷酸中的磷酸又有一分子、兩分子及三分子幾種形式。此外,核苷酸分子內部還可脫水縮合成爲環核苷酸


轉錄成mRNA(來自[1])

知乎視頻

mRNA到蛋白質的翻譯過程(來自[1])

知乎視頻 知乎視頻


翻譯起始位點(TIS,translationinitiationsite)


單位 nt、bp代表什麼

1、nt:又叫bai鹼基,,是形成核苷的含氮化合物du,核苷又是核苷酸的組分zhi。鹼基、核苷和核苷酸等單體構dao成了核酸的基本構件。

2、bp:又叫鹼基對,是一對相互匹配的鹼基(即A—T, G—C,A—U相互作用)被氫鍵連接起來。

丰度

(即爲該元素在自然體中的丰度abundance of elements)是指一種化學元素在某個自然體中的重量佔這個自然體總重量的相對份額(如百分數)

富集(purification)

富集是指某些物質通過水、大氣和生物作用而在土壤或生物體內顯著積累的作用。

人爲富集有幾種方法:(1)共沉澱富集法:加沉澱劑於試液中,有沉澱生成,痕量元素隨之共沉澱析出,濾出沉澱,並用小體積溶劑溶解,使痕量物質富集。(2)泡沫浮選法,有兩種:①離子浮選法。讓表面活性劑離子和試液中待富集的痕量離子能生成離子締合物,這類締合物有富集在氣液界面的傾向。在試液中通入氮氣使生成泡沫,痕量離子就能被泡沫浮選。②膠體吸附浮選法。用膠體蒐集劑吸附被富集的元素,再加入與膠體帶相反電荷的表面活性劑,然後通氣浮選。其他富集方法還有離子交換、昇華、揮發、蒸餾等方式。



SnapGene軟件

Mac:

ddooo.com/softdown/1296


FASTA:主要是存儲序列信息的文件

知乎視頻

判斷文件存了多少個序列,通過查看FASTA文件裏有多少個大於號


參考文獻

1、網易公開課 : 生物學

2、核糖體圖譜簡述

3、CDS、cDNA、ORF等等傻傻分不清

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章