【羣體遺傳學】1.0羣體遺傳學簡介 基礎的序列術語

進化開始於一個個體的一條染色體上的一個突變。分子羣體遺傳學研究的是這些突變在羣體中頻率的升高或降低。許多進化力量能夠通過羣體來加速或減緩這些突變的傳遞。通過個體間分子突變的模式能夠推斷出具體是哪些進化力量在起作用。

遺傳標記的使用最早是1990年ABO血型的發現,而“分子”遺傳學則可以追溯到Harris(1966)、Lewontin及Hubby(1966)等人開創性的研究。這些研究者的開創性研究發現個體間在分子水平上的突變數量遠超過之前從形態學研究中觀察到的數量。這些研究使用同工酶(allozymes)來揭示分子變異。這種方法只能觀察到所有變異中的一部分—這些突變能夠通過改變電荷使得蛋白以不同的速度通過凝膠。直到1983年纔出現了第一個關於核酸分子變異的研究(Aquadro and Greenberg 1983; Kreitman 1983)。這些研究通過對每個核苷酸進行測序,讓我們能夠全面觀察到自然羣體中的遺傳變異。

分子羣體遺傳學研究更廣泛地關注進化過程對自然羣體的影響。鑑於此,通常使用少量個體樣本的DNA序列來探究那些作用於整個羣體的進化力量。哪怕是一個位點上的遺傳變異模式都可以用於進化、重組和自然選擇等力量的推斷,還可以對羣體歷史進行推斷(如相對大小和遷移史)。基於過去100多年大量羣體遺傳理論的建立和發展,這樣的一些推斷是可行的。這些理論告訴我們當每種進化力量發生作用時,我們應該(期望)觀察到什麼。關於羣體遺傳學早期的理論研究並沒有利用分子數據,但是分子方法的快速發展崛起極大地促進了相關研究的開展,這些研究工作對分子進化過程進行了建模。

要想從DNA序列中推斷出正確的推論,那分子羣體遺傳學理論是至關重要必不可少的。因此,瞭解主要的模型和它們對應的假設是很重要的。

在本章中會對這些模型進行簡單的介紹,但是不會把羣體遺傳學的基礎的都覆蓋到。我們假設讀者是有一定基礎的。

本章主要着重於最相關的理論和模型,並將這些理論和模型應用到羣體遺傳數據上。理解用於序列推斷的模型的結構對於理解這些推斷是如何實現的是至關重要的。此外,本章節嘗試闡明在羣體遺傳中經常被混淆的術語,並定義它們在本書中的表示和用法。最後討論的是分子進化的中性理論,嘗試在解釋這個概念的同時將其易混淆的地方也作簡單說明。

基礎的序列術語

分子羣體遺傳研究中獲取的DNA序列通常如圖1那樣排列比對在一塊。圖1所示的是4調序列排列比對的結果。每條序列有15個核苷酸;4條序列來自染色體的同一位點。

因爲這4條序列來在4條單獨的同源染色體,所以“我”將這4條同源DNA鏈稱爲序列(sequence)或者是染色體(chromosomes)(不管這4條序列是否是獨特的)。在本書中我們將使用這個術語,但是在文獻中對這4條序列還可以用其他的術語來表述,如基因(gene)、allelessamplescistrons以及allele copies。和20年前一樣,用gene來描述來自一個單一位點的多條序列並不是常見的,尤其是現在個別研究者會從一個物種的多個基因中採集多條序列。但是許多的研究還是使用allele來表示每個染色體,實際上是使用“等位基因”的“不同來源”進行定義。“我”只有在描述個體的某個位點上核苷酸(或氨基酸)不同時才使用allele。這種是根據等位基因狀態的差異進行定義的。因此,對於圖1,我們可以說染色體爲n=4。需要注意的是,這個術語並不取決於這4條序列是否隨機來自2個二倍體個體,或四倍體個體,或4個獨立的自交二倍體。在所有的例子中,我們都是從自然界中採集4條染色體。

在這個比對圖中,我們能夠看到某些位點是不同的,但我們主要關注的是雙等位位點(因爲它們是最常見的變異類型,儘管在一個位點上可能有2個以上的變異)。有許多的術語用於描述這種DNA序列上的差異。我們可以看到在我們的樣品中有6個多態性(polymorphism),或者是分隔點(segregating site),或者是突變(mutations),或者是單核苷酸多態性(single nucleotide polymorphisms,SNPs)。雖然之前多態性和分隔點是使用最多的術語,但是現在更常用的說法是SNP(發音是snip,最早是1994年)。一個單一序列上所有等位基因的集合叫做單倍型(haplotype)。

突變(mutations)在不同的領域有着完全不同的意思。突變可以用來表示DNA發生變化的過程或該過程中產生的新的等位基因。有時候突變是多態性的同義詞;在更注重醫學的人體羣體遺傳學中,僅僅是指稀有的多態性(發生的次數<1-5%,或者僅僅是單一序列)。所有的多態性最初都是以突變爲表現形式出現的。在本書中,“我”用突變來表示變異產生的過程以及在這個過程中新突變的出現。最後,“替換”(substitution)表示的是那些在物種間觀察到的DNA差異,以區別於物種內的變異。

通常,我們認爲indel(insertion/deletion)不是分離位點(segregating sites)(雖然有時候插入1bp的鹼基也算作分離位點)。這樣的劃分的原因是當兩段序列有多個核苷酸插入時,很難區分真真正正的差異鹼基數目。比如,2bp的indel算1個多態性位點還是兩個?這個答案取決於我們是把這個2bp的indel看作是一個單獨的突變還是2個分離的長度爲1bp的突變?通常不將indel等類似的數據加入到分析中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章