構建ML分子系統發育樹如何分區

    使用多基因構建ML樹時,需要將不同基因分區,以保證各基因估算出不同的進化速率。如有5個基因,最少要分5區。

    如有蛋白質基因(如CO1,H3),由於蛋白質3rd Coden 密碼子的擺動性,需要將1st,2nd Coden分成一區,3rd Coden分成一區,用XX-XX\3的形式書寫(相見RaxMl或IQTREE的使用說明)。

那麼,如何判斷蛋白質基因中每一個位點屬於那個密碼子位點呢?可以先看NCBI中translation字段給出的該基因翻譯出的蛋白質編碼,再用Seaview軟件翻譯對齊好的序列,看序列對齊的起點是哪裏。如果Seaview結果與NCBI不一致,可嘗試在序列前端添加若干“-”,直至翻譯出的蛋白序列與NCBI的吻合(可以用Seaview的Creat Set功能輔助標記1st-2nd Coden位置)。這樣,看原始第一個位點屬於哪位密碼子,則以後依此類推就能得出結論。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章