生信 | GeneMark

(參考)

基因預測原理:宏基因組分析——基因預測篇

      宏基因組基因預測一般包括同源預測和從頭預測。同源預測是通過與基因的同源序列比對,從而獲得與已知基因序列最大匹配,其預測依賴於已知的基因信息,且不能註釋出在數據庫中缺少功能相似性序列的基因和新基因,計算資源消耗過大,時間花費過長。而從頭預測是根據給定的序列特徵來預測,主要依賴於在編碼區和非編碼區擁有不同特徵的信息,並在統計學上進行描述,構建概率模型,用以區別編碼與非編碼區。

GeneMark使用教程: GeneMark使用教程 

GeneMark軟件包是專爲原核基因組和病毒基因組以及元基因組分析而設計的,可以預測基因,以及蛋白質編碼區閱讀框的位移。

makemat或GeneMarkS程序生成相應的GeneMark模型,GeneMark和GeneMark.hmm 進行基因預測。

下載

GeneMark:http://topaz.gatech.edu/GeneMark/

簡要使用

gmhmmp $SampleOutputDirASS/$sample.contigs.fa -f G -A $sample.contigs.prot.fa -D $sample.contigs.nucl.fa -m MetaGeneMark_v1.mod -o $sample.gff

              說明:

                            軟件: gmhnmmp

                            參數:    基本默認

                                          -f :指定輸出的爲gff格式

                                          -A :輸出核酸序列

                                          -D :輸出蛋白序列

                                          -m :宏基因組的模型(下載)

                            輸出結果:   預測到的核酸(nucl.fa)、蛋白質序列(prot.fa)、基因位置信息(gff)

問題:MetaGeneMark_v1.mod 更多模型下載?

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章