call peak的另一個軟件-----SICER

  說到ChIP-Seq數據的call peak,第一個想到的軟件肯定是大名鼎鼎的MACS2。MACS2比較適合call narrow peak,當然broad peak也是可以的。但是我課題的數據卻不適用於這個軟件,無奈之下我又嘗試了另一個軟件SICER。SICER適用於找出那些diffuse/broad peak,通過識別空間信號簇來尋找ChIP-enriched信號。(下面是原理,其實一知半解,文獻是關於算法的,原諒我數學統計知識真的不好)

一、Complete SICER flowchart

二、原理

下面是對island的定義:

附上網盤資源(包含文獻和使用教程,有問題的寶寶自己看文獻吧,捂臉)

鏈接:https://pan.baidu.com/s/1UqivCVm935JarAzXfDmqJQ 
提取碼:p5gm 
複製這段內容後打開百度網盤手機App,操作更方便哦

三、安裝

1.下載安裝包

wget https://home.gwu.edu/~wpeng/SICER_V1.1.tgz 

2.解壓

tar xvzf SICER_V1.1.tgz

3.vim SICER.sh SICER-rb.sh

將第一行按如下修改

PATHTO=/home/data/SICER1.1

to

PATHTO=/mydir/SICER_V1.1

4.vim SICER-df.sh and SICER-df-rb.sh

將第一行按如下修改

SICER=/mydir/SICER_V1.1/SICER

安裝成功後可以看到文件夾裏有四個shell腳本文件:SICER.sh,SICER-rb.sh,SICER-df-rb.sh,SICER-df.sh。

四、使用

如果有ChIP library & control library ,就用主腳本SICER.sh;

如果沒有control library,可以用SICER-rb.sh替代SICER.sh.

另外兩個是用來找差異部分,還沒使用過。

1.Command:

SICER.sh takes 11 ordered command line parameters. The general command structure is

$ sh /mydir/SICER_V1.1/SICER/SICER.sh [Input directory] [ChIP file] [Control file][Output directory] [Species] [Redundancy threshold] [Window size] [Fragment size] [Effective genome fraction] [Gap size] [FDR]

具體參數解釋如下:

[Input directory]:輸入文件所在目錄

[Control file]:輸入文件名

[Output directory]:輸出文件所在目錄

[Species]:mm8, mm9, rn4, hg18, hg19, sacCer1, dm2, dm3, pombe, and tair8

[Redundancy threshold]:保留用於分析的冗餘讀數。一般默認爲1.

[Window size]:芯片與控制庫比較時窗口的寬度(單位爲bp)。根據需要自行修改,文獻示例爲200bp。如果是very broad peak 可以適當放大。

[Fragment size]:芯片碎片的平均大小(單位爲bp)。在示例中,默認推薦值是150。該參數用於將讀取的芯片分配到DNA片段的中心。

[Effective genome fraction]:在示例中,是0.8。一般也默認0.8。

[Gap size]:在SICER中允許的間隙大小(以bp爲單位)。在示例中,它是600 bp(等於3個窗口),推薦用於擴展組蛋白修飾標記,如H3K27me3。此參數必須是窗口大小的倍數。

[FDR]:在識別具有統計意義的島嶼時所需的錯誤發現率。在這個例子中,FDR = 0.1%。

2.輸出文件

翻譯不動了,大家湊合看一下英文說明吧。在所有這些文件中,ES_H3K27me3-W200-G600-islands-summary-FDR1e-3和ES_H3K27me3-W200-G600-FDR1e-3-island.bed這兩種是最重要的,可以用於進一步分析。

8月去北京開會有幸遇到了SICER軟件的開發者臧充之老師,交流之後得知老師組建實驗室後更新了SICERv2.0。安裝之後運行發現有三個比較明顯的變化:

1.輸入文件不再侷限於bed格式,bam文件也是可以的。

2.命令格式也發生了變化,如果用到v2版本可以去實驗室主頁看下

3.運行速度大大提升,輸出文件去掉了一些我覺得比較冗餘的

實驗室SICER2網址:

https://zanglab.github.io/SICER2/#sicer2

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章