說到ChIP-Seq數據的call peak,第一個想到的軟件肯定是大名鼎鼎的MACS2。MACS2比較適合call narrow peak,當然broad peak也是可以的。但是我課題的數據卻不適用於這個軟件,無奈之下我又嘗試了另一個軟件SICER。SICER適用於找出那些diffuse/broad peak,通過識別空間信號簇來尋找ChIP-enriched信號。(下面是原理,其實一知半解,文獻是關於算法的,原諒我數學統計知識真的不好)
一、Complete SICER flowchart
二、原理
下面是對island的定義:
附上網盤資源(包含文獻和使用教程,有問題的寶寶自己看文獻吧,捂臉)
鏈接:https://pan.baidu.com/s/1UqivCVm935JarAzXfDmqJQ
提取碼:p5gm
複製這段內容後打開百度網盤手機App,操作更方便哦
三、安裝
1.下載安裝包
wget https://home.gwu.edu/~wpeng/SICER_V1.1.tgz
2.解壓
tar xvzf SICER_V1.1.tgz
3.vim SICER.sh SICER-rb.sh
將第一行按如下修改
PATHTO=/home/data/SICER1.1
to
PATHTO=/mydir/SICER_V1.1
4.vim SICER-df.sh and SICER-df-rb.sh
將第一行按如下修改
SICER=/mydir/SICER_V1.1/SICER
安裝成功後可以看到文件夾裏有四個shell腳本文件:SICER.sh,SICER-rb.sh,SICER-df-rb.sh,SICER-df.sh。
四、使用
如果有ChIP library & control library ,就用主腳本SICER.sh;
如果沒有control library,可以用SICER-rb.sh替代SICER.sh.
另外兩個是用來找差異部分,還沒使用過。
1.Command:
SICER.sh takes 11 ordered command line parameters. The general command structure is
$ sh /mydir/SICER_V1.1/SICER/SICER.sh [Input directory] [ChIP file] [Control file][Output directory] [Species] [Redundancy threshold] [Window size] [Fragment size] [Effective genome fraction] [Gap size] [FDR]
具體參數解釋如下:
[Input directory]:輸入文件所在目錄
[Control file]:輸入文件名
[Output directory]:輸出文件所在目錄
[Species]:mm8, mm9, rn4, hg18, hg19, sacCer1, dm2, dm3, pombe, and tair8
[Redundancy threshold]:保留用於分析的冗餘讀數。一般默認爲1.
[Window size]:芯片與控制庫比較時窗口的寬度(單位爲bp)。根據需要自行修改,文獻示例爲200bp。如果是very broad peak 可以適當放大。
[Fragment size]:芯片碎片的平均大小(單位爲bp)。在示例中,默認推薦值是150。該參數用於將讀取的芯片分配到DNA片段的中心。
[Effective genome fraction]:在示例中,是0.8。一般也默認0.8。
[Gap size]:在SICER中允許的間隙大小(以bp爲單位)。在示例中,它是600 bp(等於3個窗口),推薦用於擴展組蛋白修飾標記,如H3K27me3。此參數必須是窗口大小的倍數。
[FDR]:在識別具有統計意義的島嶼時所需的錯誤發現率。在這個例子中,FDR = 0.1%。
2.輸出文件
翻譯不動了,大家湊合看一下英文說明吧。在所有這些文件中,ES_H3K27me3-W200-G600-islands-summary-FDR1e-3和ES_H3K27me3-W200-G600-FDR1e-3-island.bed這兩種是最重要的,可以用於進一步分析。
8月去北京開會有幸遇到了SICER軟件的開發者臧充之老師,交流之後得知老師組建實驗室後更新了SICERv2.0。安裝之後運行發現有三個比較明顯的變化:
1.輸入文件不再侷限於bed格式,bam文件也是可以的。
2.命令格式也發生了變化,如果用到v2版本可以去實驗室主頁看下
3.運行速度大大提升,輸出文件去掉了一些我覺得比較冗餘的
實驗室SICER2網址:
https://zanglab.github.io/SICER2/#sicer2