Bisulfite處理能夠將基因組中未發生甲基化的C鹼基轉換成U,進行PCR擴增後變成T,與原本具有甲基化修飾的C鹼基區分開來,再結合高通量測序技術,可繪製單鹼基分辨率的全基因組DNA甲基化圖譜。
特定物種的高精確度甲基化修飾模式的分析,必將在表觀基因組學研究中具有里程碑式的意義,並且爲細胞分化、組織發育等基礎機制研究,以及動植物育種、人類健康與疾病研究奠定基礎。
技術優勢:
■單鹼基精確度:精確分析每一個C鹼基的甲基化狀態。
■里程碑式的研究:特定物種的表觀基因組學研究的重要內容,適用於所有具有精確基因組圖譜的物種。
實驗流程:
● 基因組DNAA超聲打斷至100-500bp的片段
● DNA片段末端修復、3’端加A鹼基,連接測序接頭。
● 採用 EZ DNA Methylattion-Gold kit 進行 Bisulfite 處理
● 脫鹽處理,PCR擴增後進行文庫片段大小選擇。
● 合格的文庫用於上機測序。
1. Data Clean
測序結果進行去污染,去接頭處理。根據測序產生的序列文件*.fq 統計read
長度,read數量,數據產量。
2. 標準信息分析
2.1 Bisulfite-seeq 序列與參考序列的比對
在信息分析過程中,首先將每一對reads中正鏈reads上的C鹼基轉換爲T鹼基,而反鏈 reads中的G鹼基轉換爲A鹼基。在此基礎上使用SOAP軟件,將reads與參考基因組序列進行比對,唯一比對reads將用於甲基化信息的分析。數據比對統計結果如下:
2.2 C鹼基測序深度的累積分佈
甲基化C鹼基在基因組上的分佈包含三種形式(CG, CHG和CHH,其中H代表A 或T或C鹼基)。下述圖表中反映了三種不同分佈類型的C鹼基的測序深度累積分佈。其中橫軸表示C鹼基測序深度,縱軸表示一定測序深度下C鹼基的累積比例( copynum <=1.5即uniquely mapped reads的判斷標準之一)。
鹼基測序深度的累積分佈圖
2.3 不同reads測序深度下的基因組覆蓋度
橫軸表示測序深度,縱軸表示特定測序深度下所對應的基因組覆蓋度。
2.4 計算C鹼基的甲基化水平
每一個甲基化C鹼基的甲基化水平均按如下公式進行計算:100*reads/total reads(例如:CpG位點的甲基化率=100*支持CG甲基化的reads/支持甲基化的 reads+支持非甲基化的reads)全基因組平均甲基化水平反應了基因組甲基化圖譜的總體特徵。
Average methylation level for C, CG, CHG and CHH
2.5 全基因組甲基化數據分佈趨勢
甲基化C鹼基中CG, CHGG與CHH 的分佈比例
不同分佈類型的甲基化C位點在不同物種基因組中出現比例不同,因此,各類型mC( mCG、mCHG和mCHH ) 的位點數目,及其在全部mC的位點中所佔的比例(例:mCHG所佔比例= mCHG數目/mC的總數),在一定程度上反映了特定物種的全基因組甲基化圖譜的特徵。
不同分佈類型甲基化 C 的數量及比例
此外,還統計如下數據:
● CG、CHG和CHH中的所有C的甲基化水平
● 各個染色體中CG、CHG和CHH中C的甲基化水平
● 統計不同基因區域內CG、CHG和CHH中C的甲基化水平
● 不同基因元件區域中CG、CHG和CHH中C的甲基化水平
● CHG、CHH中甲基化C附近的9bp序列的序列特徵分析
2.6 全基因組DNA甲基化圖譜
染色體水平的甲基化C鹼基的密度分佈
從染色體水平來描述甲基C鹼基的的分佈情況。藍點表示以10kb的窗口統計甲基化C鹼基的密度在染色體上的分佈情況,光滑曲線則表示不同類型甲基化C鹼基( G、CHG和CHH )的密度分佈。
染色體上甲基化C密度分佈
全基國組不同功能元件區域的甲基化水平分佈
2.7差異性甲基化區域(DMR)分析
在兩個樣品基因組相同位置上尋找包含5個CG的窗口,用CG甲基化水平的差異來尋找甲基化有差異的區域。確定每條染色體上有差異的區域長度和有差異的基因,並對這些基因做 GO 聚類功能分析,以分析差異相關基因是否有明顯的功能聚類,即是否針對性地調控行使某類功能。DMR分析須基於兩個樣品進行差異比較。
DMR相關基因的GO聚類分析