10X genomics scRNA_Seq 原理概念解說

單細胞分離--測序原理

10X Genomics採用Drop-Seq技術, 橫向孔道逐個導入凝膠微珠Gel beads第一個縱向道輸入細胞。當凝膠微珠和細胞碰撞會被吸附在微珠上,然後通過微流控技術運送到第二個縱向通道(“油管”)。這時就會形成一個個的油滴GEMs(一個油滴就是一個凝膠微珠,也就是一個單細胞),然後收集在EP管中。每一個凝膠微珠都佈滿了不同的Barcode和UMI連接的序列,然後再加上PolyT就形成了像“刺”一樣的捕獲抓手,隨後細胞裂解,利用3'端 poly(A) 鹼基互補特定抓取mRNA構建轉錄文庫。據說可以7分鐘內完成100~80,000個細胞的捕獲

簡而言之:一個油滴 = 一個細胞(單細胞) = 一個RNA_Seq

文庫構建

 read1:主要用來定量

read2:真正需要測序的mRNA序列

Barcode:用於標記每一個細胞

UMI:標記每一個細胞當中的每一個轉錄本(即標記基因)

PolyT:用於捕獲PolyA尾巴的mRNA,進行反轉錄反應

10X genomics單細胞測序通過Barcode來標記細胞,UMI 來標記轉錄本,這樣與參考基因比對後就可以定量細胞以及基因的數量

備註:使用 UMI 計數方法( UMI 計數,是指在建庫過程中,通過在引物上,增加隨機序列,則對於同一種 mRNA 連上同樣的 UMI 概率幾乎爲 0,則我們可以忽略由於 PCR 造成的誤差,對於一種 mRNA,測到的 UMI 數量可以近似看成 mRNA 的表達個數)

細胞的質控(非reads的質控)     

由於每個單細胞都是獨特的,不可能開展重複實驗並評估噪音。因此,必須採取一些質量控制手段,以確保數據的可靠性。專家建議,向每個細胞裂解液中加入已知序列和數量的合成mRNA,如外源RNA對照聯盟(ERCC)開發的加標RNA(10X genomics 官網有提供ERCC相關的參考基因組下載)。這些RNA的讀數將提供樣本間差異的信息。

細胞的過濾(非reads的過濾)

根據基因的表達量等特徵,對細胞進行過濾,通常的做法就是指定一個閾值,比如要求一個細胞中檢測到的基因數必須大於100纔可以進入到下游分析,如果小於這個數字,就過濾掉該細胞。需要強調的是,在設定過濾的閾值時,需要人爲判斷,這樣的設定方式會受到主觀因素的干擾,所以往往都會指定一個非常小的過濾範圍,保證只過濾掉極少數的離羣值點。

細胞聚類

細胞聚類允許我們推斷細胞類型。根據細胞基因表達譜的相似性對細胞進行分組,得到細胞簇。通過距離度量來確定表達譜相似性,通常將降維結果作爲輸入。相似性評分的一個常見示例是歐幾里德距離,該距離在 PC 縮減的表達空間上計算。在R包Seurat中,不是直接對所有細胞進行聚類分析,而是首先進行PCA主成分分析,然後挑選貢獻量最大的幾個主成分(也相當於做了特徵選擇),用挑選出的主成分的值來進行聚類分析。聚類分析是下游分析的主要和首要步驟,因爲聚類後,各個細胞就有了groupinfo(即標籤),可用於後續的差異表達分析,找出各細胞組間顯著差異的genes,然後做GO,KEGG富集分析。

 

發佈了20 篇原創文章 · 獲贊 50 · 訪問量 30萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章