時間序列的單細胞轉錄組數據分析

利用時間是一個極其高級的規律。——恩格斯

單細胞轉錄組數據分析在闡述多細胞生物發育與疾病進程方面已經開發了多種新的方法,如比較有名的軌跡推斷(TI,trajectory inference)。但是,我們知道,各種軌跡推斷方法只是一種利用表達量的排序手段而已,而且嚴重依賴先驗的知識,如根節點的選擇。有沒有一種技術可以真正的在RNA轉錄的時候爲轉錄的RNA打上時間的標籤呢?

今天,就爲大家介紹一種基於RNA代謝標記的單細胞分析方法:dynamo。我們發現當我們真的可以標記RNA新舊之後,其實基於數學上我們對時間的定義,可以開發出許多新的單細胞動力學模型。

單細胞RNA測序提供了整個轉錄組的快照,但掩蓋了RNA生成動態。Qi Qiu等提出了一種單細胞代謝標記的新RNA標記測序(scNT-seq,基於微流控微孔板單細胞RNA標記技術爲新格元商業化的DynaSCOPE技術),一種用於大規模平行分析來自同一細胞的新轉錄和已存在mRNA的方法。該方法基於液滴微流體的方法能夠在條形碼珠上進行高通量化學轉換,有效地用T-to-C替換標記新轉錄的mRNA。

Qi Qiu等在文章中的數據揭示了時間序列的轉錄因子活性和在單細胞水平上響應神經元激活的細胞狀態軌跡。作者進一步確定了RNA生物發生和衰變的速率,以揭示在多能和罕見的全能雙細胞胚胎(2C)幹細胞狀態之間逐步轉換的RNA調控策略。最後,將RNA代謝標記與遺傳擾動相結合,確定DNA甲基胞嘧啶雙加氧酶作爲進入like-2C細胞狀態的表觀遺傳屏障。時間分辨率下的單細胞轉錄組分析,打開了關於細胞類型特異性RNA調節機制的新線索。

我們知道,RNA水平的動態變化是由RNA轉錄、加工和降解的相互作用調控的。因此,要了解轉錄組在不同功能細胞類型中調控的機制,需要對基因表達的時間動態進行細胞類型特異性測量。單細胞RNA測序(scRNA-Seq)的發展使人們對細胞類型和狀態的異質性有了更全面的瞭解。然而,標準的scRNA-Seq方法捕獲到的是新轉錄(“新”)和已存在(“舊”)RNA的混合物,而不能獲得RNA的時間動態。

單細胞轉錄組測序,連同RNA速度(velocity )和代謝標記(metabolic labeling)方法,以前所未有的分辨率揭示細胞狀態及其之間的轉換關係。然而,充分利用這些數據需要開發出能夠預測細胞命運並揭示調控機制的動態模型。在這裏,python 分析工具dynamo是一個分析框架,整合固有的剪接與否和標記與否,以估計絕對的RNA速度,重建速度矢量場(vector fields ),以預測未來的細胞命運,並最終使用微分幾何分析闡明潛在的調控網絡。

在文章Massively parallel and time-resolved RNA sequencing in single cells with scNT-seq中,作者將dynamo應用不同的生物學過程,包括預測分化造血幹細胞譜系的未來狀態,從細胞週期進程中糖皮質激素反應的反捲積、驅動斑馬魚色素沉着的調控網絡的表徵、確定對SARS-CoV-2感染的可能耐藥性途徑。

因此,基於RNA代謝標記的工作代表了從定性的、隱式的分化概念到定量和預測理論的重要一步探索。新模型的提出也爲之前定性的和描述性質的單細胞數據分析朝着定量和預測邁出一大步。

開發dynamo的初心

  1. 用於常規scRNA-seq數據集的健壯和準確的RNA速度估計:
  • velocity估計的三種方法(包括新的基於負二項分佈的方法)
  • 改進的核轉移矩陣計算和速度投影
  • 修正RNA velocity 矢量的策略(當RNA速度方向有問題時)
  1. 基於scRNA-seq的時間分辨代謝標記的建模
  • RNA代謝標記,結合RNA剪切,轉錄,剪接和降解
  • 用於一次性、脈衝、追逐和混合代謝標記實驗的綜合RNA動力學速率估計
  1. 超越RNA velocity 到連續向量場功能,用於細胞命運轉變的功能和預測分析:
  • 動力學系統用於識別穩定細胞類型(不動點)、細胞狀態邊界(分隔線)等的方法
  • 計算RNA加速(揭示早期驅動因素),曲率(揭示命運決定點的主要調控因素),散度(細胞狀態的穩定性)和RNA雅可比矩陣(Jacobian ,細胞狀態依賴的調控網絡)
  • 各種下游差異分析發現的關鍵的調節器/效應器,並在關鍵的命運決策點可視化調節網絡

在相同的轉錄本羣體中區分新的和舊的RNA,常用的方法依賴於RNA代謝標記,利用外源性核苷類似物,如4-硫嘌呤(4sU)和標記RNA的生化富集。儘管這些方法對RNA動力學調控有重要的見解,但它們需要充足的起始材料,並對富集足夠的細胞信號提出了挑戰。最近發展了幾種方法將4sU化學轉化爲胞嘧啶類似物,產生尿嘧啶-胞嘧啶複合物,在逆轉錄後標記新轉錄的RNA。這些化學方法允許直接測量細胞RNA的時間信息,而不需要生化富集。最近的研究表明,通過將Smart-Seq/plate-based scRNA-Seq與其中一種化學方法(如用於RNA代謝測序的巰基(SH)鏈烷基化)結合,可以在單細胞水平上聯合分析新舊轉錄組。然而,這些基於Smart-Seq/plate的方法存在一些侷限性。首先,它們成本高、耗時長,很難對高度異質性的細胞羣進行大規模分析。其次,這些方法缺乏獨特的分子標識符(UMIs),無法準確定量新的轉錄水平。

爲了克服這些限制,Qi Qiu等開發了scNT-Seq,一種基於UMI的高通量scRNA-Seq方法,結合了代謝RNA標記、液滴微流體和化學誘導的s4U到胞嘧啶模擬物的編碼,同時測量來自同一細胞的新和舊轉錄組。作者證明,scNT-Seq能夠在單細胞水平上對細胞RNA動力學、基因調控網絡(GRN)活性和細胞狀態軌跡進行時間分辨分析,同時它極大地提高了可擴展性並降低了成本。

Dynamo是一個python庫,目前提供了一個完整的解決方案來分析傳統scRNA-seq或基於scRNA-seq的時間代謝標記的動力學分析。它渴望成爲持續集成機器學習、系統生物學、信息論、隨機物理等最激動人心的發展的領先工具,以建模、理解和解釋各種尖端單細胞基因組學技術生成的數據集(dynamo 2/3的開發正在進行中)。我們希望這些模型、理解和解釋不僅能促進你的研究,而且最終可能導致新的生物學發現。

可以在單細胞分辨率下揭示細胞類型特異性TF調節活性的時間動態。

轉錄因子(TF)的調控活性可以通過將順式調控序列與單細胞基因表達聯繫起來,以單細胞分辨率進行量化。通過scNT-Seq聯合分析新的和舊的轉錄組,可以並行分析由外部刺激誘導的動態調控和與細胞特性相關的穩定調控。通過將單細胞調控網絡推斷和聚類(SCENIC)應用於成對的單細胞新/舊轉錄組。作者鑑定出79個協同調節的TF調控,且至少在一種細胞類型中具有顯著的順式調節基序富集。

最近的研究表明,基因表達的時間導數被稱爲“RNA velocity”,可以通過在scRNA-Seq數據集中區分未剪接(內含子reads)和剪接(外顯子reads)的mrna來估計,並用於告知單個細胞的轉錄狀態如何隨時間(以小時爲尺度)變化。我們首先檢驗了RNA velocity分析是否能夠預測單個細胞在短暫(分鐘)和持續(小時)神經元激活時的轉錄狀態軌跡。因爲代謝標記可以捕捉RNA水平的快速變化,而通過3 '標記的UMIs檢測新的RNA在很大程度上獨立於基因結構,我們推斷,從scNT-Seq中對新RNA和總RNA的單細胞配對測量可以用來計算按標記時間(單位時間的分子)縮放的基於代謝標記的RNA velocity。作者根據富集靶基因的新轉錄RNA水平計算這些活性調節轉錄因子在每個細胞中的調控活性。通過將這些轉錄因子的調控活性投射到RNA velocity 流上,我們構建了一個針對不同類別轉錄因子的單細胞分辨率、時間分辨率的調控活性圖譜。

通過將TimeLapse化學與高通量液滴微流體平臺相結合,scNT-Seq能夠共同分析同一細胞的新合成和已存在的轉錄組,在單細胞水平捕獲mRNA的時間信息。傳統的RNA速度分析使用內源性RNA剪接動力學來告知細胞的未來軌跡。因此,它受到RNA剪接時間不受控制和許多基因內含子reads稀少性的限制。由於代謝標記週期的時間和長度可以通過實驗控制,在scNT-Seq中通過3 '標記的UMIs直接計數新的和舊的轉錄本,提供了一種無偏性的方法來計算所有可檢測基因的RNA動力學參數。

使用計算模型明確地結合了基於代謝標記的單細胞測序,我們可以計算高度動態過程(數分鐘或者數小時間)的時間分辨RNA速度。此外,在外部刺激或細胞狀態轉變期間,測量與TF相連接的靶基因的新RNA水平可以在單細胞水平上刻畫TF調節活性。最後,通過脈衝追蹤實驗,scNT-Seq可以更準確地估計RNA動力學參數,揭示RNA調控策略在罕見細胞羣體。

https://jef.works/blog/2020/01/14/rna_velocity_analysis_tutorial_tips/
https://www.kallistobus.tools/velocity_tutorial
https://velocyto.org/velocyto.py/index.html
https://pypi.org/project/scvelo/
https://dynamo-release.readthedocs.io/en/latest/index.html
https://github.com/wulabupenn/scNT-seq/tree/master/TC_calling
https://zhuanlan.zhihu.com/p/359100974
https://www.global-sci.org/intro/article_detail/csiam-am/18653.html
https://www.biorxiv.org/content/10.1101/2020.09.19.304584v1.full
https://zhuanlan.zhihu.com/p/351104418
RNA velocity, methods
La Manno et al (2018, Nature) [ steady-state model ] Implemented in velocyto
Bergen et al (2019, bioRxiv) [ dynamical model ] Implemented in scVelo
Soneson et al (2020 bioRxiv) finds that “preprocessing choices affect RNA velocity”
Velociraptor from Rue / Lun / Soneson uses basilisk to embed scVelo in R/Bioc:
https://github.com/kevinrue/velociraptor Works great !

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章