單細胞時代 || 細胞身份概念的演變

The evolving concept of cell identity in the single cell era

隨着單細胞技術的廣泛應用,我們正在從對細胞身份(cell identity)的模糊定義轉向建立定量的、高分辨率的細胞圖譜。然而,精確定義細胞特性仍然是一個挑戰,這導致圍繞這一概念展開新一輪的爭論。在這裏,我們提出三個核心概念,來刻畫細胞身份,他們是:

  • 表型(phenotype)
  • 譜系(lineage )
  • 狀態(state)

我們探索新興技術,使這些屬性系統客觀的量化,並概述這些技術將如何使構建的高分辨率的細胞身份景觀以及可能揭示其潛在的分子調控機制,當然也提供了對細胞身份新的理解和操縱細胞命運(cell fate)的機會。

幾個世紀以來,生物學家一直試圖解構生物系統的複雜性,方法是將它們分解爲其組成部分——細胞——並根據它們的身份將細胞分類,建立一種細胞分類法,進而形成細胞生物學。然而細胞身份或細胞類型( cell type)的概念仍然沒有明確的定義。在歷史上,細胞是根據形態、位置、個體發生和與其他細胞類型的相互作用等特徵來分類的。隨着時間的推移,新的測定方法被開發出來,用以測量細胞的生理功能,這些與分子生物學的進步相結合,使得基因和蛋白質表達的量化成爲可能,如你所見,也使得更細微的細胞類型分類成爲可能。

從根本上說,目前還沒有一種通用的方法來準確地定義細胞的身份。在細胞身份完全未知的生物體(如稀有物種)中,這顯然阻礙了細胞類型分類。因此,儘管一些細胞圖譜建設的努力正在進行中,這些努力重新點燃了關於如何有效和準確地組織細胞身份的爭論,揭示了在這個主題上的許多不同觀點。在這裏,我們利用新的和已建立的概念來合成一個由三個支柱組成的框架(圖1),我們認爲這是細胞同一性概念的核心:

  • 1)表型(和功能)——是細胞同一性定義的一箇中心支柱,它定義了廣泛的物理、分子和功能特徵,這些特徵可以被捕獲和分析,從而實現系統和無偏見的細胞類型分類。

  • )譜系——爲了充分描述細胞的特性,瞭解不同細胞類型之間的譜系關係和它們的起源也是很有價值的。追蹤細胞身份的發育起源可以建立一個細胞分類,使相似的細胞類型被歸類在一起,可能有助於鑑定新的細胞物種。

  • 3)狀態-細胞身份穩定,然而,在不同的刺激下,相同的細胞類型可以表現出一系列不同的表型(狀態)。通過對與給定細胞類型關聯的細胞狀態進行管理,可以將標識與狀態區分開來。

此外,繪製細胞狀態景觀爲識別細胞何時走出正常生理界限進入病理狀態奠定了基礎。綜合考慮這三個支柱可以構建高分辨率、動態的細胞標識景觀,潛在地爲理解和操縱細胞命運提供了新的機會。

表型和功能:細胞特徵的高分辨率快照,以表徵身份

細胞表型的特性是定義細胞身份的核心,代表了生物學家長期關注的焦點。在17世紀,在光學顯微鏡的幫助下,Robert Hooke最初描述了組成軟木樣品的細胞。一百年後,第一個使用洋紅、銀、蘇木精和伊紅的組織學染色出現了,因此可以進行相對詳細的細胞學觀察。大約在這個時候,拉蒙·卡哈爾使用高爾基銀染色法來描述神經元,爲神經系統不是連續的纖維提供了證據,而是由單個單元,即神經元組成。由於這些早期發現,細胞可視化使用越來越複雜的顯微鏡和成像技術一直是細胞類型鑑定的中心。通過探測細胞的形狀、大小、位置和與其他細胞類型的相互作用等關鍵特徵,可以將細胞分爲不同的類別。隨着分子生物學的進步,我們有能力對細胞進行染色,以獲得特定的身份標記(markers of identity)。最終,不同的細胞類型可以用熒光標記,如GFP,使得對整個生物系統內細胞表型的詳細研究成爲可能。

基於成像的表型評估,以及其他已建立的技術,如流式細胞術,提供了在單個細胞的基礎上高分辨率的信息捕獲。此外,這些分析可以部署在完整的細胞和生物體中,使細胞功能得以探測。然而,這些分析產生的信息是相對低維度的,即相對較少的表型特徵捕獲從許多細胞。此外,這些特徵的選擇往往受到所研究生物系統先驗知識的驅動,顯然限制了對細胞特性的評估,並可能造成偏差。相反,RNA和蛋白質丰度全基因組分析的方法支持更廣泛和更客觀的計數。事實上,用於定義細胞類型的分子特徵數量的增加使得僅基於基因表達的細胞特性評估變得更加系統和公正。然而,這些方法依賴於混合細胞羣的分析(BULK),混合來自不同亞羣的信號,完全掩蓋罕見的細胞種類,限制了細胞類型識別的精度。

最近發展的單細胞技術已經填補了單個細胞的詳細研究和細胞羣體的 bulk 研究之間的差距。這些方法能夠捕獲成千上萬的特徵,而不需要實驗上的細胞富集,因此生成了存在於任何給定組織內的細胞表型範圍的嚴格和無偏見的圖譜,包括遺傳學、表觀遺傳學和蛋白質組分析在內的一整套技術。雖然早期需要分離細胞的迭代相對低吞吐量和昂貴,但最近發展的基於微流體的技術已經在細胞捕獲率方面帶來了巨大的收益。目前,池和分裂的(pool-and-split )細胞標記策略正在產生更大的細胞捕獲率和進一步降低成本。

scRNA-seq提供了相對高維的數據集,包含了橫跨數千個獨立細胞的數千個測量值。基於降維的計算工具試圖降低這種複雜性,基於轉錄相似性對細胞進行聚類,並使其在二維空間內可視化。這裏需要注意的是,聚類特異性基因表達是用來推斷細胞類型的,代表了必須通過正交驗證的身份的初步預測。scRNA-seq的一個關鍵限制是,它需要破壞組織和細胞,導致丟失對細胞類型識別有價值的空間信息。保持這種空間信息是最近新單細胞技術的一個焦點。例如,多路原位雜交和測序技術已經使測量完整組織內亞細胞空間分辨率的基因表達成爲可能。雖然這些方法最初需要預先選擇用於分析的基因,但現在可以捕獲數千個轉錄本(Eng等人,2019年)甚至全基因組基因表達的信息。

總的來說,這些技術是特別有前途的,提供了許多細胞原位的高分辨率可視化,從而允許基於表型對細胞身份進行強大的預測。

細胞功能:細胞身份的基本真相

最終,細胞身份最好由功能來定義。研究細胞功能的一種有效方法是先從物理上消除細胞,然後觀察對生物體的任何生理或行爲影響。例如,激光消融了秀麗隱杆線蟲神經元的一個特定子集,揭示了它們在運動中的作用。另外,如果一種細胞類型僅通過表達一種特定基因來標記,則可以通過靶向表達一種毒素基因來選擇性地殺死胰腺腺泡細胞來實現遺傳消融。雖然在方法上是優雅的,但如果細胞不能被物理查看或沒有標記出獨家基因表達,消融實驗是有限的。例如,在評估人類細胞功能方面,消融實驗顯然是不可行的。在這些更有限的情況下,細胞可以分離,並在體外或異種移植模型中測試其功能。這些方法通過單細胞技術得以實現,單細胞技術可以在蛋白質組水平上識別新的細胞表面標記組合,從而使流式細胞儀能夠捕獲新的細胞物種並對其進行功能評估。然而,分配細胞功能到一個以前未描述的細胞類型將需要部署一個棘手的分析框架。此外,如果培養條件不優化,分離的細胞往往會很快失去其表型和功能,體外培養的肝細胞的去分化就是例證。因此,我們如何開始探索新的細胞類型的功能?

基於功能測定來驗證細胞身份是不切實際的,那麼預測細胞功能有可能嗎?基因本體論是一種常用的基於基因表達模式預測細胞功能和行爲的方法。然而,這種方法通常返回模糊的註釋,因爲基因表達不能直接轉化爲細胞功能。考慮到蛋白質是細胞功能的關鍵效應因子,測量蛋白質丰度可能是一個更準確的預測因子。事實上,機器學習方法已經被用於基於組織特異性蛋白的功能來推斷細胞功能。爲了提高這些預測,定量蛋白質定位和蛋白質丰度(例如,通過空間蛋白質組學)無疑將被證明是有益的。在此背景下,基於免疫染色對56個人類細胞系的12003個蛋白構建的蛋白質表達高分辨率細胞圖譜是非常有價值的。同樣有前景的是機器學習算法,它可以僅基於光學顯微鏡圖像來預測細胞中的蛋白質表達和定位。事實上,更廣泛地應用機器學習來編織更全面的細胞表型圖,可能有助於推斷細胞功能和對細胞身份進行分類(Smith et al., 2018)。然而,在可能的情況下,這些預測方法最終必須得到實驗證據的支持。

譜系:新的追蹤技術揭示了細胞的起源

到目前爲止,我已經討論了一些可用於測量細胞表型和功能的關鍵工具,以及它們如何用於定義細胞特性。考慮這樣一種情況,這些測量的組合揭示了以前未描述的新細胞類型。用預測工具給這種新細胞分配一些功能是可能的,理想情況下可以通過實驗來證實。儘管如此,要完全理解細胞標識,就必須將其放在所有其他細胞類型的上下文中,以細胞分類。從動態平衡狀態下的成年生物體快照構建這樣一種細胞身份分類是具有挑戰性的,特別是在目前數據集稀少的情況下,我們仍在努力以一種有意義的方式最好地整合它們。相反,瞭解細胞身份的起源及其發育譜系,是一種強大而簡單的方法,可以在一個複雜得多的層次結構中定位細胞。至少,新的細胞種類可以和它最近的親戚聯繫起來,從而爲它在生物體中的作用提供進一步的線索。那麼,僅僅發育起源就能提供足夠的信息來定義細胞身份嗎?

譜系溯源,即鑑定來自單個細胞的所有後代,起源於惠特曼對無脊椎動物胚胎中細胞分裂和最終細胞命運的光學顯微鏡研究。在這些早期研究的基礎上,秀麗隱杆線蟲被證明是一種特別強大的譜系追蹤模型,因爲它的成像能力、相對較少的體細胞數量和不變性的細胞譜系。事實上,通過非侵入性的實時成像技術,已經爲秀麗隱杆線蟲胚胎中的每個細胞構建了完整的譜系樹,記錄了細胞是如何隨着發育的進展而潛能下降和專門化增加的。

隨着測序技術的發展,繪製直系祖先和未來細胞命運關係圖的新方法已經出現。這源於基於DNA的條形碼方法,在這種方法中,細胞被隨機遺傳DNA序列標記(Lu等人,2011年),後來發展爲轉錄條形碼,允許克隆關係和細胞身份被並行讀取。這些早期的方法使克隆分析成爲可能,也就是說,一個有祖先標記的創始者細胞的所有後代都可以通過遺傳其完整的條形碼來識別。然而,克隆後代之間的譜系關係不能用這些技術來繪製。新的單細胞追蹤方法正在出現,以填補這一空白。例如,用轉錄的條形碼進行連續的標記可以構建譜系樹。在另一種方法中,利用基於CRISPR/ cas9的基因組編輯將可變基因標籤引入單個細胞。還有一種方法,基於轉座子的TracerSeq (Wagner et al., 2018),利用Tol2轉座子酶隨機整合獨特的遺傳標籤到單個細胞基因組中。然後,通過連續的細胞分裂進行異步插入,就可以重建譜系樹。當將TracerSeq應用於斑馬魚的發育時,發現了會聚分化的證據,即無性系不同的胚胎場產生相似的細胞類型(Wagner et al., 2018)。相反,一些與克隆相關的細胞向遠處分化,支持了分化分化的說法。因此,譜系分析並不總是產生預期的樹形結構,即來自不同胚胎來源的細胞可以匯聚在一個相似的身份上。這並不奇怪,因爲經典的秀麗隱杆線蟲譜系追蹤研究表明,不同的譜系可以產生相似的神經元類型(Sulston et al., 1983)。最近,同樣的現象在小鼠發育中被提出,肌細胞由兩個收斂軌跡產生,神經元由幾個軌跡產生(Cao等,2019)。然而,值得注意的是,在小鼠發育的研究中,軌跡是通過計算方法推斷的,而不是基於真實數據。儘管如此,總的來說,我們必須記住這些趨同分化的例子,當考慮在定義細胞身份單獨譜系的效用時。

依靠譜系來促進細胞類型識別的另一個限制是它在人類發展的背景下的部署。在缺乏可用於繪製譜系關係的地面真實數據的情況下,我們如何推斷出有意義且準確的細胞發展層次?追溯譜系追溯是一種相對簡單的實驗策略,利用自然發生的遺傳變異來追溯無性系相關的細胞(Ludwig et al., 2019),但這種方法規模有限,不能生成詳細的譜系樹。作爲一種替代方法,計算方法允許對scRNA-seq數據進行時間重構。然而,最終的軌跡是推斷出來的,依賴於對中間單元狀態的充分捕獲和採樣。這可能是有問題的,特別是在追蹤人類細胞身份的起源時。在這裏,哺乳動物發育的體外模型(Huch和Koo, 2015)可以爲人類發育提供有價值的見解。另一種可能是利用非人類的靈長類模型,進行跨物種比較來推斷譜系(Boroviak等,2018)。

總之,考慮到在人類中追蹤基本真相譜系的機會有限以及上述趨同分化的證據,僅根據譜系來定義細胞身份可能無法提供準確的細胞類型分類。然而,結合譜系與表型和解剖特徵可能是強大的,特別是考慮到空間轉錄組學現在已經準備好通過補充譜系樹的位置信息來生成命運圖。

狀態:相同的身份,不同的狀態

在前幾節中,我探討了細胞表型和功能的高分辨率快照以及細胞譜系如何用於定義細胞身份。細胞身份的第三個基本方面是“狀態”,它可以被描述爲細胞表型的範圍,由一個確定的細胞類型與其環境的相互作用產生。T細胞就是一個典型的例子:這些細胞以不同的激活狀態存在,它們對不同的刺激做出反應,但它們仍然保持着它們的T細胞特性。事實上,細胞身份通常是穩定的,通過身份指定轉錄因子的自動調節來維持。在這方面,細胞身份可以被認爲是“硬佈線”(hard-wired),儘管它是在定義的條件下重新編程。相反,細胞狀態可以被認爲是“軟連接”,其中給定的細胞類型可以存在一系列微妙的不同狀態,這就提出瞭如何爲之前未定義的細胞類型區分細胞標識和狀態的問題。例如,我們如何能確信一個新的轉錄代表一個新的細胞類型,而不是一個未被識別的已知細胞類型?由於細胞轉錄組快速調整以響應環境條件的變化,僅依靠基於scrna序列的技術可能不足以解決這些問題。在這方面,探索細胞身份的遺傳、表觀遺傳特徵(由Ludwig和Bintu在2019年發表)可能提供一個更穩定的細胞類型測量,允許身份從狀態中區分出來。例如,ATAC-seq(利用測序檢測轉座酶可達染色質)提供了染色質可達性的信息,現在可以應用於單細胞分辨率(Cusanovich等人,2018)。理想情況下,“多基因組”測量將從同一個體細胞中收集(Cao等人,2018),揭示與相同表觀遺傳特徵相關的不同轉錄狀態。然而,最終,這些技術只提供了組織內細胞表型的一個“快照”,身份和狀態之間的聯繫很大程度上是推斷出來的,對與給定身份相關的狀態提供了很少的客觀測量。

爲了直接測量細胞狀態,單細胞克隆或譜系圖可用於繪製不同細胞狀態的出現。爲了實現這一點,引入擾動將是必不可少的。例如,最近的一些方法已經採用了混合CRISPR/Cas9基因組編輯,將大量的遺傳擾動引入到細胞羣體中,然後通過scRNA-seq或scac -seq來測量其影響。這種方法可以被修改,使細胞暴露於一系列不同的環境干擾中,例如暴露於不同的細胞因子,在不同條件下跟蹤與克隆相關的細胞的特徵,並將給定的細胞類型推入它們的全部潛在狀態。總之,這將提供反映不同細胞狀態的地面真實數據,這些不同的細胞狀態可能來自於對不同環境線索的響應相同的細胞身份。使用這些方法,我們還可以探索更極端的情況,即細胞被推過它們的邊界,進入不同的身份。在這種情況下,譜系可能有助於區分身份的變化和狀態的戲劇性變化之間的界限。總的來說,對於每一個細胞特性,我們都可以將它與它在特定條件下存在於給定狀態下的概率聯繫起來,從而潛在地揭示了硬連線細胞特性和軟連線細胞狀態背後的分子調控。

視角

在這裏,我概述了細胞身份的三個支柱——表型(和功能)、譜系和狀態——每一個都包含了一套獨特和互補的測量方法,它們可以一起以一種系統和公正的方式來定義細胞身份。這種方法無疑將揭示新的細胞身份,可以放置在一個更大的細胞分類中,爲他們的生理作用提供有價值的線索。由於對體外培養體系的依賴,而體外培養體系並不能完全再現體內的同類體系,因此目前在人類環境中對該框架的全面應用可能存在一定的侷限性。然而,在這方面,繼續努力改進人體組織培養模型將證明是有益的。總之,這三個細胞特性的支柱將支持高分辨率動態細胞圖譜的構建,有望揭示控制細胞特性的分子調控新方面,併爲理解和操縱細胞的命運提供新的機會。這些努力提出了一些有趣的問題:首先,是否存在一個最小的觀察集合,可以用來普遍定義所有細胞類型和生物體的細胞身份?

這就引出了第二個問題:我們需要從細胞中獲取什麼信息才能從細胞的現狀預測它們的過去和未來?這是特別令人興奮的,因爲細胞身份的概率模型的構建可以實現,例如,預測一個細胞的未來疾病狀態,爲疾病進展和診斷提供新的見解。這些問題也與細胞命運重編程領域相關,至少,我們將獲得一個高分辨率模板,以概括主要功能細胞類型的身份。一旦我們積累了關鍵數量的信息,細胞身份的景觀是連續的還是離散的?如果細胞身份確實可以作爲一個連續體存在,這就提供了穩定短暫表型和創造新的細胞身份的機會,賦予已知的細胞類型新的功能。

通過我們對定義細胞身份的不斷努力,我們離實現這些可能性更近了一步。


https://dev.biologists.org/content/146/12/dev169748
https://www.nature.com/articles/s12276-020-0409-x
https://www.annualreviews.org/doi/pdf/10.1146/annurev-immunol-090419-020340

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章