空間轉錄組如何尋找感興趣區域(ROI)

有過計算機視覺和影像組學數據分析經驗的朋友,對感興趣區域(region of interest,ROI)不會感到陌生。感興趣區域就像它的字面意思一樣直白,哪些區域您比較感興趣?空間表達數據也允許我們在空間信息中找出這個ROI了。那麼,在我們空間表達數據中的ROI是什麼,有什麼意義,如何確定?確定之後如何分析?這些有意思的議題,我們會在這篇文章中探討。

什麼是ROI

在機器視覺、圖像處理中,從被處理的圖像以方框、圓、橢圓、不規則多邊形等方式勾勒出需要處理的區域,稱爲感興趣區域,ROI。在Halcon、OpenCV、Matlab等機器視覺軟件上常用到各種算子(Operator)和函數來求得感興趣區域ROI,並進行圖像的下一步處理。這像我們在拿到分羣或者富集結果之後說的【您感興趣的亞羣或你關注的通路】是一個意思,就是在一個切片上,哪個區域是您比較感興趣的?沒有無緣無故的興趣,這個區域往往更接近我們的研究目的。而ROI的目的論本身,也反映了在選定之前它不是一個恆定的區域,如在第一階段不是ROI的區域,下一階段可能又是ROI了。所以它是注意力聚焦的一種,雖然我們希望在空間上看到異質性,但是有時候爲了應用特定的模型不得不需要一個相對均一的背景。在我們單細胞轉錄組中,ROI可能是:

  • 空間上的某亞羣
  • 亞羣的邊界區域
  • 某基因(集)集中表達的區域
  • 軌跡及其沿途區域
  • H&E(或熒光) 有特徵的區域
如何尋找感興趣區域(ROI)

基於以上可能,我們利用現有的知識儲備,可以尋找ROI的方法有:

  • 聚類:找出亞羣,根據定義ROI一定是某個區域
  • 差異分析或空間高變基因:某基因(集)集中表達的區域
  • 通路富集:某通路的基因(集)集中表達的區域
  • 圖像特徵:也就是計算機視覺上的ROI,如可以用imageJ來手動劃定區域。
  • 空間關係:其實空間上劃分出來的區域就是ROI字面意思所定義的。

我們不無驚喜也不無悲傷地看到:尋找感興趣區域並不是難事,難的是尋找興趣。我們不禁要問:我們的興趣在哪,是空間上的一片區域嗎?這只是形式,我們感興趣的是這片區域的特徵(features)。不難發現所有識別ROI的方法都是在尋找某個特徵的集合,所以ROI除了字面意思之外,還有特徵選擇的意思。故此,當我們談ROI的時候我們談的是對特徵的選擇。而興趣是和期望聯繫在一起的:與期望相符或相悖都會引發人類的興趣,比如你看到某些基因就是在右下角某區域表達,而之前的認爲是他們應該均勻表達的,好奇心重的人就會產生一種叫做興趣的東西。所謂格物致知,首先要有對物的格纔有知。

尋找出ROI之後

尋找ROI只是手段,不是目的,我們的目的是發現有可解釋的生物學規律。當然,我們歡迎做計算機視覺的朋友來幫扶我們更好地尋找ROI,讓邊緣更加清晰,讓區域的特徵更加明顯。如現在有一種技術叫感興趣區域池化(Region of interest pooling,RoI pooling),我覺得把空間上基因表達作爲特徵(相當於一個像素點下有近兩萬個基因表達),RoI pooling 可以提供一種手段來訓練出目標特徵(班門弄斧了啊)。目前的做法是先找區域(分羣)再賦予羣的意義,爲什麼不能先有意義再尋找區域呢?

往大了說,其實一個切片本身就是一個ROI,不感興趣誰花大貴价錢做空轉呢?

這裏我們舉一個例子來說明尋找出ROI之後如何與傳統的分析工具結合到一起。ROI與另一個ROI的差異分析當然可以的,但是略顯單薄。現在我們選定了一個ROI,這個ROI特異性表達500個基因,那麼這些基因有什麼特點?聰明的,你已經意識到可以做WGCNA。之前拿那麼多基因一起做WGCNA,其實它們在空間上根本就沒有共表達(就是有的在右上角有的在左下角表達),這樣找出來的模塊在空間上可以得到印證嗎?至少,RIO和WGCNA是可以結合的吧。目前還沒有人用基因的WGCNA尋找空間高變基因。


https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2555436/
https://github.com/edsgard/trendsceek
Identification of spatial expression trends in single-cell gene expression data
Region of interest analysis for fMRI

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章