因果推斷(Causal Inference)概要

在這裏插入圖片描述
(隨便配的圖,其實佛教的因果和我們這裏的因果還不太一樣的。。。)

這裏簡單談一下因果學習相關的一些最爲基礎的東西。

首先,所謂因果性與相關性不同,相關性指的是如果我們觀測到了一個變量X的分佈,就能推斷出另一個變量Y的分佈的話,那麼說明X和Y是有相關性的。而因果性則強調,如果我們操作了某個變量X,而這種操作(manipulate)引起了Y變量的變化的話,那麼我們才能說明X是Y的cause,而Y是X的effect,這是因果學習的基本出發點,我們要找的是這樣的因果關係,而不是簡單的相關關係。

因果性與相關性的不同,舉一個簡單的栗子:比如我們可以通過統計數據發現,一個學校的學生的成績和其是否戴眼鏡有很強的正相關的關係。相關性可以用這樣的統計數據直接看出來,但是因果性還沒有確定。人們如果誤將相關性的變量認爲成了因果性的變量的話,就會通過給學生戴上眼鏡的方式來提高他們的成績。這是很荒謬的,原因就在於這是一個manipulate,這種manipulate需要的是因果性,而不是簡單的統計相關性。我們根據經驗知道,成績好和戴眼鏡背後都有一個common cause,那就是讀書時間長。類似的錯誤並不少見,再舉一個日常的例子,這個栗子相對於前面的例子可能有些不太明顯:有人發現喝名貴葡萄酒的人壽命更長,所以提出通過每天飲用一點這種葡萄酒來養生。這個操作和前面說的戴眼鏡的操作比起來,看上去似乎合理的多,現實中也確實是很多人覺得適量飲酒可以養生。但是這個仍然是一個沒有區分相關和因果的情況。在這種情況下,經常喝名酒與壽命長也有共同的原因:那就是這個人很可能社會階層較高,生活較爲富足,因此能經常喝紅酒,並且可以享受最好的醫療條件。這樣看來,因果性有時候在做判斷和決策的意義上可能比統計相關性更加有意義。

如果要按照定義來找因果關係,那麼應該通過做實驗,控制變量,改變某一個變量X,然後觀察另一個變量Y是否跟着改變。但是實際上很多情況下我們只有大量的統計數據,而非實驗結果,而且,有些情景我們也無法做實驗,比如有違反科學倫理的內容,或者由於客觀條件不可能開展實驗的,比如宏觀經濟現象我們就無法通過實驗來證明,只能通過已有的數據來進行分析。那麼,如何從各個變量的數據集中找到他們的因果關係,就是因果推斷的基本內容。

因果推斷實際上是學習一個(graph),就是圖論裏的那個圖。變量作爲頂點vertices,是否有因果關係爲邊edge,這是一個無環圖,但是也沒有方向。換句話說,我們知道A和B有因果關係,但是究竟是A導致B還是B導致A,我們不知道。這樣組成的因果網絡一般叫做一個Markovian equivalence,也就是馬爾科夫等價。既然是等價,也就說明這個無向圖加上方向後的這些有向無環圖(DAG)都是Markov等價的。

對圖的結構,或者說骨架的學習,得到一個無向圖。然後在對每條邊確定方向。最終,我們得到的DAG,就可以表示這些變量之間的因果關係。這就是因果推斷的基本流程。

在因果推斷中,也有數學模型來表示因果關係。比如ANM模型,就是加性噪音模型,它把原因X和結果Y建模成:

Y=f(X)+N Y = f(X) + N

也就是說,原因和結果之間又一個映射,並加上一定噪聲。這裏我們認爲X和噪聲N是不相關的。那麼,反過來,如果用

X=g(Y)+NX = g(Y)+N'

來表示兩者關係,那麼Y和N’就不如X和N那麼獨立。這就產生了一個不等性質。利用這個不等性質,就可以通過各種手段把方向確定下來。

對於實際數據,通常分成continuous和discrete來研究。對不同的數據類型,也有不同的方法被提出。

後面的幾篇主要集中在ANM模型相關,以及離散數據類型的causal inference。

2019年03月12日22:41:50

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章