概率圖模型分爲貝葉斯網絡和馬爾可夫兩大類。其中貝葉斯網絡是一個有向無環圖結構,而馬爾可夫是一個無向圖結構。本文只講解貝葉斯網絡,馬爾可夫會在後面的博客進行講解。
在開始之前需要複習下概率論的一些公式:
乘法法則:
鏈式法則:
放個例子幫助理解鏈式法則,當n=4時,上面的例子爲:
證明,根據乘法法則有:
所以由上面3個式子,可推出:
另外,還有一個有向圖的因子分解公式:
其中,爲的父親集合
貝葉斯網絡的結構形式一般可以大統的分爲三種,下面一一對他們進行解剖:
(1)tail-tail(看中間節點c的兩條邊)邊的頭和尾是這樣看: tail(尾)→head(頭),因爲節點c都是連接兩條邊的tail,所以是tail-tail
若c被觀測,則a與b獨立,即,證明如下:
首先上圖結構根據因子分解爲:
上圖結構根據鏈式法則又可寫成:
由(1)=(2) 推出 , 所以a與b獨立:
總結tail-tail結構:若c被觀測,則路徑被堵塞,a與b獨立。
(2)head-tail結構:
若c被觀測,則a與b獨立,即,證明如下:
因子分解爲:
鏈式法則:
由式(3)=(4) 推出 , 所以a與b獨立:
總結head-tail結構:若c被觀測,則路徑被堵塞,a與b獨立。
(2)head-head結構:
這個head-head結構和上面兩個結構剛好相反,默認情況下,a與b是獨立的,若c被觀察,則a與b不獨立,證明如下:
因子分解:
鏈式法則:
由式(5)=(6) 推出 , 所以a與b獨立:
總結head-head結構:默認情況下,a與b是獨立的,路徑是阻塞的,若c被觀測,則路徑是通的,a與b不獨立。
(head-head這個結構可以這樣理解,把c看成父母a與b的孩子,若c沒生出來,a與b是獨立的,是沒有關係的,若c生了出來,則a與b就有關係了,不是獨立的)