貝葉斯網絡(概率圖模型)

原創

2020-06-16 08:47

概率圖模型分爲貝葉斯網絡和馬爾可夫兩大類。其中貝葉斯網絡是一個有向無環圖結構，而馬爾可夫是一個無向圖結構。本文只講解貝葉斯網絡，馬爾可夫會在後面的博客進行講解。

在開始之前需要複習下概率論的一些公式：

乘法法則： $P(x_{1},x_{2}) = P(x_{1}|x_{2})P(x_{2})=P(x_{2}|x_{1})P(x_{1})$

鏈式法則： $P(x_{1},x_{2},...,x_{n})= \prod_{i=1}^{n}P(x_{i}|x_{1},x_{2},...,x_{i-1})$

放個例子幫助理解鏈式法則，當n=4時，上面的例子爲：

$P(x_{1},x_{2},x_{3},x_{4})=P(x_{1})P(x_{2}|x_{1})P(x_{3}|x_{1},x_{2})P(x_{4}|x_{1},x_{2},x_{3})$

證明，根據乘法法則有:

$P(x_{1},x_{2},x_{3},x_{4})=P(x_{4}|x_{1},x_{2},x_{3})P(x_{1},x_{2},x_{3})$

$P(x_{1},x_{2},x_{3})=P(x_{3}|x_{1},x_{2})P(x_{1},x_{2})$

$P(x_{1},x_{2}) = P(x_{2}|x_{1})P(x_{1})$

所以由上面3個式子，可推出:

$P(x_{1},x_{2},x_{3},x_{4})=P(x_{1})P(x_{2}|x_{1})P(x_{3}|x_{1},x_{2})P(x_{4}|x_{1},x_{2},x_{3})$

另外，還有一個有向圖的因子分解公式：

$P(x_{1},x_{2},...,x_{n})= \prod_{i=1}^{n}P(x_{i}|x_{pa(i)})$

其中， $x_{pa(i)}$ 爲 $x_{i}$ 的父親集合

貝葉斯網絡的結構形式一般可以大統的分爲三種，下面一一對他們進行解剖：

（1）tail-tail（看中間節點c的兩條邊）邊的頭和尾是這樣看： tail(尾)→head(頭)，因爲節點c都是連接兩條邊的tail，所以是tail-tail

若c被觀測，則a與b獨立，即 $a\perp b\mid c$ ,證明如下：

首先上圖結構根據因子分解爲：

上圖結構根據鏈式法則又可寫成：

$\tag{2}$

由(1)=(2) 推出，所以a與b獨立： $a\perp b\mid c$

總結tail-tail結構：若c被觀測，則路徑被堵塞，a與b獨立。

(2)head-tail結構：

若c被觀測，則a與b獨立，即 $a\perp b\mid c$ ,證明如下：

因子分解爲：

鏈式法則：

由式(3)=(4) 推出，所以a與b獨立： $a\perp b\mid c$

總結head-tail結構：若c被觀測，則路徑被堵塞，a與b獨立。

(2)head-head結構：

這個head-head結構和上面兩個結構剛好相反，默認情況下，a與b是獨立的，若c被觀察，則a與b不獨立，證明如下：

因子分解：

鏈式法則：

由式(5)=(6) 推出，所以a與b獨立： $a\perp b$

總結head-head結構：默認情況下，a與b是獨立的，路徑是阻塞的，若c被觀測，則路徑是通的，a與b不獨立。

（head-head這個結構可以這樣理解，把c看成父母a與b的孩子，若c沒生出來，a與b是獨立的，是沒有關係的，若c生了出來，則a與b就有關係了，不是獨立的）