概率論由三大部分組成:概率圖模型的表示、概率圖模型的推理、概率圖模型的學習。
概率圖模型的表示索要解決的核心問題就是建模問題。而建模這個概率圖模型需要概率論與圖論的基礎知識,所以在開始之前需要先了解一下概率論與圖論的基礎知識。
概率論
我們所生活的環境中存在兩類現象,一類現象是確定性的現象,比如太陽每天都會從東方升起,另一類是隨機現象,比如明天是否會下雨?這明顯是一個概率問題。
隨機現象的定義可表示爲:在一定的條件下,並不總出現相同結果的現象。隨機現象一般會表現出一種規律,而這種規律在數學上我們一般稱之爲分佈,也是一種統計規律性。也即是按照一種概率分佈所產生出來的一種結果。而拿到一個事件的分佈最經典的方法就是採樣,隨機試驗的每一個可能結果稱爲樣本點,所有的樣本點構成樣本空間 Ω。
- 隨機事件:某些樣本點組成的集合, 常用 A 、 B 、 C…表示。
- 隨機變量:表示隨機現象結果的變量,常用大寫字母 X 、 Y 、 Z …表示。
- 事件間的關係:
- 包含關係: A⊂B,表示的是A發生必然導致B發生。
- 相等關係:A=B 能夠推出 A⊂B且B⊂A。
- 互不相容:A和B不可能同時發生。
- 事件的運算
- 並:A∪B表示的是A與B至少有一發生。
- 交:A∩B=AB表示的是A與B同時發生
- 差:A−B A發生但B不發生。
- 對立:Aˉ表示的是A不發生。
樣本空間的分割
如果A1,A2,⋯,An滿足以下兩個條件:1. Ai間互不相容;2. A1∪A2∪⋯An=Ω。則稱A1,A2,⋯,An爲Ω的一組分割。比如擲骰子,樣本空間的一組分割爲 Ω={1,2,3,4,5,6}。
概率的定義
概率的定義可以分爲以下三個方面:1. 概率的直觀定義:事件A出現的可能性大小。2. 概率的統計定義:事件A 在大量重複試驗下,出現的頻率的穩定值稱爲該事件的概率。3. 概率的公理化定義:a. 非負性公理:P(A)≥0;b. 正則性公理: P(Ω)=1; c. 可列可加性公理:若A1,A2,⋯,An互不相容,則P(⋃i=1∞Ai)=∑i=1∞P(Ai)。
條件概率的定義
定義:對於事件A、B,若P(B)>0,則稱P(A∣B)=P(AB)/P(B)爲在B出現的條件下,A 出現的條件概率。
示例:10個產品中有7個正品、3個次品,從中 不放回地抽取兩個, 已知第一個取到次品, 求第二個又取到次品的概率。
設A={第一個取到次品},B={第二個取到次品}:
P(AB)=(3/10)∗(2/9)=1/15
P(B∣A)=P(AB)/P(A)=(1/15)/(3/10)=2/9
條件概率有三大公式:乘法公式、全概率公式、貝葉斯公式。
1. 乘法公式:
- 若P(B)>0,則P(AB)=P(B)P(A∣B);
- 若P(A)>0,則P(AB)=P(A)P(B∣A);
- 若P(A1A2⋯An−1)>0,則P(A1A2⋯An)=P(A1)P(A2∣A1)⋯P(An∣A1A2⋯An−1)。
2. 全概率公式:
全概率公式說地是:若事件B1,B2,⋯,Bn是樣本空間Ω的一組分割,且P(Bi)>0,則:
P(A)=i=1∑nP(ABi)=i=1∑nP(Bi)P(A∣Bi)
當直接計算P(A)較困難,將事情A分解成幾個小事情,通過求小事情的概率,然後相加從而求得事情A的概率。找事情B的樣本空間的一組分割,將事情A表示爲:
A=AB1+AB2⋯+ABi+⋯+ABn
3. 貝葉斯公式:
若事件B1,B2,⋯,Bn是樣本空間Ω的一組分割,且P(A)>0,P(Bi)>0,則:
P(Bi∣A)=P(A)P(ABi)=P(A)P(Bi)P(A∣Bi)=∑j=1nP(Bj)P(A∣Bj)P(Bi)P(A∣Bi),i=1,2,…,n
其中P(Bi)爲先驗概率,P(Bi∣A)爲後驗概率。
獨立性
事件的獨立性:對於兩事件,若其中任何一個事件的發生不影響另一個事件的發生,則這兩事件是獨立的。數學語言描述如下形式:
⇔P(A∣B)=P(A)⇔P(AB)/P(B)=P(A)⇔P(AB)=P(A)P(B)
其最終的獨立性定義爲:若事情A與B滿足:P(AB)=P(A)P(B),則稱A與B相互獨立。
條件獨立性
定義(條件獨立性):在給定 C 的條件下,若事件 A 與 B 滿足 P(AB∣C)=P(A∣C)P(B∣C), 則 稱 A 與 B 在給定 C 的條件下相互獨立。
舉個例子,比如說一般情況下,熬夜會增加賴牀 的概率,賴牀會增加遲到的概率。但是在已經賴牀的條件下,熬夜和遲到發生的概率就無關了。即在給定C的條件下,事情A與B條件獨立。再或者說:一 般情況下,試題難度會影響考試成績,考試成績的高低會影響老師是否會給推薦信。在已知考試成績的條件下,試題難度和是否能獲取導師推薦信無關。即在給定G 的條件下, 事件D 與 L 條件獨立。
概率圖模型常用的三個概念
聯合概率分佈(joint distribution function
) 亦稱多維分佈函數:p(x)=p(x1,x2,⋯,xN)。其定義如下:
設(X,Y)是二維隨機變量,對於任意實數x,y,二元函數:F(x,y) = P(X<=x)交(Y<=y) =>P(X<=x,Y<=y) 。稱爲:二維隨機變量(X,Y)的分佈函數,或稱爲隨機變量X和Y的聯合分佈函數。
邊緣概率 關於其中一個特定變量的邊緣分佈,則爲給定其他變量的條件概率分佈。邊緣概率是與聯合概率對應的,P(X=a)或P(Y=b),這類僅與單個隨機變量有關的概率稱爲邊緣概率:p(xα)=∑x/xσp(x)。
最大後驗概率狀態(Maximum a posterior,MAP
)最大後驗估計是根據經驗數據獲得對難以觀察的量的點估計。與最大似然估計類似,最大區別是,最大後驗估計的融入了要估計量的先驗分佈在其中。故最大後驗估計可以看做規則化的最大似然估計 。數學表示爲: x∗=argmaxx∈Xp(X)。
圖論基礎
圖定義:由“節點”組成的抽象網絡,網絡中的各節點通過“邊”實現彼此的連接。也就是說圖有兩個要素,節點和邊。節點:表示事物、對象或隨機變量;邊:表示隨機變量間的關係。依據邊是否有方向可以分爲有向圖與無向圖。
&emsp除此之外還有一個圖稱之爲樹狀圖:不包含圈的圖稱爲無圈圖(acyclic graph),連通的無圈圖稱爲樹(tree)。其中包含兩個要素:1. 連通的;2. 中不包含圈。
我的微信公衆號名稱:深度學習先進智能決策
微信公衆號ID:MultiAgent1024
公衆號介紹:主要研究深度學習、強化學習、機器博弈等相關內容!期待您的關注,歡迎一起學習交流進步!