1.樣本空間
定義:樣本空間是一個隨機試驗所有可能結果的集合。比如:投擲一枚硬幣,樣本空間爲:{正面,反面}。隨機試驗中的每個可能結果叫做樣本點。
有些試驗有兩個或者多個的樣本空間,比如:隨機抽取一張撲克,樣本空間可以是數字,可以是花色。這時候,如果要完整描述一張牌,就要使用到笛卡兒積。
χ×y={<x,y>∣x∈χ∧y∈y}(式1)
2.事件和概率
隨機事件或者(簡稱爲事件):是指一個被賦予概率的事物集合,也就是樣本空間中的一個子集。概率是指一個隨機事件發生的可能性大小,介於0和1之間。
2.1 隨機變量
在隨機試驗中,將試驗的結果用X表示,這個X會隨着試驗結果的不同而變化,是樣本點的一個函數。把這個數叫做隨機變量。比如擲骰子:隨機變量X的取值爲{1,2,3,4,5,6}。
一個隨機事件也可以定義多個隨機變量。比如:在擲2個骰子的隨機事件中,可以定義隨機變量X爲獲得點數之和,或者點數之差。分別記爲:X和Y
X(i,j):=i+j,x=2,3,⋯,12(式2)
Y(i,j):=i−j,y=0,1,2,3,4,5(式3)
其中,i,j分別表示兩個骰子的點數。
2.1.1 離散隨機變量
離散隨機變量:如果隨機變量X所有可能取到的值是有限的可以列舉的,有N個有限值:
{x1,⋯,xN}(式4)
這樣一來,我們就把X叫做離散隨機變量。
記每一種可能的取值都有xn的概率,P(X=xn)=p(xn)∀n∈{1,⋯,N}
這裏面的p(x1),⋯,p(xN)稱爲離散隨機變量的概率分佈,或者分佈,滿足:
n=1∑Np(xn)=1p(xn)≥0,∀n∈{1,⋯,N}(式5)
常見的離散隨機變量的概率分佈有:
(1)伯努利分佈:
在一次試驗中,事件A發生的概率爲μ,則不發生的概率爲:1−μ。使用X表示事件A出現的次數,則X取值爲0和1,分佈表示如下:
p(x)=μx(1−μ)(1−x)(式6)
如上分佈叫做伯努利分佈,也叫做兩點分佈或者0-1分佈。
(2)二項分佈:
在n次伯努利試驗中,使用X表示事件A出現的次數,則X取值爲:{0,⋯,N},分佈表示如下:
P(X=k)=CNkμk(1−μ)N−kk=0,⋯,N(式7)
其中,CNk表示二項式係數,表示從N各元素中取出k個元素,且不考慮其順序的組合的總數。
2.1.2 連續隨機變量
和離散型隨機變量相比,不同之處在於:連續隨機變量X的取值是不可列舉的,由全部實數或者由一部分區間組成,比如:
X={x∣a≤x≤b},−∞<a<b<∞(式8)
這樣子就把X稱之爲連續隨機變量 ,連續隨機變量的取值是不可數及無窮盡的。
連續隨機變量X的概率分佈一般使用概率密度函數p(x)來描述,p(x)可積,滿足:
∫−∞∞p(x)dx=1(式9)
常見的連續隨機變量的概率分佈有:
(1)均勻分佈:
若a,b爲有限的數,[a,b]上的均勻分佈的概率密度函數定義如下:
p(x)=⎩⎨⎧b−a1a≤x≤b0x<a或者x>b(式10)
(2)正態分佈:
正態分佈也叫做高斯分佈,應用領域很多,概率密度函數如下:
p(x)=2πσ1exp(−2σ2(x−μ)2)(式11)
其中,σ>0,μ和σ均爲常數。如若,隨機變量X服從一個參數爲$
\mu和\sigma$的概率分佈,則簡記爲:
X∼N(μ,σ2)(式12)
當μ=0,σ=1時,稱爲標準正態分佈。
均勻分佈和正態分佈的圖示如下:
2.1.3 累積分佈函數
對於一個隨機變量X,其累積分佈函數是隨機變量X的取值小於等於x的概率。
cdf(x)=P(X≤x)(式13)
以連續隨機變量X爲例,其累積分佈函數定義如下:
cdf(x)=∫−∞xp(t)dt(式14)
其中,p(x)爲概率密度函數,標準正態分佈和累積分佈的概率密度函數如下:
2.2 隨機向量
隨機向量是指一組隨機變量構成的向量。如:X1,X2,⋯,Xk爲K個隨機變量,那麼稱X=[X1,X2,⋯,Xk]爲一個K維的隨機向量。一維隨機向量稱爲隨機變量。
隨機向量也分爲:離散隨機向量和連續隨機向量。
2.2.1 離散隨機向量
離散隨機向量的聯合概率分佈爲:
P(X1=x1,X2=x2,⋯,XK=xK)=p(x1,x2,⋯,xK)(式15)
其中,xk∈Ωk爲變量Xk的取值,Ωk爲變量Xk的樣本空間。和離散隨機變量類似有:
p(x1,x2,⋯,xK)≥0,∀x1∈Ω1,x2∈Ω2,⋯,xK∈ΩK(式16)
x1∈Ω1∑x2∈Ω2∑⋯xK∈ΩK∑p(x1,x2,⋯,xK)=1(式17)
(1)多項分佈:
多項分佈是常見的離散向量概率分佈,多項分佈是二項分佈在隨機向量的推廣。假設一個袋子中裝了很多球,總共有K個不同的顏色. 我們從袋子中取出N個球. 每次取出一個球時,就在袋子中放入一個同樣顏色的球. 這樣保證同一顏色的球在不同試驗中被取出的概率是相等的. 令X爲一個K維隨機向量,每個元素Xk(k=1,⋯,K)爲取出的N個球中顏色爲k的球的數量,則X服從多項分佈,其概率分佈爲:
p(x1,⋯,xK∣μ)=x1!⋯xK!N!μ1x1⋯μKxK(式18)
多項分佈的概率分佈用gamma函數表示如下:
p(x1,⋯,xK∣μ)=∏kΓ(xk+1)Γ(∑kxk+1)k=1∏Kμkxk(式19)
這種形式表示和狄利克雷分佈類似,狄利克雷分佈可以作爲多項分佈的共軛先驗。
∫0+∞xα−1e−xdx=Γ(α)(式20)
例如:∫0+∞x5e−xdx=Γ(6)。
2.2.2 連續隨機向量
一個K維連續隨機向量X的聯合概率密度函數滿足:
p(x)=p(x1,⋯,xK)≥0(式21)
∫−∞+∞⋯∫−∞+∞p(x1,⋯,xK)dx1⋯dxK=1(式22)
(1)多元正態分佈:
也叫做多元高斯分佈,如若K維隨機向量X=[X1,⋯,XK]T服從K元正態分佈,其密度函數爲:
p(x)=(2π)n/2∣∑∣1/21exp(−21(x−μ)T∑−1(x−μ))(式23)
其中,μ∈RK爲多元正態分佈的均值向量,∑∈RK×K爲多元正態分佈的協方差矩陣,∣∑∣爲行列式。
(2)各項同性高斯分佈:
如果一個多元高斯分佈的協方差矩陣簡化爲∑=σ2I,即每一個維度隨機變量都獨立而且方差相同。那麼這個多元高斯分佈就稱爲:各項同性高斯分佈。
(3)狄利克雷分佈:
一個K維隨機向量X的狄利克雷分佈爲:
p(x∣α)=Γ(α1)⋯Γ(αk)Γ(α0)k=1∏Kxkαk−1(式24)
其中的α=[α1,⋯,αk]T爲狄利克雷分佈的參數。
2.3 邊際分佈
對於二維離散隨機向量(X,Y),假設X取值空間爲Ωx,Y取值空間爲Ωy,則其聯合概率分佈滿足:
p(x,y)≥0,x∈Ωx∑y∈Ωy∑p(x,y)=1(式25)
對於聯合概率分佈p(x,y),分別對x和y進行求和。
(1)對於固定的x:
y∈Ωy∑p(x,y)=p(x)(式26)
(2)對於固定的y:
x∈Ωx∑p(x,y)=p(y)(式27)
由於離散隨機向量(X,Y)的聯合概率分佈,對Y的所有值進行求和得到X的概率分佈,對X的所有值進行求和得到Y的概率分佈.這裏p(x)和p(y)就稱爲p(x,y)的邊際分佈。
對於二維連續隨機向量(X,Y),其邊際分佈爲:
p(x)=∫−∞+∞p(x,y)dy(式28)
p(y)=∫−∞+∞p(x,y)dx(式29)
對於一個二元正態分佈的邊際分佈任然爲正態分佈。
2.4 條件概率分佈
對於離散隨機向量(X,Y),已知X=x的條件下,隨機變量Y=y的條件概率爲:
p(y∣x):=P(Y=y∣X=x)=p(x)p(x,y)(式30)
上式定義了隨機變量Y關於隨機變量X的條件概率分佈,簡稱:條件分佈。
已知x:
p(y∣x)=p(x)p(x,y)(式31)
已知y:
p(x∣y)=p(y)p(x,y)(式32)
2.5 貝葉斯定理
通過(式31)和(式32),兩個條件概率p(x∣y)和p(y∣x)之間的關係爲:
p(y∣x)=p(x)p(x∣y)p(y)(式33)
這個公式就是貝葉斯定理,或者說是貝葉斯公式。
2.6 獨立與條件獨立
對於兩個離散(或者連續)的隨機變量X和Y,如果其聯合概率(或者聯合概率密度函數)滿足:
p(x,y)=p(x)p(y)(式34)
就稱X和Y相互獨立。
對於三個離散(或者連續)隨機變量X,Y和Z,如果條件概率(或者聯合概率密度函數)p(x,y∣z)滿足:
p(x,y∣z)=p(x∣z)p(y∣z)(式35)
則稱,在給定變量Z時,X和Y條件獨立。