AI筆記: 數學基礎之隨機變量及其分佈

隨機變量及其分佈

1 ) 知識圖譜


備註:圖片託管於github,請確保網絡的可訪問性

2 ) 相關概念

  • 隨機變量:如果隨機試驗的結果可以用一個變量來標識,那麼這樣的變量叫做隨機變量。隨機變量常用字母 X,Y,ξ,ηX, Y, \xi, \eta 等表示
  • 離散型隨機變量:對於隨機變量可能取的值,可以按一定次序一一列出,這樣的隨機變量叫做離散型隨機變量.
  • 連續型隨機變量:對於隨機變量可能取的值,可以取某一區間內的一切值,這樣的變量叫做連續型隨機變量.
  • 離散型隨機變量與連續型隨機變量的區別和聯繫:離散型隨機變量與連續型隨機變量都是用變量表示隨機試驗的結果,但是離散型隨機變量的結果可以按一定次序一一列出,而連續型隨機變量的結果不可以一一列出
  • 若X是隨機變量,Y = aX + b (a,b是常數), 則Y也是隨機變量,並且不改變其屬性(離散型,連續型)

3 ) 離散型隨機變量的分佈列

概率分佈(分佈列)

設離散型隨機變量X可能取的不同值爲 x1,x2,...,xi,...,xnx_1, x_2, ..., x_i, ..., x_n,X的每一個值 xix_i (i = 1,2,…,n)的概率 P(X=xi)=piP(X=x_i) = p_i, 則稱下表爲隨機變量X的概率分佈,簡稱X的分佈列

X x1 x2 ... xi ... xn
P p1 p2 ... pi ... pn

性質

  • pi>=0,i=1,2,...,n;p_i >= 0, i = 1,2,...,n;
  • i=1npi=1\sum_{i=1}^n p_i = 1

兩點分佈

如果隨機變量X的分佈列爲下表,則稱X服從兩點分佈,並稱p = P(X=1) 爲成功概率

X 0 1
P 1 - p p

二項分佈

  • 如果一次實驗中某時間發生的概率是p, 那麼在n次獨立重複實驗中這個事件恰好發生k次的概率是 P(X=k)=Cnkpk(1p)nkP(X=k) = C_n^k p^k (1-p)^{n-k}, 其中k=0,1,2,…,n, q = 1-p
  • 於是得到隨機變量X的概率分佈如下
    • X: 0, 1, …, k, …, n
    • P: Cn0p0qn,Cn1p1qn1,...,Cnkpkqnk,...,Cnnpnq0C_n^0 p^0 q^n, C_n^1 p^1 q^{n-1}, ..., C_n^kp^kq^{n-k}, ..., C_n^n p^n q^0
  • 我們稱這樣的隨機變量X服從二項分佈,記爲:X B(n,p)X ~ B(n,p), 並稱 p 爲成功概率
  • 判斷一個隨機變量是否服從二項分佈,關鍵有三點:
    • 對立性: 即一次試驗中事件發生與否二者必居其一
    • 重複性: 即試驗是獨立重複地進行了n次
    • 等概率性: 在每次試驗中事件發生的概率相等
  • 注意:二項分佈的模型是有放回抽樣,二項分佈中的參數是p,k,n

4 ) 離散型隨機變量的均值與方差

離散型隨機變量的均值

  • 一般地,若離散型隨機變量X的分佈列爲
    • X: x1,x2,...,xi,...,xnx_1, x_2, ..., x_i, ..., x_n
    • P: p1,p2,...,pi,...,pnp_1, p_2, ..., p_i, ..., p_n
  • 則稱 E(X)=x1p1+x2p2+...+xipi+...+xnpnE(X) = x_1 p_1 + x_2 p_2 + ... + x_i p_i + ... + x_n p_n 爲離散型隨機變量X的均值或者數學期望
  • 它反映了離散型隨機變量取值的平均水平

性質:

  • E(aX+b)=aE(x)+bE(aX + b) = aE(x) + b
  • 若X服從兩點分佈,則E(X)=pE(X) = p
  • 若X~B(n,p), 則E(X)=npE(X) = np

離散型隨機變量的方差

  • 一般地,若離散型隨機變量X的分佈列爲:
    • X:x1,x2,...,xi,...,xnx_1, x_2, ..., x_i, ..., x_n
    • P:p1,p2,...,pi,...,pnp_1, p_2, ..., p_i, ..., p_n
  • 則稱 D(x)=i=1n(xiE(x))2piD(x) = \sum_{i=1}^n (x_i - E(x))^2p_i 爲隨機變量X的方差,並稱其算術平方根D(X)\sqrt{D(X)}爲隨機變量X的標準差
  • 它反映了離散型隨機變量取值的穩定與波動,集中與離散的程度
    • D(X)越小,X的穩定性越高,波動越小,取值越集中
    • D(X)越大,X的穩定性越差,波動越大,取值越分散

性質

  • D(aX+b)=a2D(X)D(aX+b) = a^2D(X)
  • 若X服從兩點分佈,則D(X)=p(1P)D(X)=p(1-P)
  • 若X~B(n,p), 則D(X)=np(1P)D(X) = np(1-P)

5 ) 正態分佈

  • 正態變量概率密度曲線函數表達式 f(x)=12πσe(xμ)22σ2,xRf(x) = \frac{1}{\sqrt{2 \pi} * \sigma} e^{- \frac{(x-\mu)^2}{2 \sigma^2}}, x \in R
  • 其中 μ,σ\mu, \sigma是參數,且 σ>0,<μ<+\sigma > 0, - \infty < \mu < + \infty. 記爲:N(μ,σ2)N(\mu, \sigma^2), 如下圖

備註:圖片託管於github,請確保網絡的可訪問性

  • 若隨機變量X服從一個數學期望爲μ、方差爲σ2σ^2的正態分佈,記爲N(μσ2)N(μ,σ^2)
  • 其概率密度函數爲正態分佈的期望值μ決定了其位置,其標準差σ決定了分佈的幅度
  • 當μ = 0,σ = 1時的正態分佈是標準正態分佈
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章