隨機變量及其分佈?

  • 離散型隨機變量及其分佈

(0-1)分佈   P\left \{ X = k \right \} = p^{k}(1-p)^{1-k},k=0,1 (0<p<1)

設隨機變量X只可能取0和1的兩個值,他的分佈律是P\left \{ X = k \right \} = p^{k}(1-p)^{1-k},k=0,1 (0<p<1),

則稱 X 服從以p爲參數的(0-1)分佈或者兩點分佈。

分佈律:

X 0 1
Pk 1-p p

伯努利(Bernoulli)實驗、二項分佈

設實驗 E 只有兩個可能結果:A和\bar{}\bar{A},則稱 E 爲伯努利實驗。

設P(A) = p (0<p<1),此時P(\bar{A}) = 1 - p,將 E 獨立重複地進行 n 次,則稱這一串重複的獨立實驗爲 n 重伯努利實驗。

這裏“重複”是指在每次實驗中 P(A)  = p 保持不變:“獨立”是指各次實驗的結果互不影響,即若以 C_{i} 記第 i 次實驗的結果,C_{i} 爲 A 或 \bar{A} ,i = 1,2,·····,n。“獨立”是指

P(C_{1}C_{2}\cdots C_{n}) = P(C_{1})P(C_{2})\cdots P(C_{n})

分佈律:假設在前 k 次實驗中 A 發生,而後 n-k 次實驗中 A 不發生的概率爲 P^{k}P^{n-k},這種指定的方式共用\binom{n}{k} 種。故在 n 次實驗中 A 發生 k 次的概率爲\binom{n}{k}P^{k}(1-P)^{n-k},記 q = 1-p,即有

P(x=k) =\binom{n}{k}p^{k}q^{n-k} ,看= 0, 1, 2,····,n;

顯然

p(x=k)\geq 0, k = 0, 1, 2,...., n

\sum_{k=0}^{n}P(x=k)=\sum_{k=0}^{n}\binom{n}{k}p^{k}q^{n-k} = (p + q)^n = 1

由於\binom{n}{k}p^{k}q^{n-k} 剛好是二項式 (p+q)^n 的展開式中出現 p^k 的那一項。我們也稱隨機變量 X 服從參數爲 n, p 的二項分佈。

特別的:當 n=1 時,二項分佈式化爲 p^{k}(1-p)^{1-k}, k = 0, 1。

泊松分佈(描述某段時間內,事件具體的發生概率)

在實際應用過程中,很多時間具有固定的頻率。

  • 某醫院平均每小時出生3個嬰兒

  • 某一地區一個時間間隔內發生交通事故的次數

  • 某公司平均每10分鐘接到1個電話

  • 某超市平均每天銷售4包xx牌奶粉

  • 某網站平均每分鐘有2次訪問

    上面這些事件的特點是,我們可以預估事件發生的總數,但是沒法知道具體的發生時間。已知每年發生的交通事故,那麼下一年會發生多少起呢?這個沒法知道。

 

  • 連續性變量分佈

均勻分佈

 

 

指數分佈 

指數分佈是事件的時間間隔的概率。下面這些都屬於指數分佈。

  • 嬰兒出生的時間間隔

  • 來電的時間間隔

  • 奶粉銷售的時間間隔

  • 網站訪問的時間間隔

指數分佈的公式可以從泊松分佈推斷出來。如果下一個嬰兒間隔時間 t ,就等同於 t 之內沒有任何嬰兒出生。

反過來,事件在時間 t 之內發生的概率(至少出生一個的概率),就是1減去上面的值。

接下來15分鐘,會有嬰兒出生的概率是52.76%。

接下來的15分鐘到30分鐘,會有嬰兒出生的概率是24.92%。

指數分佈的圖形大概是下面的樣子。

可以看到,隨着間隔時間變長,事件的發生概率急劇下降,呈指數式衰減。想一想,如果每小時平均出生3個嬰兒,上面已經算過了,下一個嬰兒間隔2小時纔出生的概率是0.25%,那麼間隔3小時、間隔4小時的概率,是不是更接近於0?

 

指數分佈的概率密度爲:

 

式中:x是給定的時間;λ爲單位時間事件發生的次數;e=2.71828。

 

指數分佈概率密度曲線如下圖:

 

 

指數分佈具有以下特徵:

(1)隨機變量X的取值範圍是從0到無窮;

(2)極大值在x=0處,即f(x)=λ;

(3)函數爲右偏,且隨着x的增大,曲線穩步遞減;

(4)隨機變量的期望值和方差爲µ=1/λ,σ2=1/λ2。

 

 

通過對概率密度函數的積分,就可以得到相應的概率,其表達式有兩種

P(X≥x)=e-λx

P(X≤x)=1-e-λx

 

例:某電視機生產廠生產的電視機平均10年出現大的故障,且故障發生的次數服從泊松分佈。

問(1)該電視機使用15年後還沒有出現大故障的比例;(2)如果廠家想提供大故障免費維修的質量擔保,但不能超過全部產量的20%,試確定提供擔保的年數。

 

解:

(1)設X爲電視機出現大故障的時間。已知µ=10年,則λ=1/µ=0.1,於是,P(X≥x)=e-λx=e-0.1*15≈0.223。則15年後,沒有出現大故障的電視機約佔22.3%。

(2)問題要求比例不超過20%,這是求X的右側概率面積,現在根據公式確定適當的X值。

 

電視機各年累計出現的故障比例

擔保年數X

累計概率P(X≤x)=1-e-λx

1

0.095

2

0.181

3

0.259

從表中可以看到:擔保2年時,出現大故障的比例是18.1%,不超過20%。擔保3年時,出現大故障的比例爲25.9%,已經超過20%。所以,廠家應以2年爲擔保期。

 

高斯分佈,正態分佈

透徹理解高斯分佈

  • 參考文獻 

  1. 泊松分佈 & 指數分佈
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章