一個問題
在複習概率論與數理統計的時候,發現一個有趣的例子:
兩家醫院,大醫院每天新生兒45個,小醫院新生兒15個,問一年內哪家醫院男新生兒比例超過60%的天數多的可能性大?
乍眼一看,直覺告訴我新生兒的自然男女比例應該固定在50%左右的某個值,兩家醫院的男女概率應該都是這個值,所以兩家醫院的可能性相同。
答案明顯沒那麼簡單。
這裏想引入兩個定律:
伯努利大數定律
設μn 是n重伯努利試驗中事件A發生的次數,已知在每次試驗中A發生的概率爲p(0<p<1) ,則對任意ϵ>0 ,有
limn→∞P{|μnn−p|>ϵ}=0
即
μnn→p 或
P−limn→∞μnn=p
大數定律的意思是如果一個事件A的概率爲p,那麼大量重複試驗中事件A發生的概率將逐漸穩定到概率p。
但大數定律並沒有告訴我們,當n充分大時,P{|μnn−p|>ϵ} 的概率到底有多大。此時引入中心極限定理。
中心極限定理
(林德伯格-列維)設ξ1,ξ2,…,ξn,… 是一列獨立同分布的隨機變量,且Eξi=μ ,D(ξi)=σ2>0 ,i=1,2,… ,則有
limn→∞{∑ni=1ξi−nμn√σ≤x}=12π−−√∫x−∞e−t22dt
即∑ni=1ξi−nμn√σ∼N(0,1)
大數定律沒有告訴我們P{|μnn−p|>ϵ} 的概率到底有多大,但中心極限定理告訴了我們:
1n∑i=1nξi−μ∼N(0,1nσ2)
這個分佈告訴我們,當n越大時,1n∑ni=1ξi−μ 服從的正態分佈的方差越小,1n∑ni=1ξi 靠近μ 的概率就越大。
解答
回到新生兒問題,大醫院一天的樣本量比小醫院的樣本量要多,所以大醫院1n∑ni=1ξi−μ 服從的正態分佈的方差要比小醫院的小,所以大醫院在x=0.1(60%-50%)的概率要比小醫院的小,即大醫院一天男新生兒多於60%的可能性比小醫院的要小。
所以正確答案是小醫院的可能性大。