認識生活中的泊松分佈

● 每週一言

有些人推動生活走,有些人則被生活推着走。

導語

公交地鐵站根據每天客流量的變化安排班次,銀行根據每天的排號人數決定開放櫃檯數,包子粥鋪根據每天賣出多少碗粥和多少個包子來充分備貨……這一類常見的生活問題都和泊松分佈息息相關。

那麼,如何直觀理解泊松分佈?

泊松分佈

要講泊松分佈,得先講講二項分佈,因爲泊松分佈是二項分佈的極限形式,是由二項分佈的公式取極限推導而來。

fig1

二項分佈,顧名思義,就是取值結果只有正負兩種的分佈,用數學語言描述就是關於n個獨立的正負實驗中成功次數的離散概率分佈。

二項分佈最典型的實驗是拋硬幣實驗,拋n次硬幣,有k次正面朝上的概率是多少?假設正面朝上的概率是p,根據排列組合,從n次中挑選出k次正面朝上,n-k次翻面朝上,發生的概率P爲:

P=Cnk×pk×(1p)nk

這個便是二項分佈公式,二項分佈公式的數學期望μ = np。
fig2

這個時候大家可能發現了,要計算髮生k次的概率,在二項分佈中必須事先知道一個全局的n才行。然而,在前文提到的實際生活問題中,我們很難或者無法預先知道對應的n是多少。

比如潛在乘坐公交車的乘客總數,潛在需要去銀行辦業務的客戶總數,以及潛在包子粥鋪顧客總數等。這裏有一個前提假設,每一類人對相應事件的參與概率相同且互不影響,即獨立同概率假設。

fig3

人數n未知,難道就沒有辦法求這個概率P了嗎?聰明的小夥伴應該已經聯想到了取n的極限來求解P。沒錯,這個取極限求解P正是泊松分佈的推導過程。

P=limnCnk×pk×(1p)nk

可知,上式中只剩下p是未知的,根據二項公式的數學期望μ = np,我們知道p= μ / n,帶入上式並推導計算P的極限得:
P=limnCnk×(μn)k×(1μn)nkP=limnn(n1)(n2)...(nk+1)k!μknk(1μn)nkP=limnμkk!n(n1)...(nk+1)nk(1μn)k(1μn)n

將上式各個部分拆開來計算,根據指數e的極限求法,我們能得到:
limnn(n1)...(nk+1)nk(1μn)k=1limn(1μn)n=eμ

將上式帶入極限求解,P的極限最終變成了只和k、μ相關的式子,即泊松分佈公式。
Pk=limnCnk×pk×(1p)nk(22)=μkk!eμ

有了泊松分佈公式,已知均值μ,我們不需要知道總數n,就能求得k值對應的概率是多少。
fig4

拿之前的包子粥鋪作爲例子直觀說明一下泊松分佈公式的用法:已知包子粥鋪歷史每天平均賣出μ=100個包子,爲了保證未來每天不夠賣的概率低於10%,每天最少需要準備多少個包子?

假設最少需要準備n個包子,根據泊松公式可得如下不等式:

k=1nPk=k=1n100kk!e100>110%=0.9

可知,滿足上式的最小n即爲問題的解。

以上便是泊松分佈的講解,敬請期待下節內容。

結語

感謝各位的耐心閱讀,後續文章於每週日奉上,敬請期待。歡迎大家關注小鬥公衆號 對半獨白

face

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章