§4 二項分佈與 Poisson 分佈
4.1 二項分佈的性質和計算
4.1.1 二項分佈的計算
在上一節中, 我們得到了在 n 次 Bernoulli 試驗中正好出現 k 次成功的概率 b(k;n,p):
b(k;n,p)=(kn)pkqn−k, k=0,1,2,⋯,n
其中 q=1−p.
我們稱 b(k;n,p), k=0,1,2,⋯,n 爲 二項分佈.
二項分佈的數值有現成的圖標可查. 這種表對不同的 n 和 p 給出了 b(k;n,p) 的數值.
二項分佈表只對 p⩽0.5 給出,因爲 p>0.5 的概率可以經過下式直接計算得到:
b(k;n,p)=b(1−k;n,1−p).
4.1.2 二項分佈的性質
下面, 我們考察 b(k;n,p) 隨 k 和 n 變化的情況:
由於對 0<p<1,
b(k−1;n,p)b(k;n,p)=kq(n−k+1)p=1+kq(n+1)p−k
因此:
- 當 k<(n+1)p 時, b(k;n,p)>b(k−1,n,p)
- 當 k=(n+1)p 時, b(k;n,p)=b(k−1,n,p)
- 當 k>(n+1)p 時, b(k;n,p)<b(k−1,n,p)
因爲 (n+1)p 不一定爲整數, 而二項分佈中的 k 只取整數值, 故存在整數 m , 使得 (n+1)p−1<m⩽(n+1)p. 而且當 k 從 0 變到 m 時, b(k;n,p) 先單調增加, 當 k=m 時達到極大值, 再單調減小. 但是若 (n+1)p=m, 則此時 b(m;n,p)=b(m−1;n,p) 同時達到極大值.
使 b(k;n,p) 取得最大值的項 b(m;n,p) 稱爲 b(k;n,p) 的 中心項, 而 m 稱爲 最可能成功次數. 由上述討論知: m=[(n+1)p]. 若 (n+1)p 爲整數, 則m−1 爲最可能成功次數.
4.1.3 產品抽樣驗收和 (n,c) 方案
由於生產過程總是存在種種無法完全控制的因素, 因此工藝規範也允許產品加工的尺寸由一定公差, 或允許產品中含有少量廢品. 這實際上承認了生產過程的隨機性.
在產品的質量管理中, 一般是不可能進行全面檢驗的. 因此, 我們常使用 抽樣檢查 的方法. 抽樣檢查或用於生產過程中,也就是稱爲生產過程質量管理的一部分, 或者用於產品的驗收過程中.
如果我們假定, 每個產品要麼是合格產品要麼是廢品, 那麼此時我們所關心的就是廢品率. 這是計數抽樣驗收中最簡單的情況.
我們對質量的要求大體上可以歸結爲: 存在 p0 和 p1 滿足 0<p0⩽p1<1, 當廢品率 p⩽p0 時可以接受這批產品, 否則將這批產品拒絕.
最基本的驗收方案是: 隨機抽取 n 件產品進行檢驗, 當廢品率低於閾值時接受, 否則拒絕. 該方案稱爲 (n,c) 方案.
由於抽樣的隨機性, 任何驗收方案都可能意外地拒收一批合格品, 或意外地接受一批不合格品. 這類 生產者風險 和 消費者風險 是應該被儘量減少的.
爲刻畫驗收方案的性能, 一般我們引進 L(p), 他表示廢品率爲 p 時接收這批產品的概率. 若以 p 爲橫座標, L(p) 爲縱座標繪圖, 所得到的曲線稱爲 抽檢特性曲線 (Operating Characteristic Curve)
, 簡稱OC
曲線.
對 (n,c) 方案而言, 若採用放回抽樣, 則利用二項分佈易得:
L(p)=k=0∑c(kn)pk(1−p)n−k.
因此, 原問題歸結爲尋找使得
{L(p)⩾1−α, p⩽p0L(p)⩽β, p>p1
的 n 和 c. 這裏的 α,β 是兩個按需給定的, 不大的正數.
理想的驗收方案要求 α=β=0, 我們可將其作爲比較驗收方案優劣的基準.
4.2 二項分佈的Poisson逼近
在很多應用問題中, 我們常常遇到具有以下特徵的 Bernoulli 試驗: n 相對大, p 相對小, 而 λ=np 大小適中. Poisson 找到了一個對這種情況而言便於使用的近似公式, 下面我們對其進行介紹和推導:
定理4.2.1(Poisson逼近)
在獨立試驗中, 以 pn 代表事件 A 在試驗中出現的概率, 它和試驗總數 n 有關: 若 >npn→λ, 則當 n→∞ 時:
b(k;n,pn)→>k!λke−λ.
證明:
記 λn=npn, 則:
b(k;n,pn)=(kn)pnk(1−pn)n−k=k!n(n−1)⋯(n−k+1)(nλn)k(n1−λn)n−k
=k!λnk(1−n1)(1−n2)⋯(1−nk−1)(1−nλn)n−k
由於對固定的 k 有:
n→∞limλnk=λk, n→∞lim(1−nλn)=e−λ
及
n→∞lim(1−n1)(1−n2)⋯(1−nk−1)=1
故
n→∞limb(k;n,pn)=k!λke−λ
原定理證畢. ■
我們稱
p(k;λ)=k!λke−λ
爲 Poisson分佈. λ 稱爲其參數.
特別地:
k=0∑∞p(k;λ)=k=0∑∞k!λke−λ=1.
Poisson 分佈是概率論中的一種重要分佈. 在應用中, 當 p 相當小 (一般當 p⩽0.1 ) 時, 我們使用下列公式:
b(k;n,p)≈k!(np)ke−np.
4.3 Poisson分佈
歷史上, Poisson 分佈是作爲二項分佈的近似, 由法國數學家 Poisson 引入的.
目前, 我們已經發現許多隨機現象服從 Poisson 分佈. 這樣的情況尤其集中於兩個領域: 社會生活 和 物理科學 中.
其次, 對 Poisson 分佈的深入研究已經發現, 這種分佈具有許多特殊的性質和作用.
下面, 我們將介紹產生 Poisson 分佈的機制. 爲了便於理解, 這個重要結果將結合電話呼叫流敘述.
下面, 先證明一個以後將多次用到的數學分析結論:
定理4.3.1 (Cauchy引理)
若 f(x) 是連續函數或單調函數, 且對一切 x,y (或一切 x⩾0, y⩾0 ) 成立
f(x)f(y)=f(x+y),
則:
f(x)=ax.
其中, a⩾0, 爲一個常數.
證明:
根據函數的積性得:
f(x)=[f(2x)]2⩾0.
因此, f(x) 是非負的. 反覆使用上式可得:對任意正整數 n 和實數 x, 有:
f(nx)=[f(n1)]n.
記 a=f(1)⩾0, 則:
f(n1)=an1.
故對任意正整數 m 和 n, 成立:
f(nm)=[f(n1)]m=anm.
這樣, 即證得原定理對一切有理數成立. 利用其連續性或單調性可以證明, 原定理對無理數也成立. ■
下面, 我們對 Poisson 過程簡要介紹:
考慮來到某個交換機得電話呼叫數. 假定它具有以下三個性質:
- 平穩性: 在 [t0,t0+t) 時間中來到交換機得呼叫數只和時間間隔長度 t 有關, 而與時間起點 t0 無關. 若以 Pk(t) 記在長度 t 的時間區間中來到 k 個呼叫的概率, 當然 k=0∑∞Pk(t)=1 對任何 t>0 成立.
過程的平穩性表示了 它的概率規律不隨時間的推移而發生改變.
- 獨立增量性 (無後效性):
“在 [t0,t0+t) 內來到 k 個呼叫” 這一事件和時刻 t0 之前所發生的事件獨立.
獨立增量性表明, 在互不相交的時間區間內過程的進行具有 相互獨立性.
- 普通性:
在充分小的時間間隔中, 最多來到一個呼叫. 也就是: 若記
ϕ(t)=k=2∑∞Pk(t)=1−P0(t)−P1(t)
應有 ϕ(t)=o(t). 即:
t→0limtϕ(t)=0
普通性表明, 不可能在同一時間瞬間有兩個或以上數量的呼叫到來.
下面, 我們求 Pk(t).
對 Δt>0, 考慮 [0,t+Δt) 中來到 k 個呼叫的概率 Pk(t+Δt), 由獨立增量性和全概率公式
Pk(t+Δt)=Pk(t)P0(t)+Pk−1(t)P1(t)+⋯+P0(t)Pk(t), k⩾0.
特別地:
P0(t+Δt)=P0(t)P0(Δt)
P0(t) 表示在長度爲 t 的時間間隔中沒有來呼叫的概率. 因此它關於 t 是單調減少的. 由 Cauchy引理:
P0(t)=at.
其中 a⩾0, 若 a=0, 則 P0(t)≡0, 這說明, 無論時間間隔多短, 時間間隔內都會來呼叫. 因此, 在有限的時間間隔中要應答無窮多個呼叫, 這種情況不屬於考慮範圍之內. 此外, 因 P0(t) 是概率, 因此應有 a⩽1. 而當 a=1 時, P0(t)≡1. 這表明呼叫永不會到來, 也不屬於我們考慮的情形. 因此, 應有 0<a<1. 從而存在 λ>0, 使:
P0(t)=e−λt.
因此, 當 Δt→0 時, 我們有:
P0(Δt)=e−λt=1−λΔt+o(Δt).
P1(Δt)=1−P0(Δt)−ϕ(Δt)=λΔt+oΔt). l=2∑∞Pk−l(t)Pl(Δt)⩽l=2∑∞Pl(Δt)=ϕ(Δt)=o(Δt).
(k⩾1)
因此知:
Pk(t+Δt)=Pk(t)(1−λΔt)+Pk−1(t)∗λΔt+o(Δt)
(k⩾1)
令 Δt→0, 得:
Pk′(t)=λ[Pk−1(t)−Pk(t)]+o(1)
(k⩾1)
由於已知 P0(t)=e−λt, 故有 P1′(t)=λ[e−λt−P1(t)], 可解得 P1(t)=λte−λt. 這樣, 可依次解得一切 Pk(t).
Pk(t)=k!(λt)ke−λt, k=0,1,2,⋯
這正是 Poisson 分佈, 參數爲 λt.