2.4 二項分佈和泊松分佈

§4 二項分佈與 Poisson 分佈

4.1 二項分佈的性質和計算

4.1.1 二項分佈的計算

在上一節中, 我們得到了在 nn 次 Bernoulli 試驗中正好出現 kk 次成功的概率 b(k;n,p)b(k;n,p):
b(k;n,p)=(nk)pkqnk,   k=0,1,2,,nb(k;n,p) = \binom{n}{k}p^{k}q^{n-k},\ \ \ k = 0,1,2,\cdots,n
其中 q=1p.q = 1-p.

我們稱 b(k;n,p),  k=0,1,2,,nb(k;n,p), \ \ k = 0,1,2,\cdots,n二項分佈.

二項分佈的數值有現成的圖標可查. 這種表對不同的 nnpp 給出了 b(k;n,p)b(k;n,p) 的數值.

二項分佈表只對 p0.5p\leqslant 0.5 給出,因爲 p>0.5p>0.5 的概率可以經過下式直接計算得到:
b(k;n,p)=b(1k;n,1p).b(k;n,p) = b(1-k;n,1-p).


4.1.2 二項分佈的性質

下面, 我們考察 b(k;n,p)b(k;n,p)kknn 變化的情況:

由於對 0<p<1,0<p<1,
b(k;n,p)b(k1;n,p)=(nk+1)pkq=1+(n+1)pkkq\frac{b(k;n,p)}{b(k-1;n,p)} = \frac{(n-k+1)p}{kq} = 1+\frac{(n+1)p-k}{kq}
因此:

  1. k<(n+1)pk<(n+1)p 時, b(k;n,p)>b(k1,n,p)b(k;n,p)>b(k-1,n,p)
  2. k=(n+1)pk=(n+1)p 時, b(k;n,p)=b(k1,n,p)b(k;n,p)=b(k-1,n,p)
  3. k>(n+1)pk>(n+1)p 時, b(k;n,p)<b(k1,n,p)b(k;n,p)<b(k-1,n,p)

因爲 (n+1)p(n+1)p 不一定爲整數, 而二項分佈中的 kk 只取整數值, 故存在整數 mm , 使得 (n+1)p1<m(n+1)p.(n+1)p-1<m\leqslant (n+1)p. 而且當 kk00 變到 mm 時, b(k;n,p)b(k;n,p) 先單調增加, 當 k=mk = m 時達到極大值, 再單調減小. 但是若 (n+1)p=m(n+1)p = m, 則此時 b(m;n,p)=b(m1;n,p)b(m;n,p) = b(m-1;n,p) 同時達到極大值.

使 b(k;n,p)b(k;n,p) 取得最大值的項 b(m;n,p)b(m;n,p) 稱爲 b(k;n,p)b(k;n,p)中心項, 而 mm 稱爲 最可能成功次數. 由上述討論知: m=[(n+1)p].m = [(n+1)p].(n+1)p(n+1)p 爲整數, 則m1m-1 爲最可能成功次數.


4.1.3 產品抽樣驗收和 (n,c)(n,c) 方案

由於生產過程總是存在種種無法完全控制的因素, 因此工藝規範也允許產品加工的尺寸由一定公差, 或允許產品中含有少量廢品. 這實際上承認了生產過程的隨機性.

在產品的質量管理中, 一般是不可能進行全面檢驗的. 因此, 我們常使用 抽樣檢查 的方法. 抽樣檢查或用於生產過程中,也就是稱爲生產過程質量管理的一部分, 或者用於產品的驗收過程中.

如果我們假定, 每個產品要麼是合格產品要麼是廢品, 那麼此時我們所關心的就是廢品率. 這是計數抽樣驗收中最簡單的情況.

我們對質量的要求大體上可以歸結爲: 存在 p0p_{0}p1p_{1} 滿足 0<p0p1<10 < p_{0} \leqslant p_{1} < 1, 當廢品率 pp0p \leqslant p_{0} 時可以接受這批產品, 否則將這批產品拒絕.

最基本的驗收方案是: 隨機抽取 nn 件產品進行檢驗, 當廢品率低於閾值時接受, 否則拒絕. 該方案稱爲 (n,c)(n,c) 方案.

由於抽樣的隨機性, 任何驗收方案都可能意外地拒收一批合格品, 或意外地接受一批不合格品. 這類 生產者風險消費者風險 是應該被儘量減少的.

爲刻畫驗收方案的性能, 一般我們引進 L(p)L(p), 他表示廢品率爲 pp 時接收這批產品的概率. 若以 pp 爲橫座標, L(p)L(p) 爲縱座標繪圖, 所得到的曲線稱爲 抽檢特性曲線 (Operating Characteristic Curve), 簡稱OC曲線.

(n,c)(n,c) 方案而言, 若採用放回抽樣, 則利用二項分佈易得:
L(p)=k=0c(nk)pk(1p)nk.L(p) = \sum_{k=0}^{c}\binom{n}{k}p^{k}(1-p)^{n-k}.
因此, 原問題歸結爲尋找使得
{L(p)1α,   pp0L(p)β,          p>p1\begin{cases} L(p) \geqslant 1-\alpha , \ \ \ p \leqslant p_{0} \\ L(p) \leqslant \beta, \ \ \ \ \ \ \ \ \ \ p >p_{1}\end{cases}
nncc. 這裏的 α,β\alpha, \beta 是兩個按需給定的, 不大的正數.

理想的驗收方案要求 α=β=0\alpha = \beta = 0, 我們可將其作爲比較驗收方案優劣的基準.


4.2 二項分佈的Poisson逼近

在很多應用問題中, 我們常常遇到具有以下特徵的 Bernoulli 試驗: nn 相對大, pp 相對小, 而 λ=np\lambda = np 大小適中. Poisson 找到了一個對這種情況而言便於使用的近似公式, 下面我們對其進行介紹和推導:

定理4.2.1(Poisson逼近)

在獨立試驗中, 以 pnp_{n} 代表事件 AA 在試驗中出現的概率, 它和試驗總數 nn 有關: 若 >npnλnp_{n} \rightarrow \lambda, 則當 nn \rightarrow \infty 時:
b(k;n,pn)>λkk!eλ.b(k;n,p_{n}) \rightarrow >\frac{\lambda^{k}}{k!}e^{-\lambda}.

證明:

λn=npn\lambda_{n} = np_{n}, 則:
b(k;n,pn)=(nk)pnk(1pn)nk=n(n1)(nk+1)k!(λnn)k(1λnn)nkb(k;n,p_{n}) = \binom{n}{k}p^{k}_{n}(1-p_{n})^{n-k} = \frac{n(n-1) \cdots (n-k+1)}{k!}\binom{\lambda_{n}}{n}^{k} \binom{1-\lambda_{n}}{n}^{n-k}


=λnkk!(11n)(12n)(1k1n)(1λnn)nk= \frac{\lambda_{n}^{k}}{k!}(1-\frac{1}{n})(1-\frac{2}{n})\cdots (1-\frac{k-1}{n})(1-\frac{\lambda_{n}}{n})^{n-k}
由於對固定的 kk 有:
limnλnk=λk,    limn(1λnn)=eλ\lim_{n\rightarrow \infty} \lambda_{n}^{k} = \lambda^{k}, \ \ \ \ \lim_{n\rightarrow \infty} (1-\frac{\lambda_{n}}{n}) = e^{-\lambda}

limn(11n)(12n)(1k1n)=1\lim_{n\rightarrow \infty}(1-\frac{1}{n})(1-\frac{2}{n})\cdots (1-\frac{k-1}{n}) = 1

limnb(k;n,pn)=λkk!eλ\lim_{n\rightarrow \infty}b(k;n,p_{n}) = \frac{\lambda^{k}}{k!}e^{-\lambda}
原定理證畢. \blacksquare


我們稱
p(k;λ)=λkk!eλp(k; \lambda) = \frac{\lambda^{k}}{k!}e^{-\lambda}
Poisson分佈. λ\lambda 稱爲其參數.
特別地:
k=0p(k;λ)=k=0λkk!eλ=1.\sum_{k=0}^{\infty}p(k;\lambda) = \sum_{k=0}^{\infty} \frac{\lambda^{k}}{k!}e^{-\lambda} = 1.

Poisson 分佈是概率論中的一種重要分佈. 在應用中, 當 pp 相當小 (一般當 p0.1p \leqslant 0.1 ) 時, 我們使用下列公式:
b(k;n,p)(np)kk!enp.b(k;n,p) \approx \frac{(np)^{k}}{k!}e^{-np}.


4.3 Poisson分佈

歷史上, Poisson 分佈是作爲二項分佈的近似, 由法國數學家 Poisson 引入的.

目前, 我們已經發現許多隨機現象服從 Poisson 分佈. 這樣的情況尤其集中於兩個領域: 社會生活 和 物理科學 中.

其次, 對 Poisson 分佈的深入研究已經發現, 這種分佈具有許多特殊的性質和作用.

下面, 我們將介紹產生 Poisson 分佈的機制. 爲了便於理解, 這個重要結果將結合電話呼叫流敘述.

下面, 先證明一個以後將多次用到的數學分析結論:


定理4.3.1 (Cauchy引理)

f(x)f(x) 是連續函數或單調函數, 且對一切 x,yx,y (或一切 x0,  y0x \geqslant 0, \ \ y \geqslant 0 ) 成立
f(x)f(y)=f(x+y),f(x)f(y) = f(x+y),
則:
f(x)=ax.f(x) = a^{x}.
其中, a0a \geqslant 0, 爲一個常數.


證明:

根據函數的積性得:
f(x)=[f(x2)]20.f(x) = [f(\frac{x}{2})]^{2} \geqslant 0.
因此, f(x)f(x) 是非負的. 反覆使用上式可得:對任意正整數 nn 和實數 xx, 有:
f(nx)=[f(1n)]n.f(nx) = [f(\frac{1}{n})]^{n}.
a=f(1)0a = f(1) \geqslant 0, 則:
f(1n)=a1n.f(\frac{1}{n}) = a^{\frac{1}{n}}.
故對任意正整數 mmnn, 成立:
f(mn)=[f(1n)]m=amn.f(\frac{m}{n}) = [f(\frac{1}{n})]^{m} = a^{\frac{m}{n}}.
這樣, 即證得原定理對一切有理數成立. 利用其連續性或單調性可以證明, 原定理對無理數也成立. \blacksquare


下面, 我們對 Poisson 過程簡要介紹:
考慮來到某個交換機得電話呼叫數. 假定它具有以下三個性質:

  1. 平穩性: 在 [t0,t0+t)[t_{0}, t_{0} + t) 時間中來到交換機得呼叫數只和時間間隔長度 tt 有關, 而與時間起點 t0t_{0} 無關. 若以 Pk(t)P_{k}(t) 記在長度 tt 的時間區間中來到 kk 個呼叫的概率, 當然 k=0Pk(t)=1\sum^{\infty}_{k = 0}P_{k}(t) = 1 對任何 t>0t > 0 成立.
    過程的平穩性表示了 它的概率規律不隨時間的推移而發生改變.

  1. 獨立增量性 (無後效性):
    “在 [t0,t0+t)[t_{0},t_{0} + t) 內來到 kk 個呼叫” 這一事件和時刻 t0t_{0} 之前所發生的事件獨立.
    獨立增量性表明, 在互不相交的時間區間內過程的進行具有 相互獨立性.

  1. 普通性:
    在充分小的時間間隔中, 最多來到一個呼叫. 也就是: 若記
    ϕ(t)=k=2Pk(t)=1P0(t)P1(t)\phi(t) = \sum_{k=2}^{\infty}P_{k}(t) = 1-P_{0}(t) - P_{1}(t)
    應有 ϕ(t)=o(t)\phi(t) = o(t). 即:
    limt0ϕ(t)t=0\lim_{t \rightarrow 0}\frac{\phi(t)}{t} = 0
    普通性表明, 不可能在同一時間瞬間有兩個或以上數量的呼叫到來.

下面, 我們求 Pk(t).P_{k}(t).

Δt>0\Delta t >0, 考慮 [0,t+Δt)[0,t+\Delta t) 中來到 kk 個呼叫的概率 Pk(t+Δt)P_{k}(t + \Delta t), 由獨立增量性和全概率公式
Pk(t+Δt)=Pk(t)P0(t)+Pk1(t)P1(t)++P0(t)Pk(t),   k0.P_{k}(t+\Delta t) = P_{k}(t)P_{0}(t) + P_{k-1}(t)P_{1}(t) + \cdots + P_{0}(t)P_{k}(t), \ \ \ k \geqslant 0.
特別地:
P0(t+Δt)=P0(t)P0(Δt)P_{0}(t + \Delta t) = P_{0}(t)P_{0}(\Delta t)
P0(t)P_{0}(t) 表示在長度爲 tt 的時間間隔中沒有來呼叫的概率. 因此它關於 tt 是單調減少的. 由 Cauchy引理:
P0(t)=at.P_{0}(t) = a^{t}.
其中 a0a \geqslant 0, 若 a=0a = 0, 則 P0(t)0P_{0}(t) \equiv 0, 這說明, 無論時間間隔多短, 時間間隔內都會來呼叫. 因此, 在有限的時間間隔中要應答無窮多個呼叫, 這種情況不屬於考慮範圍之內. 此外, 因 P0(t)P_{0}(t) 是概率, 因此應有 a1a \leqslant 1. 而當 a=1a = 1 時, P0(t)1P_{0}(t) \equiv 1. 這表明呼叫永不會到來, 也不屬於我們考慮的情形. 因此, 應有 0<a<10<a<1. 從而存在 λ>0\lambda >0, 使:
P0(t)=eλt.P_{0}(t) = e^{-\lambda t}.
因此, 當 Δt0\Delta t \rightarrow 0 時, 我們有:
P0(Δt)=eλt=1λΔt+o(Δt).P_{0}(\Delta t) = e^{-\lambda t} = 1-\lambda \Delta t + o(\Delta t).
P1(Δt)=1P0(Δt)ϕ(Δt)=λΔt+oΔt).P_{1}(\Delta t) = 1-P_{0}(\Delta t)- \phi(\Delta t) = \lambda \Delta t + o\Delta t). l=2Pkl(t)Pl(Δt)l=2Pl(Δt)=ϕ(Δt)=o(Δt).\sum_{l=2}^{\infty}P_{k-l}(t)P_{l}(\Delta t) \leqslant \sum_{l=2}^{\infty}P_{l}(\Delta t) = \phi(\Delta t) = o(\Delta t).
(k1)(k \geqslant 1)
因此知:
Pk(t+Δt)=Pk(t)(1λΔt)+Pk1(t)λΔt+o(Δt)P_{k}(t + \Delta t) = P_{k}(t)(1-\lambda \Delta t) + P_{k-1}(t)*\lambda \Delta t + o(\Delta t)
(k1)(k \geqslant 1)
Δt0\Delta t \rightarrow 0, 得:
Pk(t)=λ[Pk1(t)Pk(t)]+o(1)P_{k}'(t) = \lambda[P_{k-1}(t) - P_{k}(t)] + o(1)
(k1)(k \geqslant 1)
由於已知 P0(t)=eλtP_{0}(t) = e^{-\lambda t}, 故有 P1(t)=λ[eλtP1(t)]P'_{1}(t) = \lambda[e^{-\lambda t} - P_{1}(t)], 可解得 P1(t)=λteλtP_{1}(t) = \lambda te^{-\lambda t}. 這樣, 可依次解得一切 Pk(t)P_{k}(t).

Pk(t)=(λt)kk!eλt,     k=0,1,2,P_{k}(t) = \frac{(\lambda t)^{k}}{k!}e^{-\lambda t}, \ \ \ \ \ k =0,1,2,\cdots
這正是 Poisson 分佈, 參數爲 λt\lambda t.

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章