§4 二項分佈與 Poisson 分佈

文章目錄

§4 二項分佈與 Poisson 分佈

4.1 二項分佈的性質和計算

4.1 二項分佈的性質和計算

4.1.1 二項分佈的計算

在上一節中, 我們得到了在 $n$ 次 Bernoulli 試驗中正好出現 $k$ 次成功的概率 $b(k;n,p)$ :
$b(k;n,p) = \binom{n}{k}p^{k}q^{n-k},\ \ \ k = 0,1,2,\cdots,n$
其中 $q = 1-p.$

我們稱 $b(k;n,p), \ \ k = 0,1,2,\cdots,n$ 爲 二項分佈.

二項分佈的數值有現成的圖標可查. 這種表對不同的 $n$ 和 $p$ 給出了 $b(k;n,p)$ 的數值.

二項分佈表只對 $p\leqslant 0.5$ 給出,因爲 $p>0.5$ 的概率可以經過下式直接計算得到:
$b(k;n,p) = b(1-k;n,1-p).$

4.1.2 二項分佈的性質

下面, 我們考察 $b(k;n,p)$ 隨 $k$ 和 $n$ 變化的情況:

由於對 $0<p<1,$
$\frac{b(k;n,p)}{b(k-1;n,p)} = \frac{(n-k+1)p}{kq} = 1+\frac{(n+1)p-k}{kq}$
因此:

當 $k<(n+1)p$ 時, $b(k;n,p)>b(k-1,n,p)$
當 $k=(n+1)p$ 時, $b(k;n,p)=b(k-1,n,p)$
當 $k>(n+1)p$ 時, $b(k;n,p)<b(k-1,n,p)$

因爲 $(n+1)p$ 不一定爲整數, 而二項分佈中的 $k$ 只取整數值, 故存在整數 $m$ , 使得 $(n+1)p-1<m\leqslant (n+1)p.$ 而且當 $k$ 從 $0$ 變到 $m$ 時, $b(k;n,p)$ 先單調增加, 當 $k = m$ 時達到極大值, 再單調減小. 但是若 $(n+1)p = m$ , 則此時 $b(m;n,p) = b(m-1;n,p)$ 同時達到極大值.

使 $b(k;n,p)$ 取得最大值的項 $b(m;n,p)$ 稱爲 $b(k;n,p)$ 的 中心項, 而 $m$ 稱爲 最可能成功次數. 由上述討論知: $m = [(n+1)p].$ 若 $(n+1)p$ 爲整數, 則 $m-1$ 爲最可能成功次數.

4.1.3 產品抽樣驗收和 $(n,c)$ 方案

由於生產過程總是存在種種無法完全控制的因素, 因此工藝規範也允許產品加工的尺寸由一定公差, 或允許產品中含有少量廢品. 這實際上承認了生產過程的隨機性.

在產品的質量管理中, 一般是不可能進行全面檢驗的. 因此, 我們常使用 抽樣檢查 的方法. 抽樣檢查或用於生產過程中,也就是稱爲生產過程質量管理的一部分, 或者用於產品的驗收過程中.

如果我們假定, 每個產品要麼是合格產品要麼是廢品, 那麼此時我們所關心的就是廢品率. 這是計數抽樣驗收中最簡單的情況.

我們對質量的要求大體上可以歸結爲: 存在 $p_{0}$ 和 $p_{1}$ 滿足 $0 < p_{0} \leqslant p_{1} < 1$ , 當廢品率 $p \leqslant p_{0}$ 時可以接受這批產品, 否則將這批產品拒絕.

最基本的驗收方案是: 隨機抽取 $n$ 件產品進行檢驗, 當廢品率低於閾值時接受, 否則拒絕. 該方案稱爲 $(n,c)$ 方案.

由於抽樣的隨機性, 任何驗收方案都可能意外地拒收一批合格品, 或意外地接受一批不合格品. 這類 生產者風險 和 消費者風險 是應該被儘量減少的.

爲刻畫驗收方案的性能, 一般我們引進 $L(p)$ , 他表示廢品率爲 $p$ 時接收這批產品的概率. 若以 $p$ 爲橫座標, $L(p)$ 爲縱座標繪圖, 所得到的曲線稱爲 抽檢特性曲線 (Operating Characteristic Curve), 簡稱OC曲線.

對 $(n,c)$ 方案而言, 若採用放回抽樣, 則利用二項分佈易得:
$L(p) = \sum_{k=0}^{c}\binom{n}{k}p^{k}(1-p)^{n-k}.$
因此, 原問題歸結爲尋找使得
$\begin{cases} L(p) \geqslant 1-\alpha , \ \ \ p \leqslant p_{0} \\ L(p) \leqslant \beta, \ \ \ \ \ \ \ \ \ \ p >p_{1}\end{cases}$
的 $n$ 和 $c$ . 這裏的 $\alpha, \beta$ 是兩個按需給定的, 不大的正數.

理想的驗收方案要求 $\alpha = \beta = 0$ , 我們可將其作爲比較驗收方案優劣的基準.

4.2 二項分佈的Poisson逼近

在很多應用問題中, 我們常常遇到具有以下特徵的 Bernoulli 試驗: $n$ 相對大, $p$ 相對小, 而 $\lambda = np$ 大小適中. Poisson 找到了一個對這種情況而言便於使用的近似公式, 下面我們對其進行介紹和推導:

定理4.2.1(Poisson逼近)

在獨立試驗中, 以 $p_{n}$ 代表事件 $A$ 在試驗中出現的概率, 它和試驗總數 $n$ 有關: 若 > $np_{n} \rightarrow \lambda$ , 則當 $n \rightarrow \infty$ 時:
$b(k;n,p_{n}) \rightarrow >\frac{\lambda^{k}}{k!}e^{-\lambda}.$

證明:

記 $\lambda_{n} = np_{n}$ , 則:
$b(k;n,p_{n}) = \binom{n}{k}p^{k}_{n}(1-p_{n})^{n-k} = \frac{n(n-1) \cdots (n-k+1)}{k!}\binom{\lambda_{n}}{n}^{k} \binom{1-\lambda_{n}}{n}^{n-k}$

$= \frac{\lambda_{n}^{k}}{k!}(1-\frac{1}{n})(1-\frac{2}{n})\cdots (1-\frac{k-1}{n})(1-\frac{\lambda_{n}}{n})^{n-k}$
由於對固定的 $k$ 有:
$\lim_{n\rightarrow \infty} \lambda_{n}^{k} = \lambda^{k}, \ \ \ \ \lim_{n\rightarrow \infty} (1-\frac{\lambda_{n}}{n}) = e^{-\lambda}$
及
$\lim_{n\rightarrow \infty}(1-\frac{1}{n})(1-\frac{2}{n})\cdots (1-\frac{k-1}{n}) = 1$
故
$\lim_{n\rightarrow \infty}b(k;n,p_{n}) = \frac{\lambda^{k}}{k!}e^{-\lambda}$
原定理證畢. $\blacksquare$

我們稱
$p(k; \lambda) = \frac{\lambda^{k}}{k!}e^{-\lambda}$
爲 Poisson分佈. $\lambda$ 稱爲其參數.
特別地:
$\sum_{k=0}^{\infty}p(k;\lambda) = \sum_{k=0}^{\infty} \frac{\lambda^{k}}{k!}e^{-\lambda} = 1.$

Poisson 分佈是概率論中的一種重要分佈. 在應用中, 當 $p$ 相當小 (一般當 $p \leqslant 0.1$ ) 時, 我們使用下列公式:
$b(k;n,p) \approx \frac{(np)^{k}}{k!}e^{-np}.$

4.3 Poisson分佈

歷史上, Poisson 分佈是作爲二項分佈的近似, 由法國數學家 Poisson 引入的.

目前, 我們已經發現許多隨機現象服從 Poisson 分佈. 這樣的情況尤其集中於兩個領域: 社會生活和物理科學中.

其次, 對 Poisson 分佈的深入研究已經發現, 這種分佈具有許多特殊的性質和作用.

下面, 我們將介紹產生 Poisson 分佈的機制. 爲了便於理解, 這個重要結果將結合電話呼叫流敘述.

下面, 先證明一個以後將多次用到的數學分析結論:

定理4.3.1 (Cauchy引理)

若 $f(x)$ 是連續函數或單調函數, 且對一切 $x,y$ (或一切 $x \geqslant 0, \ \ y \geqslant 0$ ) 成立
$f(x)f(y) = f(x+y),$
則:
$f(x) = a^{x}.$
其中, $a \geqslant 0$ , 爲一個常數.

證明:

根據函數的積性得:
$f(x) = [f(\frac{x}{2})]^{2} \geqslant 0.$
因此, $f(x)$ 是非負的. 反覆使用上式可得:對任意正整數 $n$ 和實數 $x$ , 有:
$f(nx) = [f(\frac{1}{n})]^{n}.$
記 $a = f(1) \geqslant 0$ , 則:
$f(\frac{1}{n}) = a^{\frac{1}{n}}.$
故對任意正整數 $m$ 和 $n$ , 成立:
$f(\frac{m}{n}) = [f(\frac{1}{n})]^{m} = a^{\frac{m}{n}}.$
這樣, 即證得原定理對一切有理數成立. 利用其連續性或單調性可以證明, 原定理對無理數也成立. $\blacksquare$

下面, 我們對 Poisson 過程簡要介紹:
考慮來到某個交換機得電話呼叫數. 假定它具有以下三個性質:

平穩性: 在 $[t_{0}, t_{0} + t)$ 時間中來到交換機得呼叫數只和時間間隔長度 $t$ 有關, 而與時間起點 $t_{0}$ 無關. 若以 $P_{k}(t)$ 記在長度 $t$ 的時間區間中來到 $k$ 個呼叫的概率, 當然 $\sum^{\infty}_{k = 0}P_{k}(t) = 1$ 對任何 $t > 0$ 成立.
過程的平穩性表示了 它的概率規律不隨時間的推移而發生改變.

獨立增量性 (無後效性):
“在 $[t_{0},t_{0} + t)$ 內來到 $k$ 個呼叫” 這一事件和時刻 $t_{0}$ 之前所發生的事件獨立.
獨立增量性表明, 在互不相交的時間區間內過程的進行具有 相互獨立性.

普通性:
在充分小的時間間隔中, 最多來到一個呼叫. 也就是: 若記
$\phi(t) = \sum_{k=2}^{\infty}P_{k}(t) = 1-P_{0}(t) - P_{1}(t)$
應有 $\phi(t) = o(t)$ . 即:
$\lim_{t \rightarrow 0}\frac{\phi(t)}{t} = 0$
普通性表明, 不可能在同一時間瞬間有兩個或以上數量的呼叫到來.

下面, 我們求 $P_{k}(t).$

對 $\Delta t >0$ , 考慮 $[0,t+\Delta t)$ 中來到 $k$ 個呼叫的概率 $P_{k}(t + \Delta t)$ , 由獨立增量性和全概率公式
$P_{k}(t+\Delta t) = P_{k}(t)P_{0}(t) + P_{k-1}(t)P_{1}(t) + \cdots + P_{0}(t)P_{k}(t), \ \ \ k \geqslant 0.$
特別地:
$P_{0}(t + \Delta t) = P_{0}(t)P_{0}(\Delta t)$
$P_{0}(t)$ 表示在長度爲 $t$ 的時間間隔中沒有來呼叫的概率. 因此它關於 $t$ 是單調減少的. 由 Cauchy引理:
$P_{0}(t) = a^{t}.$
其中 $a \geqslant 0$ , 若 $a = 0$ , 則 $P_{0}(t) \equiv 0$ , 這說明, 無論時間間隔多短, 時間間隔內都會來呼叫. 因此, 在有限的時間間隔中要應答無窮多個呼叫, 這種情況不屬於考慮範圍之內. 此外, 因 $P_{0}(t)$ 是概率, 因此應有 $a \leqslant 1$ . 而當 $a = 1$ 時, $P_{0}(t) \equiv 1$ . 這表明呼叫永不會到來, 也不屬於我們考慮的情形. 因此, 應有 $0<a<1$ . 從而存在 $\lambda >0$ , 使:
$P_{0}(t) = e^{-\lambda t}.$
因此, 當 $\Delta t \rightarrow 0$ 時, 我們有:
$P_{0}(\Delta t) = e^{-\lambda t} = 1-\lambda \Delta t + o(\Delta t).$
$P_{1}(\Delta t) = 1-P_{0}(\Delta t)- \phi(\Delta t) = \lambda \Delta t + o\Delta t).$ $\sum_{l=2}^{\infty}P_{k-l}(t)P_{l}(\Delta t) \leqslant \sum_{l=2}^{\infty}P_{l}(\Delta t) = \phi(\Delta t) = o(\Delta t).$
$(k \geqslant 1)$
因此知:
$P_{k}(t + \Delta t) = P_{k}(t)(1-\lambda \Delta t) + P_{k-1}(t)*\lambda \Delta t + o(\Delta t)$
$(k \geqslant 1)$
令 $\Delta t \rightarrow 0$ , 得:
$P_{k}'(t) = \lambda[P_{k-1}(t) - P_{k}(t)] + o(1)$
$(k \geqslant 1)$
由於已知 $P_{0}(t) = e^{-\lambda t}$ , 故有 $P'_{1}(t) = \lambda[e^{-\lambda t} - P_{1}(t)]$ , 可解得 $P_{1}(t) = \lambda te^{-\lambda t}$ . 這樣, 可依次解得一切 $P_{k}(t)$ .

$P_{k}(t) = \frac{(\lambda t)^{k}}{k!}e^{-\lambda t}, \ \ \ \ \ k =0,1,2,\cdots$
這正是 Poisson 分佈, 參數爲 $\lambda t$ .

2.4 二項分佈和泊松分佈

§4 二項分佈與 Poisson 分佈

文章目錄

4.1 二項分佈的性質和計算

4.1.1 二項分佈的計算

4.1.2 二項分佈的性質

4.1.3 產品抽樣驗收和 $(n,c)$ 方案

4.2 二項分佈的Poisson逼近

4.3 Poisson分佈

DAPPER 事務 TRANSACTION

2.1 條件概率，全概率公式，Bayes公式

MATLAB數據統計和分析：常用統計量和隨機數生成

2.4 二項分佈和泊松分佈

完全關閉Win10的任務欄鼠標懸停時預覽

第四章:隨機變量的數字特徵和特徵函數

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

2.4 二項分佈和泊松分佈

§4 二項分佈與 Poisson 分佈

文章目錄

4.1 二項分佈的性質和計算

4.1.1 二項分佈的計算

4.1.2 二項分佈的性質

4.1.3 產品抽樣驗收和 (n,c)(n,c)(n,c) 方案

4.2 二項分佈的Poisson逼近

4.3 Poisson分佈

4.1.3 產品抽樣驗收和 $(n,c)$ 方案