程序員的自我修養之數學基礎11:期望、方差、常見分佈(均勻分佈、二項分佈、泊松分佈、正態分佈)

目錄

一、期望

1. 離散型隨機變量的期望

2. 連續型隨機變量的期望

3. 期望的性質

二、方差和均方差

1. 定義

2. 計算

三、常見分佈

1. 均勻分佈

2. 二項分佈和幾何分佈

3. 泊松分佈

4. 正態分佈


一、期望

期望這個概念,初高中就學過了吧,所以這裏就簡單說一下定義。

1. 離散型隨機變量的期望

\bg_white E(X)=\sum_{k=1}^{n}x_kp_k

2. 連續型隨機變量的期望

\bg_white E(X)=\int_{-\infty}^{+\infty}xf(x)dx

3. 期望的性質

  • E(cX)=xE(x)
  • E(X+Y)=E(x)+E(Y)
  • X,Y獨立時,E(XY)=E(X)E(Y)

二、方差和均方差

1. 定義

方差,主要用於研究隨機變量與其均值的偏離程度:

D(X)=E[X-E(X)]^2

均方差又稱標準差:

\sigma (X)=\sqrt{D(X)}=\sqrt{E[X-E(X)]^2}

2. 計算

設 g(X)=E[X-E(X)]^2,那麼,方差,就相當於g(X)的期望。

因此,對於離散型隨機變量,有:

D(X)=\sum_{k=1}^{n}[x_k-E(X)]^2p_k

對於連續型隨機變量,有:

D(X)=\int_{-\infty }^{+\infty }[x_k-E(X)]^2f(x)dx

3. 性質

  • 若c爲常數,則D(C)=0
  • 若X是隨機變量,C是常數,則有 D(CX)=C^2D(X)D(X+C)=D(X)
  • 若X,Y是連個隨機變量,則有D(X+Y)=D(X)+D(Y)+2E{(X-E(X))(Y-E(Y))}
  • 若X,Y相互獨立,則有D(X+Y)=D(X)+D(Y)

三、常見分佈

1. 均勻分佈

這個太簡單了,我都不想說了……

函數定義

概率分佈圖像: 

這裏寫圖片描述

 關於均勻分佈,我們還需要知道:

  • 期望:\bg_white E(x)=\frac{a+b}{2}
  • 方差:\bg_white D(x)=\frac{(b-a)^2}{12}

2. 二項分佈和幾何分佈

二項,二項,爲啥叫二項分佈呢?顧名思義,就是這個隨機事件只有兩種可能的結果,也就是所謂的“不成功便成仁”,因此,二項分佈也被稱爲0-1分佈。

二項分佈必須滿足下面4個特點:一是某件事情發生的次數(試驗次數)是固定的,一般用n來表示;二是每件事情都有兩個可能的結果(成功或失敗);三是每一次試驗中成功的概率都是相等的,一般用p來表示;四是我們感興趣的是成功x次的概率問題,也就是在n次試驗中x次的結果爲成功的概率

二次分佈的公式如下:

p(x)=C_n^x p^x (1-p)^{n-x}

關於二次分佈,你還要知道:

  • 期望E(x)=np(表示事情發生n次預計成功多少次)
  • 標準差\sigma (x)=\sqrt{np(1-p)}(表示數據的波動大小)

幾何分佈和二項分佈兼職就是“海爾兄弟”。幾何分佈也需要滿足4個特點,前三個和二次分佈完全一樣,不同的是,在幾何分佈問題中,我們感興趣的是,在第x次試驗中取得第一次成功的概率有多大。舉個例子,同樣是拋硬幣,拋5次,二項分佈可能關注,5次試驗中3次結果爲朝上的概率,而幾何分佈中,我們關注的是“只有第五次正面朝上的概率”,也就是說,前四次均失敗但第五次成功的概率。

幾何分佈的公式是這個樣子的:

\bg_white p(x)=(1-p)^{x-1}p

幾何分佈的期望\bg_white E(x)=\frac{1}{p},標準差\sigma (x)=\frac{1-p}{p^2}

3. 泊松分佈

泊松分佈(Poisson Distribution),一般用於描述在連續時間和空間單位上隨機事件的概率,也就是說,我們可以基於已有的經驗,預測該隨機事件在新的同樣長的時間裏或同樣大的空間中發生N次的概率。比如,機器在一定時間內故障的次數、汽車站臺在一定時間內的候車人數、某地區自然災害發生的次數等等。

泊松分佈需要滿足以下三個特點:

1)在給定區間內(可以是時間或者空間),事件是獨立事件

2)在任意相同的時間範圍內,事件發生的次數(概率)相同,一般用\lambda 表示該區間內事件的平均發生次數;

3)我們關注的是某個區間內,事件發生x次的概率。

Poisson分佈的概率函數爲:

在這裏,我們用到了指數函數e^{-\lambda},這裏的e是自然對數(ln)的底數,e\approx 2.718281828

泊松分佈的期望\bg_white E(x)=\lambda,方差爲\sigma (x)=\lambda

在二項分佈的p很小的時候,泊松分佈和二次分佈較爲接近。

4. 正態分佈

正態分佈(Normal distribution)又名高斯分佈(Gaussian distribution),是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面有着重大的影響力。

正態分佈的圖像,就是著名的“鐘形曲線”,如下圖所示:

正態分佈的期望\bg_white E(x)=\mu,方差\bg_white D(x)=\sigma ^2。若隨機變量X服從正態分佈,記爲X\sim N(\mu ,\sigma ^2)。正態分佈的概率密度函數爲:

我們常說的標準正態分佈,是指未知參數 \mu=0,尺度參數\sigma ^2=1的正態分佈。其表達式可以簡化爲:

正態分佈具有許多獨特的性質:

  • 密度函數關於平均值(即\mu、位置參數、期望)對稱
  • 平均值=衆數=中位數

 

參考:

http://www.360doc.com/content/17/1231/22/9200790_718001949.shtml

https://blog.csdn.net/ccnt_2012/article/details/81327881

https://blog.csdn.net/qq_23869697/article/details/80610361

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章