【文末有福利】連續型隨機變量及實例詳解

如果隨機變量X的所有可能取值不可以逐個列舉出來,而是取數軸上某一區間內的任意點,那麼稱之爲連續型隨機變量。例如,一批電子元件的壽命、實際中常遇到的測量誤差等都是連續型隨機變量。

>>>>

連續型隨機變量X無法像離散型隨機變量一樣,給出其取每一個點時的概率,那麼換一種思路,來研究隨機變量落入一個區間   的概率   ,當區間   接近無窮小時,這時我們使用概率密度來表示概率值。什麼是概率密度?

假設有一組零件,由於各種因素的影響,其長度是各不相同的。具體數值如下。

[171.671,172.04,171.67,172.40,172.70,172.164,171.71,172.68,172.13,171.97,172.266,171.81,172.15,172.45,172.20,172.600,172.24,171.39,172.17,171.2]

按前面離散型隨機變量的思路,要將數據分組,對應每個組計算出其相應的概率值,並繪製概率分佈直方圖,如下圖所示。

連續型隨機變量分組後的概率分佈直方圖

圖中的橫座標是隨機變量值,縱座標是隨機變量落入該值範圍內的概率。直方圖的邊緣看起來有點粗糙,但當我們把樣本數據和分組數同時增加時,輪廓就會越來越細緻,接近於如圖所示的曲線,這條曲線對應的函數就稱爲概率密度函數。由此思路,得到概率密度的數學描述如下。

考慮連續隨機變量   落入區間區間   的概率,由概率分佈函數    的定義可知   ,令   ,則設

   

如果該極限存在,則稱   爲在   點處的概率密度。

概率密度   反映出概率在   點處的密集程度,可以設想一根的質量不均勻的金屬桿,總質量爲1,概率密度相當於杆上各點處的質量密度。

根據導數的定義可知:

   

從上式中可得結論:若   在處連續,則概率密度函數   是分佈函數   的導函數。

設   爲連續型隨機變量,   在任意區間(a,b]上的概率可以表示爲:

   

其中   就叫作X的概率密度函數。

下圖形象描繪出概率密度函數   和概率   之間的關係。概率   被看成曲線下的面積,用數學公式描述就是一個積分形式。

   

概率密度函數和概率P

連續型隨機變量X的分佈函數,也可寫成:

   

概率密度函數和分佈函數具有以下性質。

(1)非負函數:   。

(2)規範性:   。

(3)對於任何常數a<b,有:

   

假設某零件誤差量在區間(-4,4)均勻分佈,計算誤差量爲1~3的概率。

解:設隨機抽取一個零件的誤差量爲X,隨機變量X在區間(-4,4)上均勻分佈,X落在該區間任意點的概率相同,即概率密度爲一常量。

設   ,   ,即   

可得:概率密度函數   其他  

   在區間[1,3]之間的概率   。

下圖中顯示均勻分佈對應的概率密度函數和分佈函數。

均勻分佈對應的概率密度函數和分佈函數

在Python中輸出正態分佈概率密度函數和對應的概率分佈函數。

解:如果一個隨機變量X具有概率密度函數

   

則稱隨機變量X爲正態分佈隨機變量,並記爲   。

下面代碼模擬實現了一個均值   爲0和方差σ2爲1的正態分佈。

【代碼如下】

import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
def test_norm_pmf():
# 正態分佈是一種連續分佈,其函數可以在實線上的任何地方取值
# 正態分佈由兩個參數描述:分佈的平均值μ和方差σ2 
mu = 0 # mean
sigma = 1#standard deviation
x = np.arange(-5,5,0.1)     #生成隨機數x
#得到對應的概率值y
y = (1/(np.sqrt(2*np.pi*sigma*sigma)))*np.exp(-(((x-mu)**2)/(2*sigma*sigma)))
fig, (ax0, ax1) = plt.subplots(ncols=2, figsize=(10, 5))
ax0.plot(x, y)
ax1.plot(x,stats.norm.cdf(x,0,1))
ax0.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu,sigma))
ax0.set_xlabel('x')
ax0.set_ylabel('Probability density', fontsize=15)
ax1.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu, sigma))
ax1.set_xlabel('x')
ax1.set_ylabel('Cumulative density', fontsize=15)
fig.subplots_adjust(wspace=0.4)
plt.show()
test_norm_pmf()

【運行結果】

如下圖所示。

正態分佈對應的概率密度函數和分佈函數

自然界中許多隨機指標都服從一種“中間高,兩頭低”的概率特性。例如,一門課程的考試成績,人的身高、體重等。

正態分佈這種“鐘形曲線”很好地反映了現實世界中的中間高、兩頭低的隨機現象。

推薦閱讀

《人工智能數學基礎》


***粉絲福利時間***

評論區留言,點贊數前10可獲得此書!!!

72個小時計!

注:若是在活動截止日期後24小時內無法取得用戶回覆或聯繫,將按照留言點贊排名順延。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章