如果隨機變量X的所有可能取值不可以逐個列舉出來,而是取數軸上某一區間內的任意點,那麼稱之爲連續型隨機變量。例如,一批電子元件的壽命、實際中常遇到的測量誤差等都是連續型隨機變量。
>>>>
連續型隨機變量X無法像離散型隨機變量一樣,給出其取每一個點時的概率,那麼換一種思路,來研究隨機變量落入一個區間 的概率 ,當區間 接近無窮小時,這時我們使用概率密度來表示概率值。什麼是概率密度?
假設有一組零件,由於各種因素的影響,其長度是各不相同的。具體數值如下。
[171.671,172.04,171.67,172.40,172.70,172.164,171.71,172.68,172.13,171.97,172.266,171.81,172.15,172.45,172.20,172.600,172.24,171.39,172.17,171.2]
按前面離散型隨機變量的思路,要將數據分組,對應每個組計算出其相應的概率值,並繪製概率分佈直方圖,如下圖所示。
連續型隨機變量分組後的概率分佈直方圖
圖中的橫座標是隨機變量值,縱座標是隨機變量落入該值範圍內的概率。直方圖的邊緣看起來有點粗糙,但當我們把樣本數據和分組數同時增加時,輪廓就會越來越細緻,接近於如圖所示的曲線,這條曲線對應的函數就稱爲概率密度函數。由此思路,得到概率密度的數學描述如下。
考慮連續隨機變量 落入區間區間 的概率,由概率分佈函數 的定義可知 ,令 ,則設
如果該極限存在,則稱 爲在 點處的概率密度。
概率密度 反映出概率在 點處的密集程度,可以設想一根的質量不均勻的金屬桿,總質量爲1,概率密度相當於杆上各點處的質量密度。
根據導數的定義可知:
從上式中可得結論:若 在處連續,則概率密度函數 是分佈函數 的導函數。
設 爲連續型隨機變量, 在任意區間(a,b]上的概率可以表示爲:
其中 就叫作X的概率密度函數。
下圖形象描繪出概率密度函數 和概率 之間的關係。概率 被看成曲線下的面積,用數學公式描述就是一個積分形式。
概率密度函數和概率P
連續型隨機變量X的分佈函數,也可寫成:
概率密度函數和分佈函數具有以下性質。
(1)非負函數: 。
(2)規範性: 。
(3)對於任何常數a<b,有:
假設某零件誤差量在區間(-4,4)均勻分佈,計算誤差量爲1~3的概率。
解:設隨機抽取一個零件的誤差量爲X,隨機變量X在區間(-4,4)上均勻分佈,X落在該區間任意點的概率相同,即概率密度爲一常量。
設 , ,即
可得:概率密度函數 其他
在區間[1,3]之間的概率 。
下圖中顯示均勻分佈對應的概率密度函數和分佈函數。
均勻分佈對應的概率密度函數和分佈函數
在Python中輸出正態分佈概率密度函數和對應的概率分佈函數。
解:如果一個隨機變量X具有概率密度函數
則稱隨機變量X爲正態分佈隨機變量,並記爲 。
下面代碼模擬實現了一個均值 爲0和方差σ2爲1的正態分佈。
【代碼如下】
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats
def test_norm_pmf():
# 正態分佈是一種連續分佈,其函數可以在實線上的任何地方取值
# 正態分佈由兩個參數描述:分佈的平均值μ和方差σ2
mu = 0 # mean
sigma = 1#standard deviation
x = np.arange(-5,5,0.1) #生成隨機數x
#得到對應的概率值y
y = (1/(np.sqrt(2*np.pi*sigma*sigma)))*np.exp(-(((x-mu)**2)/(2*sigma*sigma)))
fig, (ax0, ax1) = plt.subplots(ncols=2, figsize=(10, 5))
ax0.plot(x, y)
ax1.plot(x,stats.norm.cdf(x,0,1))
ax0.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu,sigma))
ax0.set_xlabel('x')
ax0.set_ylabel('Probability density', fontsize=15)
ax1.set_title('Normal: $\mu$=%.1f, $\sigma^2$=%.1f' % (mu, sigma))
ax1.set_xlabel('x')
ax1.set_ylabel('Cumulative density', fontsize=15)
fig.subplots_adjust(wspace=0.4)
plt.show()
test_norm_pmf()
【運行結果】
如下圖所示。
正態分佈對應的概率密度函數和分佈函數
自然界中許多隨機指標都服從一種“中間高,兩頭低”的概率特性。例如,一門課程的考試成績,人的身高、體重等。
正態分佈這種“鐘形曲線”很好地反映了現實世界中的中間高、兩頭低的隨機現象。
推薦閱讀
《人工智能數學基礎》
***粉絲福利時間***
評論區留言,點贊數前10可獲得此書!!!
以72個小時計!
注:若是在活動截止日期後24小時內無法取得用戶回覆或聯繫,將按照留言點贊排名順延。