方差、協方差、標準差、均方差、均方根值、均方誤差、均方根誤差

  方差、協方差、標準差(標準偏差/均方差)、均方誤差、均方根誤差(標準誤差)、均方根值

本文由博主經過查閱網上資料整理總結後編寫,如存在錯誤或不恰當之處請留言以便更正,內容僅供大家參考學習。


  • 方差(Variance)

       方差用於衡量隨機變量或一組數據的離散程度,方差在在統計描述和概率分佈中有不同的定義和計算公式。①概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度;②統計中的方差(樣本方差)是每個樣本值與全體樣本均值之差的平方值的平均數,代表每個變量與總體均值間的離散程度。

概率論中計算公式

離散型隨機變量的數學期望: 

                                                                                                           ---------求取期望值

連續型隨機變量的數學期望:

                                                                                                    ----------求取期望值

其中,pi是變量,xi發生的概率,f(x)是概率密度。

                                                     ---------求取方差值

 

統計學中計算公式

 總體方差也叫做有偏估計,其實就是我們從初高中就學到的那個標準定義的方差:

                                                                                              -----------求取總體均值

其中,n表示這組數據個數,x1、x2、x3……xn表示這組數據具體數值。

                                                    ------------求取總體方差

其中,\bar{X}爲數據的平均數,n爲數據的個數,s^{2}爲方差。

樣本方差,無偏方差,在實際情況中,總體均值\bar{X}是很難得到的,往往通過抽樣來計算,於是有樣本方差,計算公式如下

                                                    --------------求取樣本方差           

此處,爲什麼要將分母由n變成n-1,主要是爲了實現無偏估計減小誤差,請閱讀《爲什麼樣本方差的分母是 n-1》。    

  • 協方差(Covariance

      協方差概率論統計學中用於衡量兩個變量的總體誤差。而方差是協方差的一種特殊情況,即當兩個變量是相同的情況。協方差表示的是兩個變量的總體的誤差,這與只表示一個變量誤差的方差不同。 如果兩個變量的變化趨勢一致,也就是說如果其中一個大於自身的期望值,另外一個也大於自身的期望值,那麼兩個變量之間的協方差就是正值。 如果兩個變量的變化趨勢相反,即其中一個大於自身的期望值,另外一個卻小於自身的期望值,那麼兩個變量之間的協方差就是負值。

formula

formula

其中,E[X]與E[Y]分別爲兩個實數隨機變量X與Y的數學期望,Cov(X,Y)爲X,Y的協方差。

  •  標準差(Standard Deviation)

       標準差也被稱爲標準偏差,在中文環境中又常稱均方差,是數據偏離均值的平方和平均後的方根,用σ表示。標準差是方差的算術平方根。標準差能反映一個數據集的離散程度,只是由於方差出現了平方項造成量的倍數變化,無法直觀反映出偏離程度,於是出現了標準差,標準偏差越小,這些值偏離平均值就越少,反之亦然。

 

                                                                                               ------------求取樣本標準差

其中,  代表所採用的樣本X1,X2,...,Xn的均值。

                                                                                                 -------------求取總體標準差

 其中, 代表總體X的均值。

:有一組數字分別是200、50、100、200,求它們的樣本標準偏差。

= (200+50+100+200)/4 = 550/4 = 137.5

= [(200-137.5)^2+(50-137.5)^2+(100-137.5)^2+(200-137.5)^2]/(4-1)

樣本標準偏差 S = Sqrt(S^2)=75

  • 均方誤差(mean-square error, MSE

       均方誤差是反映估計量與被估計量之間差異程度的一種度量,換句話說,參數估計值與參數真值之差的平方的期望值。MSE可以評價數據的變化程度,MSE的值越小,說明預測模型描述實驗數據具有更好的精確度。

  • 均方根誤差(root mean squared error,RMSE

      均方根誤差亦稱標準誤差,是均方誤差的算術平方根。換句話說,是觀測值與真值(或模擬值)偏差(而不是觀測值與其平均值之間的偏差)的平方與觀測次數n比值的平方根,在實際測量中,觀測次數n總是有限的,真值只能用最可信賴(最佳)值來代替。標準誤差對一組測量中的特大或特小誤差反映非常敏感,所以,標準誤差能夠很好地反映出測量的精密度。這正是標準誤差在工程測量中廣泛被採用的原因。因此,標準差是用來衡量一組數自身的離散程度,而均方根誤差是用來衡量觀測值同真值之間的偏差。

  • 均方根值(root-mean-square,RMES

       均方根值也稱作爲方均根值有效值在數據統計分析中,將所有值平方求和,求其均值,再開平方,就得到均方根值。在物理學中,我們常用均方根值來分析噪聲。

        比如幅度爲100V而佔空比爲0.5的方波信號,如果按平均值計算,它的電壓只有50V,而按均方根值計算則有70.71V。這是爲什麼呢?舉一個例子,有一組100伏的電池組,每次供電10分鐘之後停10分鐘,也就是說佔空比爲一半。如果這組電池帶動的是10Ω電阻,供電的10分鐘產生10A 的電流和1000W的功率,停電時電流和功率爲零。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章