統計-均值,期望,方差,協方差,協方差矩陣

均值

均值(mean value)是針對既有的數值全部加起來,做平均值(除以總個數),就叫做均值.其條件是一直樣本所有的數據和總數,表示樣本總體的平均取值.

X=i=1,nXi

期望

數學期望(mean)(或均值,亦簡稱期望)是試驗中每次可能結果的概率乘以其結果的總和,反映隨機變量平均取值的大小。其條件是樣本不可能所有值都得到,但是可以知道樣本的取值以及取該值在樣本總體下的概率,得出的是樣本的加權平均,權重就是樣本取值的概率。

EX=i=1,nPiXi

在樣本值足夠大的情況下,均值趨向於期望

方差

方差(variance)是在概率論和統計方差衡量隨機變量或一組數據時離散程度的度量。
* 概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度。
* 統計中的方差(樣本方差)是各個數據分別與其平均數之差的平方的和的平均數。
之所以除以n-1而不是除以n,是因爲這樣能使我們以較小的樣本集更好的逼近總體的標準差,即統計上所謂的“無偏估計”。而方差則僅僅是標準差的平方。

EX=1n1i=1,n(XiX)2

協方差

協方差是用來度量兩個隨機變量關係的統計量,如果結果爲正值,則說明兩者是正相關的,如果結果爲負值,就說明兩者是負相關,如果爲0,則兩者之間沒有關係,就是統計上說的“相互獨立”。相比於標準差和方差(用來描述一維數據的),可以用來描述二維數據的相關性。

cov(X,Y)=i=1,n(XiX)(YiY)n1

協方差矩陣

在統計學與概率論中,協方差矩陣的每個元素是各個向量元素之間的協方差。是從標量隨機變量到高維度隨機向量的自然推廣。協方差矩陣計算的是不同維度之間的協方差,而不是不同樣本之間的。

cov(x1,y1cov(x2,y1...cov(xn,y1cov(x1,y2)cov(x2,y2)...cov(xn,y2)............cov(x1,yn)cov(x2,yn)...cov(xn,yn)

可見,協方差矩陣是一個對稱的矩陣,而且對角線是各個維度上的方差。
協方差矩陣的航和列相等並取決於樣本的維度,大小爲維度數量,詳細解釋件參考 2.

參考

方差
協方差

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章