均值
均值(mean value)是針對既有的數值全部加起來,做平均值(除以總個數),就叫做均值.其條件是一直樣本所有的數據和總數,表示樣本總體的平均取值.
X−=∑i=1,nXi
期望
數學期望(mean)(或均值,亦簡稱期望)是試驗中每次可能結果的概率乘以其結果的總和,反映隨機變量平均取值的大小。其條件是樣本不可能所有值都得到,但是可以知道樣本的取值以及取該值在樣本總體下的概率,得出的是樣本的加權平均,權重就是樣本取值的概率。
EX=∑i=1,nPiXi
在樣本值足夠大的情況下,均值趨向於期望
方差
方差(variance)是在概率論和統計方差衡量隨機變量或一組數據時離散程度的度量。
* 概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度。
* 統計中的方差(樣本方差)是各個數據分別與其平均數之差的平方的和的平均數。
之所以除以n-1而不是除以n,是因爲這樣能使我們以較小的樣本集更好的逼近總體的標準差,即統計上所謂的“無偏估計”。而方差則僅僅是標準差的平方。
EX=1n−1∑i=1,n(Xi−X−)2
協方差
協方差是用來度量兩個隨機變量關係的統計量,如果結果爲正值,則說明兩者是正相關的,如果結果爲負值,就說明兩者是負相關,如果爲0,則兩者之間沒有關係,就是統計上說的“相互獨立”。相比於標準差和方差(用來描述一維數據的),可以用來描述二維數據的相關性。
cov(X,Y)=∑i=1,n(Xi−X−)(Yi−Y−)n−1
協方差矩陣
在統計學與概率論中,協方差矩陣的每個元素是各個向量元素之間的協方差。是從標量隨機變量到高維度隨機向量的自然推廣。協方差矩陣計算的是不同維度之間的協方差,而不是不同樣本之間的。
⎛⎝⎜⎜⎜⎜cov(x1,y1)cov(x2,y1)...cov(xn,y1)cov(x1,y2)cov(x2,y2)...cov(xn,y2)............cov(x1,yn)cov(x2,yn)...cov(xn,yn)⎞⎠⎟⎟⎟⎟
可見,協方差矩陣是一個對稱的矩陣,而且對角線是各個維度上的方差。
協方差矩陣的航和列相等並取決於樣本的維度,大小爲維度數量,詳細解釋件參考 2.