協方差矩陣的向量表示推導

對多維隨機變量X=[X1,X2,…,Xn]T ，我們往往需要計算各維度之間的協方差，這樣協方差就組成了一個n×n 的矩陣，稱爲協方差矩陣。協方差矩陣是一個對角矩陣，對角線上的元素是各維度上隨機變量的方差。我們定義協方差爲Σ , 矩陣內的元素Σij 爲

Σ i j = c o v (X i, X j) = E [(X i - E (X i)) (X j - E (X j))]

協方差矩陣爲

Σ = E [(X - E (X)) (X - E (X)) T]

= ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ c o v (X 1, X 1) c o v (X 2, X 1) ⋮ c o v (X n, X 1) c o v (X 1, X 2) c o v (X 2, X 2) ⋮ c o v (X n, X 2,) \dots \dots ⋮ \dots c o v (X 1, X n) c o v (X 2, X n) ⋮ c o v (X n, X n) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

與上面的協方差矩陣相同，只是矩陣內各元素以樣本的協方差替換。假設數據集T={xi}mi=1 表示m個樣本，每個樣本表示爲xi=(xi1,xi2,…,xin)T 。所有樣本可以組成一個m×n 的矩陣。

X m \times n = ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ x 11 x 21 ⋮ x m 1 x 12 x 22 ⋮ x m 2 \dots \dots ⋮ \dots x 1 n x 2 n ⋮ x m n ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ = [c 1, c 2, \dots, c n]

每一行代表一個對象，每一類代表一個維度，協方差矩陣，是求維度之間的相關性，而不是對象之間的，所以協方差矩陣的大小與維度相同。

ci 表示第i維的隨機變量。
假設

x¯=(x¯1,x¯2,…,x¯n) , 則有

E(ci)=x¯i 。
用

Σ^ 表示樣本的協方差矩陣，則有

Σ^= ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ c o v (c 1, c 1) c o v (c 2, c 1) ⋮ c o v (c n, c 1) c o v (c 1, c 2) c o v (c 2, c 2) ⋮ c o v (c n, c 2,) \dots \dots ⋮ \dots c o v (c 1, c n) c o v (c 2, c n) ⋮ c o v (c n, c n) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

= 1 m - 1 ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ \sum m i = 1 (x i 1 - x ¯ 1) (x i 1 - x ¯ 1) \sum m i = 1 (x i 2 - x ¯ 2) (x i 1 - x ¯ 1) ⋮ \sum m i = 1 (x i n - x ¯ n) (x i 1 - x ¯ 1) \sum m i = 1 (x i 1 - x ¯ 1) (x i 2 - x ¯ 2) \sum m i = 1 (x i 2 - x ¯ 2) (x i 2 - x ¯ 2) ⋮ \sum m i = 1 (x i n - x ¯ n) (x i 2 - x ¯ 2) \dots \dots ⋮ \dots \sum m i = 1 (x i 1 - x ¯ 1) (x i n - x ¯ n) \sum m i = 1 (x i 2 - x ¯ 2) (x i n - x ¯ n) ⋮ \sum m i = 1 (x i n - x ¯ n) (x i n - x ¯ n) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥

= 1 m - 1 \sum m i = 1 ⎡ ⎣ ⎢ ⎢ ⎢ ⎢ ⎢ (x i 1 - x ¯ 1) (x i 1 - x ¯ 1) (x i 2 - x ¯ 2) (x i 1 - x ¯ 1) ⋮ (x i n - x ¯ n) (x i 1 - x ¯ 1) (x i 1 - x ¯ 1) (x i 2 - x ¯ 2) (x i 2 - x ¯ 2) (x i 2 - x ¯ 2) ⋮ (x i n - x ¯ n) (x i 2 - x ¯ 2) \dots \dots ⋮ \dots (x i 1 - x ¯ 1) (x i n - x ¯ n) (x i 2 - x ¯ 2) (x i n - x ¯ n) ⋮ (x i n - x ¯ n) (x i n - x ¯ n) ⎤ ⎦ ⎥ ⎥ ⎥ ⎥ ⎥

= 1 m - 1 \sum m i = 1 (x i - x ¯) (x i - x ¯) T

這裏分母爲m−1是因爲隨機變量的數學期望未知，以樣本均值代替，自由度減一。