概率论:协方差矩阵

一、协方差矩阵

1.1 从方差/协方差到协方差矩阵

根据方差的定义,给定dd个随机变量xk,i=1,2,...,dx_k,i=1,2,...,d,则这些随机变量的方差为:

σ(xk,xk)=1n1i=in(xkixk)2\sigma(x_k,x_k)={1\over n-1}\sum_{i=i}^n(x_{ki}-\overline{x}_k)^2

其中xkix_{ki}表示随机变量xkx_k中的第ii个观测样本,nn表示样本量,每个随机变量所对应的观测样本数均为nn

对于这些随机变量,我们还可以根据协方差的定义,求出两两之间的协方差,即:

σ(xm,xk)=1n1i=1n(xmixm)(xkixk)\sigma(x_m,x_k)={1\over n-1}\sum_{i=1}^n(x_{mi}-\overline{x}_m)(x_{ki}-\overline{x}_k)

为了表示这d个随机变量两两间的相关关系,提出了协方差矩阵的概念,协方差矩阵形式如下:

Σ=[σ(x1,x1)σ(x1,x2)σ(x1,xn)σ(x2,x1)σ(x2,x2)σ(x2,xn)σ(xn,x1)σ(xn,x2)σ(xn,xn)]Rd×d\Sigma=\begin{bmatrix}\sigma(x_1,x_1)&\sigma(x_1,x_2)&\dots&\sigma(x_1,x_n)\\\sigma(x_2,x_1)&\sigma(x_2,x_2)&\dots&\sigma(x_2,x_n)\\\vdots&\vdots&\ddots&\vdots\\\sigma(x_n,x_1)&\sigma(x_n,x_2)&\dots&\sigma(x_n,x_n)\end{bmatrix}\in R^{d\times d}

其中,对角线上的元素为各个随机变量的方差,非对角线上的元素为两两随机变量之间的协方差,根据协方差的定义,我们可以知道协方差矩阵是一个对称矩阵。

1.2 多元正态分布与线性变换

假设一个向量xx服从均值向量为μ\mu、协方差矩阵为Σ\Sigma的多元正态分布,则:

p(x)=12πΣe12(xμ)TΣ1(xμ)p(x)={1\over\sqrt{2\pi\Sigma}}e^{-{1\over2}(x-\mu)^T\Sigma^{-1}(x-\mu)}

令该分布的均值向量为μ=0\mu=0,由于指数项外面的系数2πΣ12|2\pi\Sigma|^{-{1\over2}}通常是常数,故可将多元正态分布简化为

p(x)exp(12xTΣ1x)p(x)\varpropto exp(-{1\over2}x^T\Sigma^{-1}x)

此时用二元正态分布实例化这个分布,令x=(y,z)Tx=(y,z)^T,包含两个随机变量yyzz,则协方差矩阵可写成如下形式:

Σ=[σ(y,y)σ(y,z)σ(z,y)σ(z,z)]R2×2\Sigma=\begin{bmatrix}\sigma(y,y)&\sigma(y,z)\\\sigma(z,y)&\sigma(z,z)\end{bmatrix}\in R^{2\times2}

假设这个协方差矩阵为单位矩阵,生成若干个随机数如下图所示:
在这里插入图片描述
在生成的若干个随机数中,每个点的似然为:

L(x)exp(12xTx)L(x)\varpropto exp(-{1\over2}x^Tx)

对上图中的每个点都考虑一步线性变换:t=A(x)t=A(x),我们可以得到图二:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章