主成分分析PCA


       PCA(Principal components Analysis)即主成分分析,是图像处理中经常用的降维方法,因为在图像提取相应的特征如颜色,纹理,SIFT,SURF等特征,但是一副图像中有很多个这种特征点,梅哥特征点又有一个相应的描述该特征点的128维的向量,因此需要降维,提高效率。

     理解一:主成分分析(最近重构性):多指标(存在一定相关性,信息重叠)转化成少数几个线性无关综合指标,还可以反映原来的变量的信息。方式通过线性组合实现,也就是主成分分析的公式。

     理解二:主成分分析(最大可分性):通过变换把数据变换到一个新的座标系统中,几个主成分就对应一个座标,就是维度(3个主成分就是三维空间,)使得任何数据投影的第一大方差在第一座标(第一主成分)上,第二大方差在第二个座标(第二主成分)上。主成分分析经常用减少数据集的维数,同时保持数据集对方差贡献最大的特征,通过保留低阶主成分,忽略高阶主成分。样本点在新空间中超平面的投降,所有的样本点投影能尽可能分开,则应投影后样本点的方差最大化

     主成分分析法是一种数学变换的方法, 它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,I个变量就有I个主成分


主成分分析的计算步骤

① 计算相关系数矩阵,各个特征值之间的相关性


② 计算相关性系数矩阵特征值与特征向量


③ 计算主成分贡献率及累计贡献率



④ 计算主成分载荷


基础公式


    协方差:


     主成分分析法通过研究指标体系的内在结构关系,从而将多个指标转化为少数几个相互独立且包含原来指标大部分信息(80%85%以上)的综合指标。其优点在于它确定的权数是基于数据分析而得出的指标之间的内在结构关系,不受主观因素的影响,有较好的客观性,而且得出的综合指标(主成分)之间相互独立,减少信息的交叉,这对分析评价极为有利。

主成分

Y1

Y2

Y3

Y4

特征根

贡献率(%)

累计贡献率

11.1134

65.37

65.37

2.6656

15.68

81.05

0.9126

5.37

86.42

0.7052

4.15

90.57


发布了135 篇原创文章 · 获赞 274 · 访问量 130万+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章