exercise7

开始聚类和PCA的学习了,后面的确越来越难了。但是聚类的原理还算是比较简单的。

聚类的联系比较简单。题目完成了几乎所有麻烦的部分,我们需要做的就是算法的精华部分,总共有两点:

1.找到与一个点最近的中心点

2.对这些暂时在一类的点求取一个平均值,将这个平均值更新为中心点

之后就进行PCA的学习了,主要目的就是将三维数据在保证最大精确度的情况下投影到二维空间中。

函数都是很简单的,几乎都是几句话就完事的。直接看上传的代码就好,关键是对PCA的理解是否到位。

点击打开链接绝对推荐http://blog.csdn.net/xiaojidan2011/article/details/11595869

在学习PCA的时候懂了大半。看完之后,起码博客中的东西完全懂了。

其实PCA就是降维,那么要思考的问题就是该如何降维,如何去评判降维的结果好坏。所以就借助了向量内积。向量内积的含义就是做投影。这样就提供了一个基本思路。我们只要把样本投影到低维向量就好了。那如何评判投影的好坏呢。重点在于区分度。投影得到的点的区分度越大,说明投影结果越好,如何评判区分度呢,那就需要用方差了。对于二维向量投影到一维向量肯定是很容易的,直接用方差。但是如果对于更高维的呢,该怎么办。所以我们需要使用协方差。不同维度之间会产生不同维度的协方差,那该如何更好的统计,所以需要协方差矩阵,我们想要得到的就是除了对角线,其他位置趋于0,对角线位置,调出最大的前K位就得出最后结果啦。伟大的数学告诉我们实对称矩阵是肯定能得出正确结果的,所以最后也得出了我们想要的结果,至此结束。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章