哲哲的ML笔记(二十七:无监督学习简要介绍)

无监督学习 vs 有监督学习

监督学习中,我们有一个有标签的训练集,我们的目标是找到能够区分正样本和负样本的决策边界

在非监督学习中,我们的数据没有附带任何标签,我们拿到的数据就是这样


在这里我们有一系列点,却没有标签y
在非监督学习中,我们需要将一系列无标签的训练数据,输入到一个算法中,然后我们告诉这个算法,快去为我们找找这个数据的内在结构给定数据。我们可能需要某种算法帮助我们寻找一种结构。图上的数据看起来可以分成两个分开的点集(称为簇),一个能够找到我圈出的这些点集的算法,就被称为聚类算法(后面会介绍)。

无监督学习应用

  1. 市场分割。也许你在数据库中存储了许多客户的信息,而你希望将他们分成不同的客户群,这样你可以对不同类型的客户分别销售产品或者分别提供更适合的服务。
  2. 社交网络分析:事实上有许多研究人员正在研究这样一些内容,他们关注一群人,关注社交网络,例如Facebook,Google+,或者是其他的一些信息,比如说:你经常跟哪些人联系,而这些人又经常给哪些人发邮件,由此找到关系密切的人群。因此,这可能需要另一个聚类算法,你希望用它发现社交网络中关系密切的朋友。
  3. 组织计算机集群,或者管理数据中心。计算机经常协作工作。那么,你可以重新分配资源,重新布局网络。由此优化数据中心,优化数据通信。
  4. 星系的形成。用这个知识,了解一些天文学上的细节问题。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章