吳恩達機器學習筆記一

1、監督學習(Supervised Learning)

     監督學習,即爲教計算機如何去完成預測任務(有反饋),預先給一定數據量的輸入和對應的結果,建模擬合,最後讓計算機預測未知數據的結果。

     監督學習一般有兩種:

     1.1、迴歸問題(Regression):迴歸問題即爲預測一系列的連續值。

     在房屋價格預測的例子中,給出了一系列的房屋面基數據,根據這些數據來預測任意麪積的房屋價格。

     1.2、分類問題:分類問題即爲預測一系列的離散值。即根據數據預測被預測對象屬於哪個分類。視頻中舉了癌症腫瘤這個例子,針對診斷結果,分別分類爲良性或惡性。還例如垃圾郵件分類問題,也同樣屬於監督學習中的分類問題。

     視頻中提到支持向量機這個算法,旨在解決當特徵量很大的時候(特徵即如癌症例子中的腫塊大小,顏色,氣味等各種特徵),計算機內存一定會不夠用的情況。支持向量機能讓計算機處理無限多個特徵。

2、無監督學習(Unsupervised Learning)

     相對於監督學習,訓練集不會有人爲標註的結果(無反饋),我們不會給出結果或無法得知訓練集的結果是什麼樣,而是單純由計算機通過無監督學習算法自行分析,從而“得出結果”。計算機可能會把特定的數據集歸爲幾個不同的簇,故叫做聚類算法。

     無監督學習一般分爲兩種: 

     2.1、聚類(Clustering)

     新聞聚合:在例如谷歌新聞這樣的網站中,每天后臺都會收集成千上萬的新聞,然後將這些新聞分組成一個個的新聞專題,這樣一個又一個聚類,就是應用了無監督學習的結果。

     DNA 個體聚類

     天文數據分析

     市場細分

     社交網絡分析

 

     2.2、非聚類(Non-clustering)

     雞尾酒問題

     在雞尾酒會上,大家說話聲音彼此重疊,幾乎很難分辨出面前的人說了什麼。我們很難對於這個問題進行數據標註,而這裏的通過機器學習的無監督學習算法,就可以將說話者的聲音同背景音樂分離出來。

     神奇的一行代碼:

     [w,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章