吳恩達機器學習筆記一

原創

2020-06-08 13:53

1、監督學習(Supervised Learning)

監督學習，即爲教計算機如何去完成預測任務（有反饋），預先給一定數據量的輸入和對應的結果，建模擬合，最後讓計算機預測未知數據的結果。

監督學習一般有兩種：

1.1、迴歸問題(Regression):迴歸問題即爲預測一系列的連續值。

在房屋價格預測的例子中，給出了一系列的房屋面基數據，根據這些數據來預測任意麪積的房屋價格。

1.2、分類問題：分類問題即爲預測一系列的離散值。即根據數據預測被預測對象屬於哪個分類。視頻中舉了癌症腫瘤這個例子，針對診斷結果，分別分類爲良性或惡性。還例如垃圾郵件分類問題，也同樣屬於監督學習中的分類問題。

視頻中提到支持向量機這個算法，旨在解決當特徵量很大的時候(特徵即如癌症例子中的腫塊大小，顏色，氣味等各種特徵)，計算機內存一定會不夠用的情況。支持向量機能讓計算機處理無限多個特徵。

相對於監督學習，訓練集不會有人爲標註的結果（無反饋），我們不會給出結果或無法得知訓練集的結果是什麼樣，而是單純由計算機通過無監督學習算法自行分析，從而“得出結果”。計算機可能會把特定的數據集歸爲幾個不同的簇，故叫做聚類算法。

無監督學習一般分爲兩種：

2.1、聚類(Clustering)

新聞聚合：在例如谷歌新聞這樣的網站中，每天后臺都會收集成千上萬的新聞，然後將這些新聞分組成一個個的新聞專題，這樣一個又一個聚類，就是應用了無監督學習的結果。

DNA 個體聚類

天文數據分析

市場細分

社交網絡分析

2.2、非聚類(Non-clustering)

雞尾酒問題

在雞尾酒會上，大家說話聲音彼此重疊，幾乎很難分辨出面前的人說了什麼。我們很難對於這個問題進行數據標註，而這裏的通過機器學習的無監督學習算法，就可以將說話者的聲音同背景音樂分離出來。

神奇的一行代碼：

[w,s,v] = svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.