Introduction- 介紹
1.什麼是機器學習
Arthur Samuel : the field of study that gives computers the ability to learn without being explicitly programmed.
亞瑟塞姆爾
認爲機器學習是指:使計算機無需進行明確編程即可學習的研究領域.
Tom Mitchell provides a more modern definition: “A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.”
湯姆·米切爾
認爲:“如果某計算機程序在T任務中的性能(由P衡量)隨着經驗E的提高而提高,則可以說計算機程序可以從經驗E中學習到了用性能指標P評估的任務T. ”
eg:垃圾郵件的識別任務中如何判斷任務T,經驗E,性能指標P呢?
2.Supervised Learning-監督學習
監督學習是指具備明確結果的學習方式.
比如我們通過疾病數據想要確認病人的腫瘤是良性腫瘤還是惡性腫瘤.在這個問題中,我們具有明確的目標:即腫瘤的類型.這種具備明確目標的機器學習方式就是監督學習.
監督學習可以分爲:
1.迴歸問題-連續的輸出結果
2.分類問題-離散的輸出結果
迴歸問題舉例: 預測一個城市的房價,輸出就可以認爲是一個連續
結果.
分類問題距離:預測顧客是否會選擇來商場購物,輸出就可以認爲是一個 是/否 的離散
結果.
3.Unsupervised Learning-無監督學習
當我們手中只有數據集,而無明確的結果的時候,我們需要藉助計算機的幫助來將數據劃分成聚類
.這種沒有明確結果的學習方式我們稱爲無監督學習.
比如說:谷歌新聞中將大量的新聞利用無監督學習劃分到不同的領域中.
再比如:雞尾酒聚會問題
將聚會中的兩隻不同位置的麥克風分離出兩簇獨立的音頻信息.