本文用於複習《Machine Learning》第一章部分內容
內容來自於Andrew Ng的機器學習課程,主要是爲了回憶起來方便
第一章前三講主要講解的是一些概念的區分,以理解的方式瞭解不同的分類方法和問題
supervised learning
這裏supervised learning是指,給算法一個數據集合,利用算法即可得到實際結果,例如一個特定的值(平均房價1萬/平方米),例如一個特定判斷(整個病症不是癌症)
supervised learning包含兩種問題:
- regression problem: 對於連續值進行預測,例如房價等
- classification problem: 對於離散值進行預測,例如判斷是否,或是多種結果
unsupervised learning
這裏unsupervised learning是指,給算法一個無區分標籤的一組數據(在使用數據之前不知道數據分組),利用算法得到幾個區分羣,例如從一堆新聞中劃分出關於同一個故事的
linear regression
由上易知,linear regression即是迴歸問題的線性處理方式。例如給出基本參數:
- m: 數據的組數,訓練房屋的數量
- x: 輸入變量,特徵值,房屋的面積
- y: 輸出變量,結果值,房屋的價格
- (x,y): 一個訓練樣本,某一個房屋的面積對應的房屋價格
線性迴歸所要處理的即是:
(1)得到數據集x
(2)得到需要運用的算法爲線性迴歸算法
(3)利用房屋面積x和房屋的價格y建立預測關係h(hypothesis),得到h(x)=b+ax