機器學習(一)線性模型

什麼是機器學習?

機器學習是一門致力於研究如何通過計算的手段,利用經驗來改善系統自身的性能。在計算機系統中“經驗”通常以“數據”形式存在,因此機器學習研究的內容是關於從數據中產生模型的算法,有了這些算法,我們把數據提供給它,它就能基於數據產生模型,在面對新的情況時,模型會給我們提供相應的判斷。什麼是學習?赫爾伯特西蒙曾給出如下定義:“如果一個系統能夠通過執行某個過程改進它的性能,這就是學習”

機器學習組成

主要任務
- 分類:將實例數據劃分到合適的類別中。
- 迴歸:主要用於預測數值型數據。

學習方式
- 監督學習
必須確定目標變量的值,以便機器學習算法可以發現特徵和目標變量之間的關係。 (包括:分類和迴歸)
樣本集:訓練數據 + 測試數據
訓練樣本 = 特徵(feature) + 目標變量(label: 分類-離散值/迴歸-連續值)
特徵通常是訓練樣本集的列,它們是獨立測量得到的。
目標變量: 目標變量是機器學習預測算法的測試結果。
在分類算法中目標變量的類型通常是標稱型(如:真與假),而在迴歸算法中通常是連續型(如:1~100)。
- 非監督學習
數據沒有類別信息,也不會給定目標值。
聚類:在無監督學習中,將數據集分成由類似的對象組成多個類的過程稱爲聚類。
密度估計:將尋找描述數據統計值的過程稱之爲密度估計。
此外,無監督學習還可以減少數據特徵的維度,以便我們可以使用二維或三維圖形更加直觀地展示數據信息。

線性迴歸模型

在統計學中,線性迴歸方程是利用最小二乘函數對一個或多個自變量和因變量之間關係進行建模的一種迴歸分析。這種函數是一個或多個稱爲迴歸係數的模型參數的線性組合。只有一個自變量的情況稱爲簡單迴歸,大於一個自變量情況的叫做多元迴歸。

迴歸模型能用來幹什麼?

迴歸模型能用來預測數據,簡單來說就是根據現有數據,預測接下來會出現什麼數據。例如根據給定大量現有房屋價格,預測一套房屋的價格。

發佈了26 篇原創文章 · 獲贊 28 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章