[機器學習筆記] 常用的分類與預測算法

原創

2020-06-21 07:35

常用的分類與預測算法

算法名稱	算法描述
迴歸分析	迴歸分析是確定預測屬性（數值型）與其它變量間相互依賴的定量關係最常用的統計學方法。包括：線性迴歸、非線性迴歸、Logistic迴歸、嶺迴歸、主成分迴歸、偏最小二乘迴歸等模型。
決策樹	決策樹採用自頂向下的遞歸方式，在內部節點進行屬性值的比較，並根據不同的屬性值從該節點向下分支，最終得到的葉子節點是學習劃分的類
人工神經網絡	人工神經網絡是一種模仿大腦神經網絡結構和功能而建立的信息處理系統，表示神經網絡的輸入與輸出變量之間關係的模型
貝葉斯網絡	貝葉斯網絡又稱信度網絡，是Bayes方法的擴展，是目前不確定知識表述和推理領域最有效的理論模型之一
支持向量機	支持向量機是一種通過某種非線性映射，把低維的非線性可分轉化爲高維的線性可分，在高維空間進行線性分析的算法

迴歸分析

主要回歸模型分類

迴歸模型名稱	適用條件	算法描述
線性迴歸	因變量與自變量是線性關係	對一個或多個自變量和因變量之間的線性關係進行建模，可用最小二乘法求解模型係數
非線性迴歸	因變量與自變量之間不都是線性關係	對一個或多個變量和因變量之間的非線性關係進行建模。如果非線性關係可以通過簡單的函數變換轉化成線性關係，用線性迴歸的思想求解；如果不能轉化，用非線性最小二乘法求解。
Logistic迴歸	因變量一般有1和0（是否）兩種取值	是廣義線性迴歸模型的特例，利用Logistic函數將因變量的取值範圍控制在0和1之間，表示取值爲1的概率
嶺迴歸	參與建模的自變量之間具有多重共線性	是一種改進最小二乘估計的方法
主成分迴歸	參與建模的自變量之間具有多重共線性	主成分迴歸是根據主成分分析的思想提出來的，是對最小二乘法的一種改進，它是參數估計的一種有偏估計。可以消除自變量之間的多重共線性。

線性迴歸模型是相對簡單的迴歸模型，但是通常因變量和自變量之間呈現某種曲線關係，就需要建立非線性迴歸模型。

當自變量之間出現多重共線性時，用最小二乘估計的迴歸係數將會不準確，消除多重共線性的參數改進的估計方法主要有嶺迴歸和主成分迴歸。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Kaggle——ASHRAE 能源消耗預測，排名1%

這是在2019年11~12月期間，我參加的一個kaggle比賽——ASHRAE - Great Energy Predictor III 最終成績：排名前1%，22/3614。差一點點就金牌了，感覺前面的名次每前進一名都跟煉丹似的

2020-06-21 12:04:44

邏輯迴歸（LR）公式推導及代碼實現

文章目錄構造hypothesis構造損失函數通過“梯度下降法”求參數 θ\thetaθ 的更新式代碼實現References 邏輯迴歸是用來解決分類問題用的，與線性迴歸不同的是，邏輯迴歸輸出的不是具體的值，而是一個概率。除去了si

2020-06-21 12:04:43

[機器學習筆記] 機器學習常見算法總結（更新中）

機器學習常見算法總結監督學習 Supervised Learning 線性迴歸算法優點：建模速度快，存儲資源低；思想簡單，實現容易。建模迅速，對於小數據量、簡單的關係很有效；是許多強大的非線性模型的基礎；線性迴歸模型十分

2020-06-21 08:14:05

[機器學習筆記] （轉載學習）完整機器學習項目的工作流程

完整機器學習項目的工作流程博客原文：https://ask.julyedu.com/question/7013 1 抽象成數學問題明確問題是進行機器學習的第一步。機器學習的訓練過程通常都是一件非常耗時的事情，胡亂嘗試時間成本是非常高的

2020-06-21 07:35:48

[機器學習筆記] 用Python分析 TED演講數據（更新中）

用Python分析 TED演講數據首先準備TED演講數據集，TED演講數據集和信息可以從下面的資源獲得： https://www.datafountain.cn/datasets/11 該數據集包含2個文件： ted_main.csv

2020-06-21 07:35:48

[數據分析學習筆記] 數據預處理

數據分析學習筆記 —— 數據預處理數據預處理一方面是要提高數據的質量，另一方面是要讓數據更好地適應特定的挖掘技術或工具。爲什麼需要進行數據預處理？包含在數據源中的大部分原始數據未被處理，它們是不完整的數據或者含有不符合數據分析要求的

2020-06-21 07:35:38

[機器學習] Python代碼來構建一顆決策樹（Decision Tree）的案例

Python代碼來構建一顆決策樹（Decision Tree）的案例用Python代碼來構建一顆決策樹（Decision）工具 Python+Jupyter Graphviz 2.38 （Graphviz是一個開源的圖形可視化軟件）

2020-06-21 07:35:38

[機器學習筆記] 用Python進行航空公司客戶價值分析筆記

用Python進行航空公司客戶價值分析（數據分析）學習資料：參考圖書：《Python數據分析與挖掘實戰》（機械工業出版社）第7章參考博文：https://blog.csdn.net/a857553315/article/detail

2020-06-21 07:35:38

[機器學習筆記] 用Python分析：紅葡萄酒質量分析（數據探索）

用Python分析：紅葡萄酒質量分析（數據探索）數據集：winemag-data_first150k.csv 先來導入數據 import numpy as np import pandas as pd import seaborn a

2020-06-21 07:35:38

[機器學習筆記] Python數據分析：用戶消費行爲（持續更新）

Python數據分析：用戶消費行爲（持續更新）紅酒品鑑和用戶消費行爲分析是我學習Python數據分析入門的兩個案例，記錄一下。網絡上關於這兩個案例的介紹非常多，但是我在學習過程中，發現有很多文章的邏輯不是很清晰，代碼也調試不同。所以

2020-06-21 07:35:38

[機器學習筆記] 機器學習知識要點彙總

機器學習知識要點彙總 1. 機器學習的常見分類和常用的算法有哪些？將機器學習分爲四種，分別是監督學習、無監督學習、半監督學習和增強學習。（1）監督學習(Supervised Learning)：是指每個進入算法的訓練數據樣本都

2020-06-21 07:35:38

2020數字中國天池——智慧海洋建設 Top1%

2020-05-19 06:50:06

Kaggle——能源消耗預測，排名1%

2020-05-06 17:07:51

數據挖掘（Data Mining）和數據分析（Data Analysis）的對比

2020-05-03 17:27:20

機器學習（Machine Learning）和傳統的數據統計分析（Data Statistics）有什麼區別？

2020-05-03 17:27:20

24小時熱門文章

最新文章

最新評論文章