Python機器學習庫sklearn——邏輯迴歸

原創

半城烟雨半城花

2018-11-20 04:55

# -*- coding: UTF-8 -*-

import numpy as np # 快速操作結構數組的工具
import pandas as pd # 數據分析處理工具


# 樣本數據集，第一列爲x1，第二列爲x2，第三列爲分類（二種類別）
data=[
    [-0.017612,14.053064,0],
    [-1.395634,4.662541,1],
    [-0.752157,6.538620,0],
    [-1.322371,7.152853,0],
    [0.423363,11.054677,0],
    [0.406704,7.067335,1],
    [0.667394,12.741452,0],
    [-2.460150,6.866805,1],
    [0.569411,9.548755,0],
    [-0.026632,10.427743,0],
    [0.850433,6.920334,1],
    [1.347183,13.175500,0],
    [1.176813,3.167020,1],
    [-1.781871,9.097953,0],
    [-0.566606,5.749003,1],
    [0.931635,1.589505,1],
    [-0.024205,6.151823,1],
    [-0.036453,2.690988,1],
    [-0.196949,0.444165,1],
    [1.014459,5.754399,1]
]


#生成X和y矩陣
dataMat = np.mat(data)
y = dataMat[:,2]   # 類別變量
b = np.ones(y.shape)  # 添加全1列向量代表b偏量
X = np.column_stack((b, dataMat[:,0:2]))  # 特徵屬性集和b偏量組成x
X = np.mat(X)

# 特徵數據歸一化
# import sklearn.preprocessing as preprocessing   #sk的去均值和歸一化
# scaler=preprocessing.StandardScaler()
# X = scaler.fit_transform(X)   # 對特徵數據集去均值和歸一化，可以加快機器性能
# X = np.mat(X)
# # print(X)
# ========邏輯迴歸========

from sklearn import metrics
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X, y)
print('邏輯迴歸模型:\n',model)
# 使用模型預測
predicted = model.predict(X)   #預測分類
answer = model.predict_proba(X)  #預測分類概率
print(answer)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

KNN算法第二章 Pandas & sklearn 機器學習實戰 Machine Learning in action

本專欄計劃藉助Pandas與sklearn重新實現書中的實戰案例。 k-近鄰算法1. KNN算法流程2. KNN改進約會網站的配對效果2.1 數據準備：從文本中解析數據2.2 數據可視化：散點圖2.3 數據處理：歸一化數值2.4

2020-07-08 11:09:44

社區發現之譜聚類算法的實現

#譜聚類算法實現 #1、計算距離矩陣(歐氏距離，作爲相似度矩陣) #2、利用KNN計算鄰接矩陣A #3、由鄰接矩陣計算都矩陣D和拉普拉斯矩陣L #4、標準化拉普拉斯矩陣 #5、對拉普拉斯矩陣進行特徵值分解得到特徵向量 #6、對特徵向量

2020-07-07 23:51:53

scikit-learn學習

scikit-learn是python中常見的機器學習庫，簡寫爲sklearn sklearn包含很多機器學習方式 Classification 分類 Regression 迴歸 Clustering 非監督分類 Dimensionali

2020-07-07 07:29:13

更新索引和離散特徵值的處理 pd.get_dummies(X)

我們這裏爲了演示, 直接刪除含有空值的行, 這是會會出現索引不連續的情況, 如圖, 索引少了888, 這是我們需要更新索引這時我們看到所有數據從891條變成了712條, 但是原始的所以竟然變成了新的特徵列, 這不是我們想要的,

透明的红萝卜221

2020-07-07 06:38:55

[機器學習-邏輯迴歸]邏輯迴歸(LogisticRegression)多分類(OvR, OvO, MvM）

這裏寫目錄標題前言One-VS-RestOne-Vs-One比較 OvO 和 OvR多對多（Many vs Many）過擬合問題類別不平衡問題Sklearn實踐案例總結前言邏輯迴歸分類器（Logistic Regressio

茫茫人海一粒沙

2020-07-06 19:32:18

[機器學習-數學]什麼是協方差/協方差矩陣/矩陣特徵

協方差/協方差矩陣/矩陣特徵介紹1. 均值：2. 標準差：3. 方差：4. 協方差5. 協方差矩陣6. 超參數7. 參考資料 1. 均值：均值描述的是樣本集合的平均值。 2. 標準差：標準差描述是樣本集合的各個樣本點到均值

茫茫人海一粒沙

2020-07-06 18:51:28

[機器學習-原理及實現篇]線性迴歸-最小二乘法

線性迴歸到底要幹什麼，顧名思義很簡單，即在已有數據集上通過構建一個線性的模型來擬合該數據集特徵向量的各個分量之間的關係，對於需要預測結果的新數據，我們利用已經擬合好的線性模型來預測其結果。關於線性迴歸的方法，現在使用得比較廣泛的就

茫茫人海一粒沙

2020-07-06 18:51:28

[機器學習-原理篇]學習之線性迴歸、嶺迴歸、Lasso迴歸

線性迴歸、嶺迴歸、Lasso迴歸前言一，線性迴歸——最小二乘二，Lasso迴歸三，嶺迴歸四， Lasso迴歸和嶺迴歸的同和異五，爲什麼 lasso 更容易使部分權重變爲 0 而 ridge 不行？參考資料前言如果對L1和L2

茫茫人海一粒沙

2020-07-06 18:51:27

[機器學習-實踐篇]學習之線性迴歸、嶺迴歸、Lasso迴歸，tensorflow實現的線性迴歸

線性迴歸、嶺迴歸、Lasso迴歸前言1.線性迴歸2. 嶺迴歸3. Lasso迴歸4. tensorflow利用梯度下降實現的線性迴歸前言本章主要介紹線性迴歸、嶺迴歸、Lasso迴歸，tensorflow實現的線性迴歸的簡單例子

茫茫人海一粒沙

2020-07-06 18:51:27

[機器學習-概念] 什麼是歐式距離、標準化歐式距離、馬氏距離、餘弦距離

1.歐式距離(Euclidean Distance) 歐式距離源自N維歐氏空間中兩點x1,x2x_1,x_2x1,x2間的距離公式： 2.標準化歐式距離（Standardized Euclidean distance）引

茫茫人海一粒沙

2020-07-06 18:51:27

[機器學習-總結] 什麼是準確率, 精確率，召回率和(精確率和召回率的調和平均)

準確率, 精確率，召回率和精確率和召回率的調和平均1. 背景介紹2. 準確率（accuracy）3. 精確率(precision)4. 召回率(recall，也稱爲查全率)5. 精確率和召回率的調和平均 1. 背景介紹對於一般

茫茫人海一粒沙

2020-07-06 18:51:27

數據挖掘——sklearn瞭解

數據挖掘——sklearn瞭解sklearn庫的大概sklearn官方文檔的內容sklearn官方文檔結構使用sklearn進行簡單的數據挖掘數據挖掘的步驟參考文獻 sklearn庫的大概網上有很多關於sklearn的學習教程，

2020-07-05 23:54:46

kaggle波士頓房價預測，score=0.12986

作爲一個機器學習小白，之前拿titanic數據集練過手，遇到波士頓房價數據集（81個特徵）剛開始是有點懵，主要就懵在不知道如何下手處理數據，參考一些資料後，勉強跑通了流程，在此記錄一下。大神請自動繞過。 1、加載數據集數據集可以到kag

2020-07-05 22:50:38

機器學習-簡單線性迴歸分析（Python）

前言機器學習常用來解決相關分析和迴歸分析的問題，有時候大家會混淆兩者之間的差異，這裏通過對比分析來說明兩者的區別和聯繫，最後會以調用sklearn包中LinearRegression方法進行簡單線性迴歸分析爲例，說明如何使用

2020-07-05 17:43:16

Python-sklearn包中StratifiedKFold和KFold生成交叉驗證數據集的區別

一、StratifiedKFold及KFold主要區別及函數參數 KFold交叉採樣：將訓練/測試數據集劃分n_splits個互斥子集，每次只用其中一個子集當做測試集，剩下的（n_splits-1）作爲訓練集，進行n_splits

2020-07-05 17:43:06

24小時熱門文章

最新文章

最新評論文章