線性分類模型（一）：線性判別模型分析

原創

2018-11-13 01:59

前言

前幾篇文章介紹了線性迴歸算法，線性分類模型分爲判別式模型和生成式模型，本文首先簡單複習了與算法相關的數學基礎知識，然後分析各線性判別式分類算法，如最小平方法，Fisher線性判別法和感知器法，最後總結全文。

目錄

1、相關的數學知識回顧

2、判別式模型和生成性模型

3、最小平方法

4、Fisher線性判別函數

5、感知器算法

6、總結

相關數學知識回顧

1、直線方程和平面方程

拓展到分類思想：直線l爲分類決策方程，座標點落在直線l上方時，則分類爲C1；座標點落在直線l下方時，則分類爲C2（如下圖）。

平面方程類似，在這裏不展開。

2、點到直線和點到平面的距離

點到直線的距離：

點到平面的距離

拓展到分類思想：平面方程爲決策方程，正確分類的情況下，當點P到決策方程的距離越大，則分類模型越好；錯誤分類的情況下，點P到決策方程的距離作爲損失函數，損失函數最小化過程即是模型參數最優化過程。

3、向量內積的數學意義

幾何意義：向量A與向量B的內積等於向量A在向量B的投影與向量B的乘積，當向量B是單位向量時，則等於向量A在單位向量方向的投影，單位向量類似於基函數或者可以理解成座標軸,即向量A在向量B的投影可理解成向量A在向量B方向的座標，如下圖，B'是B在OA座標軸方向的投影。

拓展到分類思想：C1與C2屬於不同的類，給定一條決策性直線l，當C1與C2在直線L2的投影間距越大，則分類效果越好。增加不同類間的距離可以作爲模型參數優化的方向。

如下圖，C1和C2的在直線L2的投影距離|C1"C2"|大於|C1'C2'|，因此決策方程直線L2優於直線L1.

4、梯度下降法

函數f(x0,x1,...,xn)在梯度方向是函數值變化（增加或減少）最快的方向（本文只給出結論，後續文章會有詳細的說明）。

拓展到分類思想：損失函數最小化過程即是模型參數最優化過程，損失函數最小化可通過梯度下降法來實現，當迭代到一定程度，損失函數收斂，則迭代結束，參數w即是要求的最優參數。

流程圖如下：

判別式模型和生成性模型

我們常把分類問題分成兩個階段：推斷階段和決策階段，對於輸入變量x，分類標記爲Ck。推斷階段和決策階段具體表示爲：

推斷階段：估計P(x,Ck)的聯合概率分佈，對P(x,Ck)歸一化，求得後驗概率P(Ck|x)。

決策階段：對於新輸入的x，可根據後驗概率P(Ck|x)得到分類結果。

判別式模型和生成性模型的區別

判別式模型：簡單的學習一個函數，將輸入x直接映射爲決策，稱該函數爲判別式函數。

生成式模型：推斷階段確定後驗概率分佈，決策階段輸出分類結果，生成式模型包含兩個階段。

本文介紹判別式線性分類模型的三種算法。

最小平方法

最小平方法與最小二乘法的算法思想類似，K類判別函數由K個方程決定，

訓練集，K類判別函數爲，k=1,2,...,K

參數矩陣爲，目標矩陣。

求得最優參數w後，輸入變量x所屬K類的判別方法如下：

Fisher線性判別函數

第一節講到，若兩個類在同一個決策方程的投影距離相隔越大，則該決策方程越好。再深入一點，相同類投影到決策方程的方差越小，則該決策方程越好，方差代表類投影到決策方程的聚集程度。這就是Fisher線性判別法參數優化思想。

參數優化思想：同類樣本投影到決策方程的方差最小，不同類樣本投影到決策方程的均值間隔最大。用表達式J(w)表示，J（w）越大越好。

如下圖：

其中，m1，m2分別表示不同類在決策方程的投影均值；S1,S2分別表示不同類投影到決策方程的方差。

求得最優參數w後，輸入變量x所屬類的判別方法如下：

感知器算法

感知器算法的目的是找到能夠準確分離正負樣本訓練數據集的超平面。

超平面定義：

感知器學習策略：

對訓練數據集某一樣本點(x,y)，若wx+b>0，則y=1；若wx+b<0，則y=-1；

即感知機模型爲：

因此，對於誤分類的數據(xi,yi)來說：

因此，感知器學習策略是最小化誤分類點到平面S的距離，不考慮分母項。

假設訓練數據集有M個誤分類點，損失函數爲：

運用梯度下降算法最小化損失函數L(w,b)。

設學習率η，感知器學習策略步驟：

（1）、選取處置w0，b0；

（2）、選取訓練集(xi,yi)；

（3）、如果yi(w*xi+b)<=0，則更新權值參數w,b：

（4）、轉至（2），直至訓練數據集沒有誤分類點，得到超平面最優參數w，b。

感知機學習算法由於採用不同的初值或選取不同的誤分類點，參數解可能不同（例題可參考《統計學習方法》）。

因此，對某一輸入點，若感知機模型大於0，則分類爲1；反之分類爲-1。

總結

本文介紹了線性判別分類的三種方法，第一種判別方法是根據點到判別函數的距離來分類，，第二種方法是根據輸入樣本在判別函數的投影距離進行分類，第三種方法則採用感知機模型進行分類。

參考

Christopher M.Bishop <<Pattern Reconition and Machine Learning>>

李航《統計學習方法》

推薦閱讀文章

深入理解線性迴歸算法（三）：淺談貝葉斯線性迴歸

深入理解線性迴歸算法（二）：正則項的詳細分析

深入理解線性迴歸算法（一）

線性迴歸：不能忽視的三個問題

淺談頻率學派和貝葉斯學派

淺談先驗分佈和後驗分佈

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

淺談矩陣乘法與矩陣二次型

矩陣乘法是一種很有意思的運算，因爲說是乘法不如說是加法，或者說是向量的線性組合的過程。兩個矩陣的乘積C=AB,對於這個公式的線性組合方面理解有兩種，一種是從左邊看:，意思是矩陣C的第i行是B的行向量的線性組合，組合係數是A的第i

2020-07-05 02:10:13

CART實現

基於R的CART的實現包有tree,rpart. tree rpart

2020-07-07 22:26:30

Ridge regression

參考文獻 1.Hoerl A E, Kennard R W. Ridge regression: Biased estimation for nonorthogonal problems[J]. Technometrics, 19

2020-07-07 22:26:30

Python實現kd樹

kd樹的數據結構和二叉樹類似，每個節點存有當前節點的數值，左右子樹的節點，和以當前節點爲根節點的子樹的劃分維度。 class KdNode: def __init__(self, dim, val, left=None, ri

2020-07-07 00:33:04

PCA方法Python代碼實現

關於PCA方法的原理這裏就不介紹了，網絡上很多文章寫得都很好，這裏給出以三維點集的PCA爲例，在python裏實現PCA方法。 PCA方法的主要步驟是：數據中心化計算協方差矩陣根據協方差矩陣計算出特徵值和特徵向量 python代碼如

2020-07-07 00:33:04

hadoop 簡單入門與streaming常用配置參數說明

1. Hadoop包含兩核心部分 hdfs Hadoop distribute file system -- hadoop分佈式文件系統，存儲數據 Namenode、Datanode 常用命令形式：hadoop fs -ls / h

2020-07-06 23:19:09

假設空間版本空間&查全率查準率

一、假設空間版本空間根據P4表1.1和P5圖1.1得，假設空間爲： 1 色澤＝＊，根蒂＝＊，敲聲＝＊2 色澤＝青綠，根蒂＝＊，敲聲＝＊3 色澤＝烏黑，根蒂＝＊，敲聲＝＊4 色澤

liangyingyi1006

2020-07-04 10:41:01

Transformers與圖神經網絡的關係，我們能從transformer學習到什麼？

1、導讀這個觀點的目的是構建Transformer結構背後的NLP上的直覺，以及與圖神經網絡的聯繫。圖深度學習”聽起來很厲害，但有什麼大的商業成功的故事嗎？它有沒有被部署在實際app中？除了Pinterest、阿里巴巴和Tw

BUAA～冬之恋

2020-07-04 03:47:48

機器學習——分類算法之決策樹

機器學習——分類算法之決策樹前言1、信息熵2、條件熵ID3算法C4.5決策樹CART決策樹1、CART決策樹的分類算法2、CART決策樹的迴歸算法剪枝1、預剪枝2、後剪枝連續值和缺失值的處理1、連續值的處理2、缺失值的處理前言

2020-07-03 16:48:56

機器學習——分類算法之感知機

機器學習——分類算法之感知機前言符號函數感知機模型感知機算法1、原始形式2、對偶形式代碼前言感知機算法（perceptron）是用於二分類的線性分類模型，將輸入實例劃分爲正例和負例的一個超平面，屬於判別模型。感知機算法旨在求出

2020-07-03 16:10:50

機器學習——貝葉斯算法和樸素貝葉斯算法

機器學習——分類算法之貝葉斯算法和樸素貝葉斯算法前言一、貝葉斯算法算法示例二、樸素貝葉斯分類器1、貝葉斯決策論2、多元正太分佈參數的極大似然估計3、樸素貝葉斯分類器前言這部分的公式推導較多，涉及到了極大似然估計和貝葉斯估計，要

2020-07-03 16:10:50

機器學習——分類算法之邏輯迴歸

機器學習——分類算法之邏輯迴歸前言邏輯迴歸(Logistic Regression)1、Sigmoid函數2、算法推導3、代碼前言邏輯迴歸也被稱爲對數機率迴歸，注意這裏面說的迴歸並不是真正意義上的迴歸算法，其實它是一個經典的分

2020-07-03 16:10:50

邏輯迴歸解決多分類問題

邏輯迴歸解決多分類問題第一種方式：從類別入手1、OVO(one vs one)2、OVR(One Vs Rest)第二種方法：從算法入手傳統的邏輯迴歸只能處理二分類問題，對於多分類任務，主要有如下兩種方案。第一種方式：從類別入

2020-07-03 16:10:50

機器學習---線性迴歸算法梳理

線性迴歸算法梳理任務1 - 線性迴歸算法梳理一、基本概念二、線性迴歸的原理三、線性迴歸損失函數、代價函數、目標函數四、優化方法(梯度下降法、牛頓法、擬牛頓法等)五、線性迴歸的評估指標六、sklearn參數詳解任務1 - 線性迴歸

2020-07-03 16:09:47

windows系統下python快速註釋多行

以下才做適合於Windows系統。除了對每一行前面添加#的註釋方式外（如若要註釋多行，這種方式較慢），我們還可以考慮另外兩種註釋方式： 1、Ctrl + / （先選中要註釋的代碼，再按Ctrl + /） 2、用’’’ ‘’'或者

2020-07-03 16:09:36

24小時熱門文章

最新文章

最新評論文章