哲哲的ML筆記（二十四：支持向量機SVM）

原創

2021-04-19 23:58

從邏輯迴歸到SVM

與邏輯迴歸和神經網絡相比，支持向量機，或者簡稱SVM，在學習複雜的非線性方程時提供了一種更爲清晰，更加強大的方式

從邏輯迴歸開始展示我們如何一點一點修改來得到本質上的支持向量機
先回顧一下邏輯迴歸的假設函數和損失函數，用 $z$ 表示 $\theta^Tx$

當

y=1

時，起作用的一項是

-log\frac{1}{1+e^{-z}}

, 此時希望

z

越大越好，第一，可以從

h_\theta(x)

判斷；第二，從損失函數看，希望loss越小越好。
此時用新的簡化函數

cost(z)

代替

-log\frac{1}{1+e^{-z}}

，即爲下圖的粉色線

同理，當

y=1

時,y也這樣分析
從邏輯迴歸的損失函數出發，首先要做的是把相應的部分替換爲

cost(z)

，其次去除

\frac{1}{m}

和

\lambda

，加入相應的參數

C

當

C=\frac{1}{\lambda}

時，新的損失函數和邏輯迴歸的損失函數爲目標，會得到相同的

\theta

當最小化代價函數，獲得參數時，支持向量機所做的是它來直接預測

y

的值等於1，還是等於0。當

\theta^Tx

大於或者等於0時,假設函數會預測1。

SVM邊界的理解

對於正樣本，代價函數的一部分是 $cost_1$ ，希望 $\theta^Tx\geq1$ ，因爲此時 $cost_1=0$

對於負樣本，代價函數 $cost_2$ ，希望 $\theta^Tx\leq -1$ ，因爲此時 $cost_2=0$

對於分類問題， $h_\theta(x)=g(\theta^Tx)=\frac{1}{1+e^{ -\theta^Tx}}$ ， $\theta^Tx\geq0$ 即爲正類；但是對於SVM，希望 $\theta^Tx\geq1$ 。這就是額外的安全因子，或者說安全的間距因子。

對於一個分類問題如下圖，期望劃出明確的邊界，粉色和綠色的邊界看起來都不如黑色的邊界，因爲這條黑線有更大的距離，這個距離叫做間距(margin)

黑色的決策界和訓練樣本之間有更大的最短距離。然而粉線和藍線離訓練樣本就非常近，在分離樣本的時候就會比黑線表現差。因此，這個距離叫做支持向量機的間距，而這是支持向量機具有魯棒性的原因，因爲它努力用一個最大間距來分離樣本。
因此支持向量機有時被稱爲大間距分類器。

回顧SVM的代價函數，如下公式。

如果將

C

設置的很大，eg:10000。我們將選擇這樣的決策界，從而最大間距地分離開正樣本和負樣本。那麼在讓代價函數最小化的過程中，我們希望找出在和兩種情況下都使得代價函數中左邊的這一項儘量爲零的參數。學習算法會受異常點(outlier) 的影響。比如我們加入一個額外的正樣本

僅僅基於一個異常值，僅僅基於一個樣本，就將我的決策界從這條黑線變到這條粉線，這實在是不明智的。而如果正則化參數

C

，設置的非常大，決策界從黑線變到了粉線，但是如果設置的小一點，如果你將C設置的不要太大，則你最終會得到這條黑線.當不是非常非常大的時候，它可以忽略掉一些異常點的影響，得到更好的決策界

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

爲什麼要⽤ Foundry

Foundry 爲什麼要⽤ Foundry 快 - 加速開發 Solidity - 減少上下⽂切換功能豐富⾜夠輕量 Foundry 的組件 forge cast anvil 安裝 https://getfoundr

西紅柿愛喫馬鈴薯

2024-04-26 14:31:45

【筆記】動手學深度學習-預備知識

預備知識 2.1 數據操作 import torch x = torch.arange(12) print(x.shape) print(torch.Size(x)) print(x.numel()) X = x.reshape(

2024-04-26 14:29:04

https://stackoverflow.com/questions/419163/what-does-if-name-main-do

https://stackoverflow.com/questions/419163/what-does-if-name-main-do

2024-04-26 14:29:04

py發送帶附件email

import smtplib from email.mime.multipart import MIMEMultipart from email.mime.text import MIMEText from email.mime.base

2024-04-26 14:25:24

docker nginx-proxy 添加自定義https網站

nginx-proxy配置 nginx-proxy: image: jwilder/nginx-proxy container_name: nginx-proxy restart: always por

2024-04-26 14:25:24

Avalonia UI 中 Styles 與 ControlTheme 的區別

目錄目錄介紹使用方式全局主題 (Global Theme) 局部主題 (Local Theme) 控件主題 (ControlTheme) 問題描述問題分析問題1 區別問題2 重寫Template用 Styles

2024-04-26 14:25:24

py發送email

import smtplib from email.mime.text import MIMEText # SMTP服務器設置 smtp_server = 'smtp.qq.com' smtp_port = 587 secure_con

2024-04-26 14:25:24

Kubernetes (k8s) 基礎入門

下面的內容是基於你已經瞭解了 Docker 容器的前提下的，如果還不瞭解什麼是容器，可以先看看之前的文章 https://www.ryanzoe.top/category/docker/ k8s 是什麼 Kubernetes 也稱爲 K8

2024-04-26 14:25:14

PostMan接口測試實用小點

PostMan接口測試實用小點 1. 接口測試變量存取操作在Postman中有很多地方可以存儲一些變量,這裏只介紹經常使用的環境變量.變量設置後,在UI界面可以通過{{變量名}}獲取到對應值. 在環境變量中配置變量url = https:

2024-04-26 14:25:14

使用 k8s 快速部署應用服務

以下是一個完整的例子，展示瞭如何使用Kubernetes部署一個簡單的Web應用程序。這個例子包括一個Deployment和一個Service。首先，創建一個名爲webapp-deployment.yaml的Deployment配置文件：

2024-04-26 14:25:14

windows 新建一個一個後臺服務

Winsw是一個開源工具，用於將命令行應用程序包裝成Windows服務 1. https://github.com/winsw/winsw/releases/tag/v2.12.0 下載 2. 下載完把兩個文件改名字： myservi

2024-04-26 14:23:43

嘗試使用kimi解析體能表格

因爲涉及到體能訓練成績，所以接觸到了很多表格，觸發了對錶格數據的思考：圖表也是重要的數據來源，應該如何來進行處理？圖表的數據不僅關係它本身，而且也和表格形式相關，此外還和背景材料相關。首先從一個比較乾淨的表格開始，它本身是可以編輯的pdf.

2024-04-26 14:23:33

Springboot版本升級

簡介此次升級是爲了解決舊版本的各種漏洞問題。開發軟件：IDEA2019 項目環境：java 8，springboot2.0.5 目標版本：java 8，springboot2.5.5 本文檔前後變化對比，舊代碼使用、// 等表示。依賴

2024-04-26 14:22:43

條款47：請使用 traits classes 表現類型信息

2024-04-26 14:22:03

條款48：認識 template 元編程

2024-04-26 14:22:03

24小時熱門文章

最新文章

最新評論文章