前言：

因爲書寫難度以及後面需要補充等原因，寫完每一小部分在進行一次合併。

12 支持向量機（Support Vectir Machines）

12.1 優化目標

在監督學習中，許多學習算法的性能都非常類似，因此，重要的不是你該選擇使用學習算法 A 還是學習算法 B，而更重要的是，應用這些算法時，所創建的大量數據在應用這些算法時，表現情況通常依賴於你的水平。

與邏輯迴歸和神經網絡相比，支持向量機，或者簡稱 SVM，在學習複雜的非線性方程時提供了一種更爲清晰，更加強大的方式

這部分學習非常重要。

我將會從邏輯迴歸開始展示我們如何一點一點修改來得到本質上的支持向量機。

將用 z 表示

回顧一下之前的邏輯迴歸的代價函數：

在計算的時候，我們將每個樣本加入總代價函數中，因此總代價函數通常會有對所有的訓練樣本求和。其實1/m這個可以不考慮，我們只是方便運算才引入的。

現在開始建立支持向量機

我們會從這個代價函數開始，也就是 對於這個對數，我們一點一點修改，讓我取這裏的 z=1 點，我先畫出將要用的代價函數。

y=1情況：新的代價函數是粉色這一條，由兩段直線構成，這時候非常接近邏輯迴歸中述使用的代價函數了。

事實上，在之後的的優化問題中，爲支持向量機，帶來計算上的優勢。例如，更容易計算股票交易的問題等等。

同理：y=0情況：

如果我們用一個新的代價函數來代替，即這條從 0 點開始的水平直線，然後是一條斜線，像上圖。

那麼，現在讓我給這兩個方程命名，左邊的函數，我稱之爲 cost1(z)，同時，右邊函數我稱它爲 cost0 (z) 。這裏的下標是指在代價函數中，對應的 y=1 和 y=0 的情況，擁有了這些定義後，現在，我們就開始構建支持向量機

構建我們的支持向量機：

弄清楚上面這幅圖非常關鍵！！！

對於第一部分，需要注意後面的講解，代價函數用cost表示，對於支持向量機，我們希望得到最小化問題，同時加上正則化參數，此時的1/m這一項只是爲了方便運算（正如我們求一個函數的極值的座標與方程是否放大無關）

對於第二部分，由於常數是無關緊要的，因此可以用C來代替

第三部分，對於我們熟悉的邏輯迴歸，我們有兩項參數我們通過設置不同正則參數λ達到優化的目的A+λ×B，，但對於支持向量機，按照慣例，我們將使用一個不同的參數替換這裏使用的 λ來權衡這兩項。就是第一項和第二項我們依照慣例使用一個不同的參數稱爲 C，同時改爲優化目標，C×A+B 因此，在邏輯迴歸中，如果給定λ，一個非常大的值，意味着給予 B 更大的權重。而這裏，就對應於將 C 設定爲非常小的值，那麼，相應的將會給 B 比給 A 更大的權重。參數 C 考慮成 1/λ，

12.2 大邊界的直觀理解

與邏輯迴歸不同的是，支持向量機的要求更高，不僅僅要能正確分開輸入的樣本，即不僅僅要求 $\Theta ^{T}x$ >0，我們需要的是比 0 值大很多，比如大於等於 1，我也想這個比 0 小很多，比如我希望它小於等於-1，這就相當於在支持向量機中嵌入了一個額外的安全因子。或者說 安全的間距因子。