前言：

因为书写难度以及后面需要补充等原因，写完每一小部分在进行一次合并。

12 支持向量机（Support Vectir Machines）

12.1 优化目标

在监督学习中，许多学习算法的性能都非常类似，因此，重要的不是你该选择使用学习算法 A 还是学习算法 B，而更重要的是，应用这些算法时，所创建的大量数据在应用这些算法时，表现情况通常依赖于你的水平。

与逻辑回归和神经网络相比，支持向量机，或者简称 SVM，在学习复杂的非线性方程时提供了一种更为清晰，更加强大的方式

这部分学习非常重要。

我将会从逻辑回归开始展示我们如何一点一点修改来得到本质上的支持向量机。

将用 z 表示

回顾一下之前的逻辑回归的代价函数：

在计算的时候，我们将每个样本加入总代价函数中，因此总代价函数通常会有对所有的训练样本求和。其实1/m这个可以不考虑，我们只是方便运算才引入的。

现在开始建立支持向量机

我们会从这个代价函数开始，也就是 对于这个对数，我们一点一点修改，让我取这里的 z=1 点，我先画出将要用的代价函数。

y=1情况：新的代价函数是粉色这一条，由两段直线构成，这时候非常接近逻辑回归中述使用的代价函数了。

事实上，在之后的的优化问题中，为支持向量机，带来计算上的优势。例如，更容易计算股票交易的问题等等。

同理：y=0情况：

如果我们用一个新的代价函数来代替，即这条从 0 点开始的水平直线，然后是一条斜线，像上图。

那么，现在让我给这两个方程命名，左边的函数，我称之为 cost1(z)，同时，右边函数我称它为 cost0 (z) 。这里的下标是指在代价函数中，对应的 y=1 和 y=0 的情况，拥有了这些定义后，现在，我们就开始构建支持向量机

构建我们的支持向量机：

弄清楚上面这幅图非常关键！！！

对于第一部分，需要注意后面的讲解，代价函数用cost表示，对于支持向量机，我们希望得到最小化问题，同时加上正则化参数，此时的1/m这一项只是为了方便运算（正如我们求一个函数的极值的座标与方程是否放大无关）

对于第二部分，由于常数是无关紧要的，因此可以用C来代替

第三部分，对于我们熟悉的逻辑回归，我们有两项参数我们通过设置不同正则参数λ达到优化的目的A+λ×B，，但对于支持向量机，按照惯例，我们将使用一个不同的参数替换这里使用的 λ来权衡这两项。就是第一项和第二项我们依照惯例使用一个不同的参数称为 C，同时改为优化目标，C×A+B 因此，在逻辑回归中，如果给定λ，一个非常大的值，意味着给予 B 更大的权重。而这里，就对应于将 C 设定为非常小的值，那么，相应的将会给 B 比给 A 更大的权重。参数 C 考虑成 1/λ，

12.2 大边界的直观理解

与逻辑回归不同的是，支持向量机的要求更高，不仅仅要能正确分开输入的样本，即不仅仅要求 $\Theta ^{T}x$ >0，我们需要的是比 0 值大很多，比如大于等于 1，我也想这个比 0 小很多，比如我希望它小于等于-1，这就相当于在支持向量机中嵌入了一个额外的安全因子。或者说 安全的间距因子。