【机器学习】SVM核函数的计算

原創

2020-07-06 12:39

在【机器学习】推导支持向量机SVM二分类中，我们已经推导出线性核SVM的对偶优化问题：

J = \sum i α i - 1 2 \sum i \sum j α i α j d i d j k (x i) T k (x j) = \sum i α i - 1 2 \sum i \sum j α i α j d i d j K (x i, x j) s u b j e c t t o \sum α i d i = 0, 0 \leq α i \leq C

在优化好

αi 拉格朗日量后，我们得到的w和b为：

w = \sum α i d i x i b = - (y 1 + y - 1) / 2

需要注意的是，

w 的表达式中有

xi 。
　　我们引入核函数

K(xi,xj) 到SVM，必须注意到

K(xi,xj)=ϕ(xi)Tϕ(xj) ，也就是说理论上核函数应该能拆开。在引入核函数的前提下，w的表达式为

w = \sum α i d i ϕ (x i) T

　　我们已知几个常用核函数，比如多项式核函数和径向基核函数。多项式核函数的的定义为

K (x i, x j) = (x T i x j + 1) n

假设n=2，那么拆开为

K (x i, x j) = (x T i) 2 x 2 j + 2 x i x j + 1 = [(x T i) 2, 2 ‾ ‾ \sqrt x T i, 1] [(x T j) 2, 2 ‾ ‾ \sqrt x T j, 1] T

这里，我们可以确实求出w的值。
　　径向基核函数定义为

K (x i, x j) = e - ( x i - x j ) 2 σ 2 = e - x 2 i σ 2 e - x 2 j σ 2 e x T i x j σ 2 = e - x 2 i σ 2 e - x 2 j σ 2 \sum k = 0 \infty ( 2 x T i x j / σ 2 ) k k ! = [e - x 2 i σ 2, 1, 2 1 ‾ ‾ \sqrt x i σ, 2 2 2 ! ‾ ‾ ‾ \sqrt (x i σ) 2, . . .] [e - x 2 j σ 2, 1, 2 1 ‾ ‾ \sqrt x j σ, 2 2 2 ! ‾ ‾ ‾ \sqrt (x j σ) 2, . . .] T

结果表明，

Φ(x) 函数是一个无限维度的函数。这说明，在工程上我们不一定能够完美地拆开核函数为

K(xi,xj)=ϕ(xi)Tϕ(xj) 。之后还有很多各种类型的核函数，比如使用了tanh函数的核函数，这些核函数在工程上是很难拆分求解的，很难获取

ϕ(x) 函数，亦难以求取w的确切值。
　　那么如何求解引入复杂核函数的SVM呢？在优化求解J之后，我们可以获取并保存

αi 。由于SVM只有少量支持向量（数据）对决策超平面有决定作用，很多拉格朗日参数

αi→0 ，我们可以只保存足够大的

αi 以及对应的训练数据

xi 、标记

di ，不直接计算出w的确切值，这在工程上是确实可行的。
　　当我们需要进行预测的时候，我们导入

αi ,

xi 和

di ，然后把新数据x代入核函数，计算

y=∑iαidiK(xi,x)+b 即可。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.