SVM理论疏导——什么是超平面

超平面概念

超平面是一种数学上的概念,它是线上的一个点,也是平面上的一条直线,也是三维空间的一张平面。前面说的点、线、平面都可以是超平面,但一般都不叫为超平面,因为超平面是点、线、平面的推广,即大于三维的才叫超平面。
超平面是相对的,一般说起它,都会带上一个参照物,如这堆样本集需要找到一个超平面来划分,这里的超平面的维度实际上是样本集的维度减一。

百度百科上对超平面的数学定义是这样的:超平面H是从n维空间到n-1维空间的一个映射子空间

超平面初认识

下面是n维空间下超平面的一个线性方程:

其中,w 和 x 都是 n 维列向量,x 为平面上的点,w 为平面上的法向量,决定了超平面的方向,b 是一个实数,决定了超平面与原点的距离。

下面解释为什么w是法向量:

设定一二维方程为:
ax + 1/by + c = 0 (1)
(1)式转换一下为:
y = -abx -cb (2)
在这条(2)式直线上的点集设为i(x,y),则
i(x,y) = i(x,-abx-cb) = x(1,-ab) + (0,-cb)

上式意味着向量m(1,-ab)是该直线的方向,并且通过(0,-cb)这个点。令一个向量为n(a,1/b),可以发现m*n等于0。两个向量只有垂直相乘才会为0,m向量是该直线的方向,故n向量就是该直线的法向量。

故(1)式等价于:
(a,1/b)(x,y) + c = 0(a,1/b)(x,y+bc) = 0 (3)
利用式(3)进一步解释什么是超平面:
给定向量空间 Rn 中的一个点 P 和一个非零向量n ,满足

则称点集 i 为通过点p 的超平面,向量 n为通过超平面的法向量。按照这个定义,虽然当维度大于3才可以成为“超”平面,但是你仍然可以认为,一条直线是 R2 空间内的超平面,一个平面是 R3 空间内的超平面 。Rn 空间的超平面是Rn 空间内的一个 n - 1 维的仿射子空间。

点到超平面的距离

样本空间中的任意一点 x,到超平面(w,b)的距离,可以表示为:


下面证明下:

设一个超平面公式如下:

超平面有一个点为x‘,故可得:

对于空间上任一点x,它到超平面的距离实际上等于x‘x向量在超平面法向量上的投影(纸上稍微画下即可知道)。

两个向量u、v的投影计算为:

所以距离就是将 xx’ 乘以法向量 w 的单位向量即可。

判断超平面的正反面

一个超平面可以将它所在的空间分为两半, 它的法向量指向的那一半对应的一面是它的正面, 另一面则是它的反面。如果利用数学来判断的话,需要利用到法向量 w。

存在疑问

  1. 为什么超平面一定过原点
  2. 上述超平面方称,b 是一个实数,为什么代表超平面到原点的距离?
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章