超平面概念
超平面是一種數學上的概念,它是線上的一個點,也是平面上的一條直線,也是三維空間的一張平面。前面說的點、線、平面都可以是超平面,但一般都不叫爲超平面,因爲超平面是點、線、平面的推廣,即大於三維的才叫超平面。
超平面是相對的,一般說起它,都會帶上一個參照物,如這堆樣本集需要找到一個超平面來劃分,這裏的超平面的維度實際上是樣本集的維度減一。
百度百科上對超平面的數學定義是這樣的:超平面H是從n維空間到n-1維空間的一個映射子空間
超平面初認識
下面是n維空間下超平面的一個線性方程:
其中,w 和 x 都是 n 維列向量,x 爲平面上的點,w 爲平面上的法向量,決定了超平面的方向,b 是一個實數,決定了超平面與原點的距離。
下面解釋爲什麼w是法向量:
設定一二維方程爲:
ax + 1/by + c = 0 (1)
(1)式轉換一下爲:
y = -abx -cb (2)
在這條(2)式直線上的點集設爲i(x,y),則
i(x,y) = i(x,-abx-cb) = x(1,-ab) + (0,-cb)
上式意味着向量m(1,-ab)是該直線的方向,並且通過(0,-cb)這個點。令一個向量爲n(a,1/b),可以發現m*n等於0。兩個向量只有垂直相乘纔會爲0,m向量是該直線的方向,故n向量就是該直線的法向量。
故(1)式等價於:
(a,1/b)(x,y) + c = 0 或 (a,1/b)(x,y+bc) = 0 (3)
利用式(3)進一步解釋什麼是超平面:
給定向量空間 Rn 中的一個點 P 和一個非零向量n ,滿足
則稱點集 i 爲通過點p 的超平面,向量 n爲通過超平面的法向量。按照這個定義,雖然當維度大於3纔可以成爲“超”平面,但是你仍然可以認爲,一條直線是 R2 空間內的超平面,一個平面是 R3 空間內的超平面 。Rn 空間的超平面是Rn 空間內的一個 n - 1 維的仿射子空間。
點到超平面的距離
樣本空間中的任意一點 x,到超平面(w,b)的距離,可以表示爲:
下面證明下:
設一個超平面公式如下:
超平面有一個點爲x‘,故可得:
對於空間上任一點x,它到超平面的距離實際上等於x‘x向量在超平面法向量上的投影(紙上稍微畫下即可知道)。
兩個向量u、v的投影計算爲:
所以距離就是將 xx’ 乘以法向量 w 的單位向量即可。
判斷超平面的正反面
一個超平面可以將它所在的空間分爲兩半, 它的法向量指向的那一半對應的一面是它的正面, 另一面則是它的反面。如果利用數學來判斷的話,需要利用到法向量 w。
存在疑問
- 爲什麼超平面一定過原點
- 上述超平面方稱,b 是一個實數,爲什麼代表超平面到原點的距離?