L0,L1,L2範數的數學意義
(如有不當,敬請斧正)
Tips:
範數所表示的一些數學意義:衆數,中位數,均值
-
A: L0範數:求L0範數最小時,表示的是數據中的衆數modes(假設00=0的條件下)。其中Y:{y1,y2,...,yk}是數據集樣本,β是目標。現目前主流公認較多的均是00=1,但是此刻00=0假設會對下列數學表示非常簡便,並且能很好體現統一性。
L0=∥Y−β∥0=k1i=1∑k(yi−β)0
特別地,在機器學習中一般並沒有使用L0範數,因爲一般需要遍歷整個數據,開銷較大;還有一點就是L0範數能夠讓0變得多,所以一般用於稀疏。此刻很明顯地,當yi和β不相等的時候,值總是爲1,只有當β是數據集Y的衆數時候,才能保證L0範數的值最小。
-
B: L1範數:即是絕對值距離;求L1範數最小時,表示的是數據中的中值(中位數medians)。其中Y和β表示的意義不變。很好理解就是目標β要儘可能離數據集Y更近,表示出L1範數形式如下:
L1=∥Y−β∥1=k1i=1∑k∣yi−β∣
要找出使L1範數最小的β的值,那麼即對它求偏導:
∂β∂L1=−k1i=1∑ksgn(yi−β)
其中sgn(.)是符號函數(值爲+1或者-1),當∂β∂L1爲0的時候,即β應該是Y數據集的中值(保證yi大於β和小於β的部分是相同的,才能確保得到的符號函數正負1的值一樣來相互抵消,從而偏導爲0,得到絕對值距離最值)。
-
C: L2範數:即是平方差(歐式)距離(一般都不用開根號,直接用平方的形式);求L2範數最小的時候,表示的是數據中的均值means。其中Y和β表示的意義不變。表示出L2範數形式如下:
L2=∥Y−β∥22=k1i=1∑k(yi−β)2
同樣求偏導,當∂β∂L2爲0的時候,即β應該是均值。
∂β∂L2=−k2i=1∑k(yi−β)
∂β∂L2=0→β=k1i=1∑kyi
參考
http://www.johnmyleswhite.com/notebook/2013/03/22/modes-medians-and-means-an-unifying-perspective/