範數的數學意義

L0,L1,L2範數的數學意義

(如有不當,敬請斧正)

Tips

範數所表示的一些數學意義:衆數,中位數,均值

  • A:\mathcal{A:} L0範數:求L0範數最小時,表示的是數據中的衆數modes(假設00=00^0=0的條件下)。其中Y:{y1,y2,...,yk}\mathcal{Y}:\{{y_1,y_2,...,y_k}\}是數據集樣本,β\beta是目標。現目前主流公認較多的均是00=10^0=1,但是此刻00=00^0=0假設會對下列數學表示非常簡便,並且能很好體現統一性。
    L0=Yβ0=1ki=1k(yiβ)0 L0=\|\mathcal{Y-\beta}\|_0=\frac{1}{k}\sum_{i=1}^{k}{(y_i - \beta)^0}
    特別地,在機器學習中一般並沒有使用L0範數,因爲一般需要遍歷整個數據,開銷較大;還有一點就是L0範數能夠讓0變得多,所以一般用於稀疏。此刻很明顯地,當yiy_iβ\beta不相等的時候,值總是爲1,只有當β\beta是數據集Y\mathcal{Y}的衆數時候,才能保證L0範數的值最小。

  • B:\mathcal{B:} L1範數:即是絕對值距離;求L1範數最小時,表示的是數據中的中值(中位數medians)。其中Y\mathcal{Y}β\beta表示的意義不變。很好理解就是目標β\beta要儘可能離數據集Y\mathcal{Y}更近,表示出L1範數形式如下:
    L1=Yβ1=1ki=1kyiβ L1=\|\mathcal{Y}-\beta\|_1=\frac{1}{k}\sum_{i=1}^{k}{|y_i - \beta|}
    要找出使L1範數最小的β\beta的值,那麼即對它求偏導:
    L1β=1ki=1ksgn(yiβ) \frac{\partial L1}{\partial \beta}=-\frac{1}{k}\sum_{i=1}^{k}{ sgn( y_i - \beta)}
    其中sgn(.)sgn(.)是符號函數(值爲+1或者-1),當L1β\frac{\partial L1}{\partial \beta}爲0的時候,即β\beta應該是Y\mathcal{Y}數據集的中值(保證yiy_i大於β\beta和小於β\beta的部分是相同的,才能確保得到的符號函數正負1的值一樣來相互抵消,從而偏導爲0,得到絕對值距離最值)。

  • C:\mathcal{C:} L2範數:即是平方差(歐式)距離(一般都不用開根號,直接用平方的形式);求L2範數最小的時候,表示的是數據中的均值means。其中Y\mathcal{Y}β\beta表示的意義不變。表示出L2範數形式如下:
    L2=Yβ22=1ki=1k(yiβ)2 L2=\|\mathcal{Y}-\beta\|_2^2=\frac{1}{k}\sum_{i=1}^{k}{(y_i - \beta)^2}
    同樣求偏導,當L2β\frac{\partial L2}{\partial \beta}爲0的時候,即β\beta應該是均值。
    L2β=2ki=1k(yiβ) \frac{\partial L2}{\partial \beta}=-\frac{2}{k}\sum_{i=1}^{k}{( y_i - \beta)}
    L2β=0β=1ki=1kyi \frac{\partial L2}{\partial \beta}=0 \rightarrow \beta=\frac{1}{k}\sum_{i=1}^{k}{y_i}

參考

http://www.johnmyleswhite.com/notebook/2013/03/22/modes-medians-and-means-an-unifying-perspective/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章