機器學習（1）：機器學習與數學分析

近期因工作需要，開始學習機器學習。學習心得體會，定期更新梳理出來，首次接觸，可能有理解和解釋不到位的地方，望批評指正，也算是自我提升。

提到機器學習，樓主第一反應是各種複雜的公式，各種搞不定的矩陣計算、積分、微分、熵等，甚至還專門爲此重新學習了線性代數。其實從機器學習的角度去看數學知識，基本的高等數學、概率論等已經滿足需求。

以下回顧三個常用的數學知識，並和機器學習中的數學簡單關聯。
**

(1)、自然對數e的引出

**
先從一個問題出發，求如下s的值：

s = 1 0 ! + 1 1 ! + 1 2 ! + 1 3 ! + 1 4 ! + . . . + 1 n ! + . . .

問題分析：
如果令

f(x)=logax

我們知道所有對數函數都會經過點(1，0)，則在底數a爲何值時，(1，0)處的導數爲1呢？我們知道f(x)的極限值：

f ( x + Δ x ) - f ( x ) Δ x = log a ( x + Δ x ) - log a ( x ) Δ x = log a (x + Δ x Δ x) 1 Δ x

由於在(1，0)處的導數爲1，則當

Δx 趨於無窮小時：

log a (1 + Δ x) 1 Δ x = 1

等價於：

lim n \to \infty （ 1 + 1 n ） n = ?

由此引入自然對數e，上述問題的極限，即s的值也爲e。
**

(2)、導數與梯度下降

**
簡單來說，導數就是曲線的斜率，是曲線變化快慢的體現。二階導數就是曲線斜率變化快慢的反映。
我們知道，如果函數z=f(x,y)在點P(x,y)處的導數存在，則函數在該點任意方向L上的偏導數都存在，並且有：

\partial ( f ) \partial ( l ) = \partial ( f ) \partial ( x ) c o s φ + \partial ( f ) \partial ( l ) s i n φ

其中

φ 爲X軸到方向L的轉角。
上述公式可用矩陣表述爲：

\partial ( f ) \partial ( l ) = (\partial ( f ) \partial ( x ), \partial ( f ) \partial ( l )) \cdot (c o s φ, s i n φ) T

兩個向量在什麼時候點乘最大呢？由於：

a⋅b=|a||b|cosφ
答案是同方向的時候，點乘最大，所以機器學習的一個經典算法–梯度下降，形如從山頂走到山腳，以最快的速度下降，採用的就是當前所在位置的偏導數，沿着偏導數的方向下降，能以最快的速度到達目的地。

(∂(f)∂(x),∂(f)∂(l)) 爲函數z=f(x,y)在P點的梯度，記做gradf(x,y)。
梯度的方向是函數在當前點變化最快的方向。

(3)、組合數背後的祕密

**
先看一個典型的古典概率問題：將12個正品和3個次品，隨機裝在3個箱子中，每箱裝5件，則每個箱子恰好有一個次品的概率是多少？
先把15個產品裝入3個箱子，共有裝法：15!/(5!5!5!)
3個次品裝入3個箱子，共有：3!種裝法。然後把12個正品裝入3個箱子，每個4件，共有裝法：12!/(4!4!4!)
所以概率P(A)=(3!*12!/(4!4!4!))/(15!/(5!5!5!))

一個通用的問題：N個物品分成k組，使得每組物品的個數分別爲n1、n2、……、nk（N=n1+n2+……+nk），則不同的分組方法有：N!n1!n2!…nk!
當N趨於無窮大時，我們來求一個特殊的值：

H = 1 N l n N ! n 1 ! n 2 ! \dots n k !

由於N趨於無窮大時，lnN!—–>N(LnN-1)
上述計算等價於：

l n N - 1 - 1 N \sum i = 1 k n i (l n n i - 1) = - 1 N （ \sum i = 1 k n i (l n n i) - N l n N) = - 1 N \sum i = 1 k (n i (l n n i) - n i l n N) = - 1 N \sum i = 1 k (n i l n n i N) = - \sum i = 1 k (n i N l n n i N)

共有N個盒子，

niN 相當於第i個盒子的頻率，即p，上述H最後轉換爲：

H = - \sum i = 1 k (p i) l n (p i)

這個式子我們認識有木有，熵由此引出。

機器學習（1）：機器學習與數學分析

(1)、自然對數e的引出

(2)、導數與梯度下降

(3)、組合數背後的祕密

機器學習（6）：線性迴歸

機器學習（2）：概率論與貝葉斯先驗

tomcat設置不輸出catalina.out

機器學習（1）：機器學習與數學分析

機器學習（5）、數據清洗和特徵選擇

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結