算法工程師的數學基礎|微積分之微分相關介紹

【算法工程師的數學基礎】系列將會從線性代數、微積分、數值優化、概率論、信息論五個方面進行介紹,感興趣的歡迎關注【搜索與推薦Wiki】公衆號,獲得最新文章。

《算法工程師的數學基礎》已更新:

接下來將會有兩篇文章分別介紹下微積分中的微分和積分,內容來自網上公開資料、相關書籍和個人見解。

微積分 是對無窮小量的研究。無窮小量,簡單說就是大小無限趨向於 0 的量, 很多整體分析太過複雜的物理量可以用無窮小量分析,其原因是無窮小量可以被線性化。

如果我們用 ϵ\epsilon 來表示無窮小量,那麼微積分可以被分爲兩大類,微分和積分。

  • 微分主要研究兩個無窮小量的比值,形如 ϵ1ϵ2\frac {\epsilon_1}{\epsilon_2}
  • 積分學主要研究無限多的無窮小量之和,也就是 ϵ1+ϵ2+ϵ3+...=limnk=1nϵk\epsilon_1 + \epsilon_2 + \epsilon_3 + ... = \underset{ n \rightarrow \infty }{ \lim } \sum_{k=1}^{n} \epsilon_k

本篇主要介紹微分!內容注重理解微分的概念和與導數的區別,不像導數篇中那樣用公式貫穿全文!


導數與線性化

微積分之所以在數學、物理學和工程學中有如此重要的地位,是因爲在這些學科中有很多情況不好直接分析,而通過微積分可以把這些情況線性化。然而,在線性化的同時,研究對象就會變成無窮小量。

eg 1:一個正方形金屬薄片受熱後面積的改變量
正方形金屬薄片受熱後面積的改變量

設邊長由 x0x_0 變成 x0+Δxx_0 + \Delta x,則正方形的面積由x02x_0 ^2 變成 (x0+Δx)2(x_0 + \Delta x)^2,那麼面積之差爲:
ΔA=(x0+Δx)2x02=2x0Δx+(Δx)2 \Delta A = (x_0 + \Delta x)^2 - x_0 ^2 \\ = 2 x_0 \Delta x + (\Delta x)^2

上式中

  • 加號左側爲 Δx\Delta x的線性部分,且爲ΔA\Delta A的主要組成部分
  • 加號右側爲 Δx\Delta x的高階無窮小,當Δx\Delta x很小時,可以忽略

從上面的例子中,可以看出函數線性化的那麼一丁點意思了,接着看另外一個例子。

eg 2:假設一輛正在行駛的汽車,其走過的路程與時間滿足關係 x(t)=t2x(t) = t ^2,那麼在t=1t=1時刻,如何知道他的速度?

由於平均速度v=ΔxΔt=x1x0t1t0v = \frac {\Delta x}{ \Delta t} = \frac{x_1 - x_0}{ t_1 - t_0},帶入 t0=1t_0=1得到從時刻1t1\rightarrow t的平均速度爲:
x(t)x(1)t1 \frac{x(t) - x(1)}{ t-1 }

如果讓 t=1.1t=1.1,那麼這個平均速度就很接近t=1t=1這一時刻的瞬間速度了。那麼有理由相信在 tt無限接近於1時,這個平均速度就很接近tt時刻的瞬間速度了。

從平均速度的定義來看,從1t1\rightarrow t的平均速度等價於連接(1,1)(1,1)(t,t2)(t,t^2)兩點直線的斜率,所以當 tt越來越接近於1的時候,這條直線的斜率就變成了在(1,1)(1,1)切線的斜率。

而從導數的概念可以知道,函數在某點的斜率等於改點的導數,結合 eg 2可知
f(t)=2t=ΔyΔx f'(t) = 2t = \frac{\Delta y}{ \Delta x}
Δy=2tΔx \Rightarrow \Delta y = 2 t \Delta x

和 eg 1中,當 Δx\Delta x趨向於無窮小時的表達式是一樣的,我們可以認爲 Δy\Delta y是關於Δx\Delta x的線性化函數。

微分的定義

設函數y=f(x)y=f(x)在某區間內有定義,且 x0x_0x0+Δxx_0 + \Delta x在這區間內,如果下面的公式成立(其中AA是與Δ\Delta無關的常數),則稱 y=f(x)y = f(x)在點x0x_0處可微,並且稱AΔxA \Delta x爲函數y=f(x)y = f(x) 在點x0x_0相應於自變量增量Δx\Delta x的微分,計作:dyx=x0dy|_{x=x_0}df(x0)df(x_0),即:dyx=x0=AΔxdy|_{x=x_0} = A \Delta x

Δy=f(x0+Δx)f(x0)=AΔx+o(Δx0) \Delta y = f(x_0 + \Delta x) - f(x_0) = A\Delta x + o(\Delta x_0)

微分dydy 叫做函數增量Δy\Delta y的線性主部。這也是微分的實質:微分 本質是一個微小的線性變化量,用一個線性函數作爲原函數變化的逼近。

由上面的定義可知:

  • dydy是自變量的改變量Δx\Delta x的線性函數
  • Δydy=o(Δx)\Delta y - dy = o(\Delta x)是比Δx\Delta x的高階無窮小
  • A0A \neq 0時,dydyΔy\Delta y是等價無窮小,因爲:Δydy=1+o(Δx)dy1(Δx0)\frac {\Delta y}{ dy} = 1 + \frac{o(\Delta x)}{dy} \rightarrow 1(\Delta x \rightarrow 0)
  • AA是與Δx\Delta x無關的常數,但與f(x)f(x)x0x_0有關
  • Δx\Delta x很小時,Δydy\Delta y \approx dy(線性主部)

從微分的定義中也可以看出微分和導數的最大區別爲:導數是指函數在某一點變化的快慢,是一種變化率;微分是指函數在某一點處的變化量,是一種變化的量。

基本初等函數的微分公式和運算法則

微分公式

cotxcotx :餘切函數,cotx=1tanxcotx = \frac {1}{ tan x}

secxsecx :正割函數,secx=1cosxsecx = \frac {1}{ cos x}

cscxcscx :餘割函數,cscx=1sinxcscx = \frac {1}{ sin x}

d(C)=0 d(C)=0
d(xμ)=μxμ1dx d(x^\mu) = \mu x^{\mu-1} dx
d(sinx)=cosxdxd(cosx)=sinxdxd(tanx)=sec2xdxd(cotx)=cscxdxd(secx)=secxtanxdxd(cscx)=cscxcotxdx d(sin\,x) = cos\,x\,dx \\ d(cos\,x) = -sin\,x\,dx \\ d(tan\,x) = sec^2\,x\,dx \\ d(cot\,x) = -csc \, x dx \\ d(sec\,x) = sec\,x \,tan\,x dx \\ d(csc\,x) = - csc\,x cot\,x\,d x
d(ax)=axlnadx d(a^x) = a^xln a dx
d(ex)=exdx d(e^x) = e^x dx
d(logax)=1lnadx d(log_a x) = \frac{1}{ ln a} dx
d(lnx)=1xdx d(lnx)=\frac{1}{x} dx
d(arcsinx)=11x2dx d(arc sinx) = \frac{1}{\sqrt{1-x^2}}dx
d(arccosx)=11x2dx d(arc cosx) = - \frac{1}{\sqrt{1-x^2}}dx
d(arctanx)=11+x2dx d(arc tanx) = \frac{1}{1+x^2}dx
d(arccotx)=11+x2dx d(arc cotx) = - \frac{1}{1+x^2}dx

運算法則

d(u±v)=d(u)±d(v) d(u \pm v) = d(u)\pm d(v)
d(Cu)=Cd(u) d(Cu) = Cd(u)
d(uv)=vd(u)+ud(v) d(uv) = vd(u) + ud(v)
d(uv)=vd(u)ud(v)v2 d(\frac{u}{v}) = \frac{vd(u) - ud(v)}{v^2}

微分的幾何意義

微分的幾何意義

Δy\Delta y是曲線的縱座標的增量時,dydy 是切線縱座標對應的增量,當Δx\Delta x很小時,在點MM附近,切線段MPMP可近似代替曲線段MNMN

在局部範圍內用線性函數近似代替非線性函數,在幾何上就是局部用切線段代替曲線段,這在數學上稱之爲非線性函數的局部線性化,這就是微分學的基本思想之一。

微分在近似計算中的應用

微分近似計算的理論基礎

Δx\Delta x很小時

Δydy=f(x0)Δx \Delta y \approx dy = f'(x_0) \Delta x
上面的公式也可以寫爲:
Δy=f(x0+Δx)f(x0)f(x0)Δx \Delta y = f(x_0 + \Delta x) -f(x_0) \approx f'(x_0) \Delta x

f(x0+Δx)=f(x0)+f(x0)Δx f(x_0 + \Delta x) = f(x_0) + f'(x_0) \Delta x
將上式中的 x0+Δxx_0 + \Delta xxx代替,則可以改寫爲:
f(x)=f(x0)+f(x0)(xx0) f(x) = f(x_0) + f'(x_0) (x-x_0)

常見的近似計算的基本公式

1+xn+1nx \sqrt[n]{ 1+x} \approx + \frac{1}{n} x
sinxx sin x \approx x

tanxx tan x \approx x

ex1+x e^x \approx 1+x

ln(1+x)x ln(1+x) \approx x

微分中值定理和導數的應用

費馬引理

設 函數f(x)在點 x0x_0的某鄰域U(x0)U(x_0)內有定義,並且再x0x_0處可導,如果對任意的xU(x0)x\in U(x_0)有:f(x)f(x0)f(x) \leqslant f(x_0)f(x)f(x0)f(x) \geqslant f(x_0),那麼f(x0)=0f'(x_0) = 0

羅爾定理

如果函數f(x)f(x)滿足

  • 在閉區間[a,b][a,b]上連續
  • 在開區間(a,b)(a,b)內可導
  • 在區間端點處的函數值相等,即f(a)=f(b)f(a)=f(b)

那麼(a,b)(a,b)上至少有一點ε(a<ε<b)\varepsilon(a<\varepsilon < b)使得f(ε)=0f'(\varepsilon)=0

拉格朗日中值定理

如果函數f(x)f(x)滿足:

  • 在閉區間[a,b][a,b]上連續
  • 在開區間(a,b)(a,b)內可導
    那麼在(a,b)(a,b)內至少有一點ε(a<ε<b)\varepsilon(a<\varepsilon < b)使得f(b)f(a)=f(ε)(ba)f(b)-f(a)=f'(\varepsilon)(b-a)成立。

柯西中值定理

如果函數f(x)f(x)F(x)F(x)滿足:

  • 在閉區間[a,b][a,b]上連續
  • 在開區間(a,b)(a,b)內可導
  • 對任一 x(a,b),F(x)0x \in (a,b), F'(x) \neq 0

那麼在(a,b)(a,b)內至少有一點ε\varepsilon,使下面等式成立。
f(b)f(a)F(b)F(a)=f(ε)F(ε) \frac{f(b)-f(a)}{F(b)-F(a)} = \frac{f'(\varepsilon)}{F'(\varepsilon)}

洛必達法則

設:

  • x>ax -> a時,函數f(x)f(x)F(x)F(x)都趨向於零
  • 在點aa的某去心鄰域內,f(x)f'(x)F(x)F'(x)都存在且F(x)0F'(x) \neq 0
  • limxaf(x)F(x)\lim_{x \rightarrow a} \frac{f(x)}{F(x)}存在(或爲無窮大)
    那麼:
    limxaf(x)F(x)=limxaf(x)F(x) \lim_{x \rightarrow a} \frac{f(x)}{F(x)}=\lim_{x \rightarrow a} \frac{f'(x)}{F'(x)}

這種在一定條件下通過分子分母分別求導再求導極限來確定未定式的值的方法稱爲洛必達法則。

泰勒中值定理

如果函數f(x)f(x)在含有x0x_0的某個開區間(a,b)(a,b)內具有直到(n+1)(n+1)階的導數,則對任一x(a,b)x \in (a,b),有:
f(x)=f(x0)+f(x0)(xx0)+f(x0)2!(xx0)2+...+fn(x0)n!(xx0)n+Rn(x) f(x) = f(x_0) + f'(x_0)(x-x_0) + \frac{f''(x_0)}{2!} (x-x_0)^2 + ... + \frac{f^n(x_0)}{n!} (x-x_0)^n + R_n(x)
其中
Rn(x)=fn+1(ε)(n+1)!(xx0)n+1 R_n(x) = \frac{f^{n+1} ( \varepsilon )}{ (n +1)!} (x-x_0) ^{n+1}
這裏ε\varepsilonx0x_0xx之間的某個值。

上述公式中f(x)f(x)表達式爲 f(x)f(x)(xx0)(x-x_0)的冪展開的帶有拉格朗日型餘項的nn階泰勒公式,Rn(x)R_n(x)的表達式稱爲拉格朗日型餘項。


OK,關於微積分中的微分部分已經介紹完畢!期待下篇的積分吧!


參考資料

  • https://blog.csdn.net/weixin_40163242/article/details/89004822
  • https://www.zhihu.com/question/336322284
  • https://www.zhihu.com/question/264955988?sort=created

掃一掃 關注微信公衆號!號主 專注於搜索和推薦系統,嘗試使用算法去更好的服務於用戶,包括但不侷限於機器學習,深度學習,強化學習,自然語言理解,知識圖譜,還不定時分享技術,資料,思考等文章!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章