變分法與最速降線問題

本文主要參考變分法及其應用.

在諸多優化問題中,優化的變量是一個函數,也就是說需要找到一個函數,使得某個特定的目標最小。

固體力學中的最小勢能原理

處於平衡狀態的彈性體,真實位移場使得系統總勢能取最小值。

基於勢能原理,也發展出了固體力學中的變分解法,也就是求出使得總勢能最小的位移場,該位移就是真實的位移解答。

同樣變分法也可以用於最優控制中,求取控制律,使得系統系統的性能指標最優,而控制律通常是時間的函數。

1. 泛函

泛函其實是挺難理解的概念,首先看微積分中函數的概念。

定義在實數域RR上的一元函數y=f(x)y=f(x),值域也是實數集RR,實際上是定義了一種映射關係fff: RRf:~R \to R

而泛函的定義域並不是數集,而是函數集。

假設函數集合CCyC\forall y \in C,yy的定義域爲[x0,x1][x_0,x_1]yy都爲可微函數,且

(1)y(x0)=y0, y(x1)=y1y(x_0)=y_0,~y(x_1)=y_1\tag{1}

也就是說函數幾何CC中的元素均爲平面上從點A(x0, y0)A(x_0,~y_0)到點 B(x1, y1)~B(x_1,~y_1)的光滑曲線。

這裏討論泛函J(y)J(y)的定義域就是函數集合CC,其值域是實數集RR。泛函J(y)J(y)同樣定義了一種映射關係J: CRJ:~C \to R。一般泛函可以用積分式表示:

(2)J[y(x)]=abF(x, y, y)dxJ[y(x)]=\int_{a}^{b}F(x,~y,~y')\text{d}x\tag{2}

2. 泛函變分

函數y=f(x)y=f(x)的微分dydy指的是由於自變量xx+dxx \to x+dx所引起的因變量yy的變化量dy=f(x+dx)f(x)dy=f(x+dx)-f(x)

而泛函J[y(x)]J[y(x)]的變分δJ\delta J指的是由於自變量yy+δyy \to y+\delta y所引起的因變量JJ的變化δJ=J[y+δy]J[y]\delta J=J[y+\delta y]-J[y]

yy+δyy \to y+\delta y時,利用多元函數的一階Taylor展開

(3)F(x, y+δy, y+δy)=F(x, y, y)+Fyδy+FyδyF(x,~y+\delta y,~y'+\delta y')=F(x,~y,~y')+\frac{\partial F}{\partial y}\delta y+\frac{\partial F}{\partial y'}\delta y'\tag{3}

因此,泛函δJ\delta J可以表爲

(4)δJ=ab[Fyδy+Fyδy]dx\delta J=\int_{a}^{b} \left[ \frac{\partial F}{\partial y}\delta y+\frac{\partial F}{\partial y'}\delta y' \right]\text{d}x\tag{4}

3. 泛函極值

函數y=f(x)y=f(x)取在x=x0x=x_0處取極值的必要條件是

dydxx=x0=0\frac{dy}{dx}\Big|_{x=x_0}=0

泛函J[y(x)]J[y(x)]取極值的必要條件是

(5)δJ=0\delta J = 0\tag{5}

(6)Fyddx(Fy)=0\frac{\partial F}{\partial y}-\frac{\text{d}}{\text{d}x}\left(\frac{\partial F}{\partial y'}\right)=0\tag{6}

下面證明上述必要條件,證明過程很長,並且有點不嚴謹。

理論上δy\delta y是任意小的函數,可以取δy=εφ(x)\delta y=\varepsilon \varphi(x)ε\varepsilon是任意小的實數,φ(x)\varphi(x)爲可微函數,並滿足

(7)φ(a)=0, φ(b)=0\varphi(a)=0,~\varphi(b)=0\tag{7}

這樣函數J[y(x)+εφ(x)]J[y(x)+\varepsilon\varphi(x)]ε\varepsilon的函數,在ε=0\varepsilon=0處取得極值。因此有

(8)ddε(J[y(x)+εφ(x)])ε=0=0\frac{\text{d}}{\text{d}\varepsilon}\left(J[y(x)+\varepsilon\varphi(x)]\right)\Big|_{\varepsilon=0}=0\tag{8}

參考式(3)有

(9)J[y(x)+εφ(x)]=J[y(x)]+ab[Fyεφ(x)+Fyεφ(x)]dxJ[y(x)+\varepsilon\varphi(x)]=J[y(x)]+\int_{a}^{b}\left[\frac{\partial F}{\partial y}\varepsilon\varphi(x)+\frac{\partial F}{\partial y'}\varepsilon\varphi'(x)\right]\text{d}x\tag{9}

將式(9)帶入式(8)中,

(10)ddε(J[y(x)+εφ(x)])ε=0=ab[Fyφ(x)+Fyφ(x)]dx=0\frac{\text{d}}{\text{d}\varepsilon}\left(J[y(x)+\varepsilon\varphi(x)]\right)\Big|_{\varepsilon=0}=\int_{a}^{b}\left[\frac{\partial F}{\partial y}\varphi(x)+\frac{\partial F}{\partial y'}\varphi'(x)\right]\text{d}x=0\tag{10}

再以ε\varepsilon乘以上式有

(11)ab[Fyεφ(x)+Fyεφ(x)]dx=0=ab[Fyδy+Fyδy]dx=δJ=0\int_{a}^{b}\left[\frac{\partial F}{\partial y}\varepsilon\varphi(x)+\frac{\partial F}{\partial y'}\varepsilon\varphi'(x)\right]\text{d}x=0=\int_{a}^{b} \left[ \frac{\partial F}{\partial y}\delta y+\frac{\partial F}{\partial y'}\delta y' \right]\text{d}x=\delta J=0\tag{11}

這就證明了泛函取極值的必要條件是其變分爲零,下面再證另一個條件。

對式(10)應用分部積分

(12)0=ab[Fyφ(x)+Fyφ(x)]dx=abFyφ(x)dx+abFydφ(x)=abFyφ(x)dx+Fyφ(x)x=ax=babφ(x)d(Fy) 0=\int_{a}^{b}\left[\frac{\partial F}{\partial y}\varphi(x)+\frac{\partial F}{\partial y'}\varphi'(x)\right]\text{d}x \\ =\int_{a}^{b}\frac{\partial F}{\partial y}\varphi(x)\text{d}x+\int_{a}^{b}\frac{\partial F}{\partial y'}\text{d}\varphi(x) \\ =\int_{a}^{b}\frac{\partial F}{\partial y}\varphi(x)\text{d}x+\frac{\partial F}{\partial y'}\varphi(x)\Big|_{x=a}^{x=b}-\int_{a}^{b}\varphi(x)\text{d}\left(\frac{\partial F}{\partial y'}\right) \tag{12}

考慮到式(7),上式可以進一步簡化爲

(13)abFyφ(x)dxabφ(x)ddx(Fy)dx=0abφ(x)[Fyddx(Fy)]dx=0 \int_{a}^{b}\frac{\partial F}{\partial y}\varphi(x)\text{d}x-\int_{a}^{b}\varphi(x)\frac{\text{d}}{\text{d}x}\left(\frac{\partial F}{\partial y'}\right)\text{d}x=0 \\ \int_{a}^{b}\varphi(x)\left[\frac{\partial F}{\partial y}-\frac{\text{d}}{\text{d}x}\left(\frac{\partial F}{\partial y'}\right)\right]\text{d}x=0 \tag{13}

考慮到φ(x)\varphi(x)的任意性

(14)Fyddx(Fy)=0 \frac{\partial F}{\partial y}-\frac{\text{d}}{\text{d}x}\left(\frac{\partial F}{\partial y'}\right)=0 \tag{14}
即證明泛函極值的第二個必要條件,上式又被稱爲歐拉-拉格朗日條件(E-L條件)。

4. 最速降線

如下圖所示,最速降線問題指的是平面上兩點A(0, 0),B(p, q)A(0,~0),B(p,~q),一個質點mm沿着那條曲線無摩擦的下降時,時間最短。y軸正方向向下。

speedline coordinate

無摩擦,重力勢能全部轉化爲動能

(15)12mv2=mgyv=2gy \frac{1}{2}mv^2=mgy \\ v = \sqrt{2gy} \tag{15}

弧長微元ds\text{d}s與時間微元dt\text{d}t存在關係

(16)v=dsdt v = \frac{\text{d}s}{\text{d}t} \tag{16}

弧長微元ds\text{d}s可以表爲

(17)ds=1+y 2dx \text ds=\sqrt{1+y'~^2}\text dx \tag{17}

綜合式(14)(15)(16)時間微元可以表爲

(18)dt=dsv=1+y 22gydx dt=\frac{\text{d}s}{v} =\sqrt{\frac{1+y'~^2}{2gy}}\text dx \tag{18}

從點A到點B的下降時間tt可以積分得到

(19)t=0pdt=0p1+y 22gydx t=\int_{0}^{p}dt=\int_{0}^{p}\sqrt{\frac{1+y'~^2}{2gy}}\text dx \tag{19}

下降時間tt是曲線y=y(x)y=y(x)的泛函,最速降線就是t(y)t(y)的極值。因此最速降線必然滿足泛函極值的必要條件。

此處F(y,y)=1+y 22gyF(y,y')=\sqrt{\frac{1+y'~^2}{2gy}},須滿足E-L條件即式(13)。

(20)ddx(F(y,y)yFy)=Fyy+FyyyFyyddxFy=y[Fyddx(Fy)]=0 \frac{\text{d}}{\text dx}\left(F(y,y')-y'\frac{\partial F}{\partial y'}\right) \\ =\frac{\partial F}{\partial y}y'+\frac{\partial F}{\partial y'}y''-y''\frac{\partial F}{\partial y'}-y'\frac{\text{d}}{\text dx}\frac{\partial F}{\partial y'} \\ =y'\left[\frac{\partial F}{\partial y}-\frac{\text{d}}{\text{d}x}\left(\frac{\partial F}{\partial y'}\right)\right]=0 \tag{20}

因此,

(21)F(y,y)yFy=C F(y,y')-y'\frac{\partial F}{\partial y'}=C \tag{21}

F(y,y)F(y,y')代入上式

(22)1+y 22gyyy2gy1+y 2=C12gy1+y 2=Cy(1+y 2)=12gC2 \sqrt{\frac{1+y'~^2}{2gy}}-y'\frac{y'}{\sqrt{2gy}\sqrt{1+y'~^2}}=C \\ \frac{1}{\sqrt{2gy}\sqrt{1+y'~^2}}=C \\ y(1+y'~^2)=\frac{1}{2gC^2} \tag{22}

2gC2=2r2gC^2=2r,

(23)y(1+y 2)=2r y(1+y'~^2)=2r \tag{23}

爲了解出y=y(x)y=y(x),再引入參數代換。令

(24)y=cotθ2 y'=\cot\frac{\theta}{2} \tag{24}

因爲

(25)11+cot2θ=11+cos2θsin2θ=sin2θsin2θ+cos2θ=sin2θ \frac{1}{1+\cot^2\theta}=\frac{1}{1+\frac{cos^2\theta}{sin^2\theta}}=\frac{sin^2\theta}{sin^2\theta+\cos^2\theta}=sin^2\theta \tag{25}

所以

(26)y=2rsin2θ2=r(1cosθ) y=2rsin^2\frac{\theta}{2}=r(1-cos\theta) \tag{26}

爲了解出x=x(θ)x=x(\theta),將上式對θ\theta求導數

(27)ydxdθ=rsinθ y'\frac{\text dx}{\text d\theta}=r\sin\theta \tag{27}

(28)cotθ2dxdθ=rsinθdxdθ=rsinθcotθ2=rsinθsinθ2cosθ2=r2sinθ2cosθ2sinθ2cosθ2=2rsin2θ2=r(1cosθ) cot\frac{\theta}{2}\frac{\text dx}{\text d\theta}=r\sin\theta \\ \frac{\text dx}{\text d\theta} = r\frac{\sin\theta}{cot\frac{\theta}{2}}=r\frac{\sin\theta{sin\frac{\theta}{2}}}{cos\frac{\theta}{2}}=r\frac{2\sin\frac{\theta}{2}\cos\frac{\theta}{2}{sin\frac{\theta}{2}}}{cos\frac{\theta}{2}}\\ =2r\sin^2\frac{\theta}{2}=r(1-cos\theta) \tag{28}

積分之有

(29)x=r(θsinθ)+C0 x=r(\theta-\sin\theta)+C_0 \tag{29}

將邊界條件代入式(29)中,可以確定出常數C0=0, rC_{0}=0,~r,綜上

(30){x=r(θsinθ)y=r(1cosθ) \begin{cases} x = r(\theta-\sin\theta) \\ y = r(1-cos\theta) \end{cases} \tag{30}

最速降線不是一段圓弧,而是一段圓周運動產生的擺線。據傳牛頓用動力學的方法巧妙地得出了最速降線。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章