原文鏈接: 淺談變分法原理
淺談變分原理
對付數學物理中極值問題,變分大法(variational principle)可謂是殺人放火居家旅行的必備工具。今天這篇就來介紹變分法的基本思想。
碎碎念:我一個教物理的,爲啥成天一個勁寫數學呢???
變分大法軼事
大約1696年的6月,瑞士數學家 Johann Bernoulli 在 Acta Eruditorum(第一份德語的科學期刊)上向全世界的數學家發起了一項挑戰。他提出了這麼一個數學問題:讓一個物體從靜止開始沿着一個光滑無摩擦的軌道下滑,如果要求下滑過程耗時最短,軌道應該是什麼形狀?(在這篇文章後面的舉例中,我們會來具體處理這個問題)
這個問題被稱作最速降曲線問題(the brachistochrone problem)。這個問題是如此有趣,吸引了很多數學家的關注。Johann 本人利用光學原理類比給出了一種解法,他更牛掰的哥哥 Jacob Bernoulli 想到了另一種解法(是的,Bernoulli 家族盛產數學家,走量的那種)。此外,大名鼎鼎的 Gottfried Leibniz(跟牛頓爭微積分發明權的那位),Guillaume de l'Hôpital(洛必達法則就是他的名號)等人都給出了各自的解法。
風聲不久後也傳到了科學界早已功成名就的 Issac Newton 耳裏。1697年1月的某天,牛爵爺此時已在皇家造幣廠任職,他開開心心下班回家,發現了來自 Johann Bernoulli 的挑戰書。牛爵爺可能有點不太開心,內心也嘀咕着:老子牛逼頓,你們這些外國佬少來跟我在數學問題上囂張!或者按他自己的原話:I do not love to be pestered and teased by foreigners about mathematical things. 於是牛爵爺也忍不住試了試水。以牛爵爺的智商,他大概也就經過了那麼一晚上的思考,就運用變分法解決了問題,轉手就寫了封信寄回給了 Johann。
不過 Newton 很低調地將他的解答匿名寄了回去。然而 Newton 的解法是如此之風流瀟灑,令人拍案叫絕,即便沒有署名,Johann 也很快意識到了真正的作者是何方神聖。對此,他做出了著名的評價:I recognize the lion by his claw mark.
其實早在10多年前,牛爵爺在考慮在流體中會受到最小阻力的旋轉曲面該是什麼形狀的問題時,已經構建起了變分原理的基本思想。經過一大批數學家的傑出工作,現在變分法已經成爲了數學分析中的求極值問題的一種重要方法。
故事說這麼多,我們下面就要來開始硬核的討論了。
變分大法
假設我們有兩個定點 和 ,連接這兩點的任意曲線的方程 都將滿足如下的邊界條件:
現在考慮如下形式的定積分:
其中 是關於 和其一階導數 的函數,我們期望找到一個具體的 ,使得 有極值(極大或極小)。
注意在一般的極值問題中,我們考察的是自變量 的變化: 取值多少時,函數會有極值。而現在這個新問題的不同之處,我們考察的是函數 的變化: 是什麼形式時, 會有極值(高大上叫法: 稱作函數 的泛函)。然而這兩類問題依然有共通之處:當 取極值時,對 作微小的變化, 在一級近似下應該保持不變。
如果 有微小改變 (高大上叫法: 稱作函數 的變分),那麼 的變化爲:
相應的變化爲:
方括號裏的第二項可以改寫成 ,然後我們可以進行分部積分
由於 的邊界條件固定,,所以分部積分出來的第一項爲零,僅第二項有貢獻。代回(4)式中,稍作化簡可以得到
如果 有極值,對任意滿足邊界條件的 都必須有 ,這就要求:
這便是傳說中的 Euler-Lagrange 方程,它是變分法的核心定理。有了此等大殺器,原則上就可以找出所尋求的極值函數 。
通常來講 Euler-Lagrange 方程會是一個二階的微分方程, 的通解中含有的兩個待定常數剛好可以通過兩個邊界條件確定。我們下面來舉幾個例子操練操練。
例1:兩點間的最短路經
先來一個簡單的例子小試牛刀。
給定平面上兩點 和 ,連接它們的長度最短的曲線是什麼?
這個問題的答案小學生都知道,我們在這裏用變分法來殺殺這隻小雞仔。
曲線 上相近的兩點 和 之間的曲線元長度爲:
曲線的總長度爲:
現在希望 有最小值,我們可以取 ,運用 Euler-Lagrange 方程來尋找可以讓 有極小的函數 。注意到
代回(6)式中,容易得到
括號裏這一大坨的導數爲零,那麼括號裏這一大坨必然是一個常數,我們馬上可以推出 也必然是一個常數。因此我們需要尋找的 滿足直線方程:
斜率 和截距 很容易通過邊界點的座標算出。由此我們證明了大家非常熟悉的結論:兩點之間直線段的距離最短。
例2:最速降曲線
問題在開篇的歷史故事介紹中已經有提到,我們這裏直接進入解答環節。
爲方便起見,我們將座標系的 -軸搞成朝下的方向,斜向下的軌道可以由函數 給出,其中軌道的起點和終點分別設爲 和 ,我們來試求最速降曲線的函數式。
當物理下滑到 位置時,它的速度大小可以根據能量守恆關係解出
而根據定義,速度大小等於單位時間內走過的軌道長度
其中我們已經利用了之前(7)式中得到的結果。
(11)與(12)式聯立,可以寫出:
積分後就可以得到總時間的表達式:
爲了找出讓 取得極小的 ,我們可以取 ,再套用 Euler-Lagrange 方程來怒算一波。
丟回(6)式裏面,我們可以得到這麼一個初步的方程:
看到這種東西,要保持平靜,鐵了頭往下算,要相信好多噁心的東西會神奇地同歸於盡。
瞧,柳暗花明又一村。不過這還遠沒完,解這個二階微分方程還需要一個騷操作。我們對上式乘上一個 :
感謝 CCAV 這玩意兒居然是個全微分,它要等於零,方括號裏那一坨等於常數就完兒事了。且讓我們將這個常數寫作
原來的二階微分方程降次變成了一階,我們終於可以愉快地分離變量兩邊積分了
作三角換元,設 ,則
其中 是積分常數。我們再作逆變換變回到 ,注意到 ,於是
我們可以得到所求的最速降軌道的函數表達式:
軌道起點爲 ,很容易得出 ,於是結果可以進一步簡化
另一方面,軌道終點爲 ,上面的常數 還必須滿足:
可以證明,滿足邊界條件(21)的最速降曲線(20)將是一條擺線(cycloid):它是圓周上的一個定點在圓沿直線滾動時所形成的軌跡。
從(20)式很難看出這個結論,但其實滿足(17)式的 還可以寫成如下的參數方程:
其中 給出了滾動的圓的半徑。可以作如下的驗算:
這驗證了(22)式的參數方程確實是(17)式的解。而參數方程可以更明確地表達出擺線的幾何意義(如圖)。
例3:懸鏈線
這個數學問題同樣也起源於物理:懸在等高的兩點間的受重力作用的軟繩形成的曲線應該是什麼形狀?
這類曲線統稱爲懸鏈線(catenary ),在工程和設計中有廣泛的應用。比如懸索橋、架空電纜等都會出現懸鏈線的設計,而在很多拱門、教堂拱頂的設計中,還會出現倒懸鏈線的蹤影。
我們在此考慮一個稍有不同的問題。假設有等高的兩個支點,它們的座標爲 和 。軟繩搭在這兩個支點上,一部分懸在兩個支點之間,多出來的部分自由下垂耷拉到地面上(如圖所示)。
整個體系會自發去向勢能最低的狀態,因此我們需要找的便是勢能最低狀態隨對應的 函數。
記軟繩單位長度的質量爲 ,並取地面高度爲重力勢能的零點。左右豎着的兩段的質量均爲 ,重心在 的高度,因此它們具有的重力勢能爲
至於懸掛在兩個支點間的部分,我們可以先寫出 和 之間一小段的重力勢能:
彎曲懸掛着的部分的總的重力勢能就是
結合(23)與(24)式,整個體系的總勢能爲:
注意到 爲常數,因此可以取 ,再套用 Euler-Lagrange 方程來找出讓 取得極小的 。
代回(6)式中,可以先寫出
不要慌,要繼續相信硬肝一波還是可以看到柳暗花明
似乎看起來也還可以接受?接下來依然一步騷操作,兩邊同乘以 :
再次神奇地化成了一個全微分,它要等於零,需要圓括號裏那一坨等於常數。
這問題又簡化成了一個一階的微分方程。常規操作,分離變量再兩邊積分:
不難想到用雙曲換元,令 ,於是 ,。(29)式變成
其中 爲積分常數,它連同常數 都必須匹配邊界條件。
(30)式可以改寫成 ,我們可以反解出 的函數式:
在我們的問題中, 顯然關於 -軸對稱,所以 。因此
支點座標爲 ,因此邊界條件還要求:
於是懸在兩個支點之間的軟繩的形態將有(31)式的雙曲函數給出,其中的參數 需滿足(32)式的條件。
我們還可以試着討論一下(32)式在什麼情況下有解。令 ,或 ,則(32)式可以改寫成
作出圖像,左邊對應一條過原點、斜率爲 的直線,右邊對應一條過 後斜率快速增長的曲線。
可以想見,如果 太小,方程將沒有解。這時,相比支點的高度,支點之間懸着好長一段繩子,兩側蕩着的部分提供的拉力根本拽不住中間那一大段的重量。而如果 足夠大,方程將有兩個解,其中一個會對應穩定平衡,另一個對應非穩定平衡。可以證明較大的 解會給出穩定平衡。
其他好玩的東西
未完待更
參考資料
- Michael Stone & Paul Goldbart, Mathematics for Physics [Chapter 1: Calculus of variations]
- Tom W.B. Kibble & Frank H. Berkshire, Classical Mechanics (5th Edition) [Chapter 3.6 The Calculus of Variations]
- https://en.wikipedia.org/wiki/Cycloid
- https://en.wikipedia.org/wiki/Catenary
- https://en.wikipedia.org/wiki/Brachistochrone_curve
55 條評論
謝指出錯誤!火眼金睛點贊!
可以類比一元函數 y(x) 極值點附近 δy=0,極值點處的導數爲零
民科老鹹魚不讓腦子生鏽寫的東西還能造福網友,很開森!
感謝樓主!大四選修課有一門這個,一直很好奇是什麼,今天看了您的介紹,茅塞頓開,十分感謝!
你這種評論會讓我膨脹的。。。。
是不是還可以證明定長線段圍成面積最大的圖形是原型啊
看得如癡如醉
1、爲什麼計算I的那個積分裏的函數只與y和y的一階導數有關?
2、爲什麼當I取極值時,對y做微小的變化,I在一級近似下保持不變?
(。◕◡◕。)ノ非常感謝!初中時,我對擺線很感興趣的,嘿嘿