原文鏈接：淺談變分法原理

首發於烤羚羊的理科教室

寫文章

淺談變分原理

喫老本的物理教師、民科老鹹魚

784 人贊同了該文章

對付數學物理中極值問題，變分大法（variational principle）可謂是殺人放火居家旅行的必備工具。今天這篇就來介紹變分法的基本思想。

碎碎念：我一個教物理的，爲啥成天一個勁寫數學呢？？？

變分大法軼事

大約1696年的6月，瑞士數學家 Johann Bernoulli 在 Acta Eruditorum（第一份德語的科學期刊）上向全世界的數學家發起了一項挑戰。他提出了這麼一個數學問題：讓一個物體從靜止開始沿着一個光滑無摩擦的軌道下滑，如果要求下滑過程耗時最短，軌道應該是什麼形狀？（在這篇文章後面的舉例中，我們會來具體處理這個問題）

這個問題被稱作最速降曲線問題（the brachistochrone problem）。這個問題是如此有趣，吸引了很多數學家的關注。Johann 本人利用光學原理類比給出了一種解法，他更牛掰的哥哥 Jacob Bernoulli 想到了另一種解法（是的，Bernoulli 家族盛產數學家，走量的那種）。此外，大名鼎鼎的 Gottfried Leibniz（跟牛頓爭微積分發明權的那位），Guillaume de l'Hôpital（洛必達法則就是他的名號）等人都給出了各自的解法。

風聲不久後也傳到了科學界早已功成名就的 Issac Newton 耳裏。1697年1月的某天，牛爵爺此時已在皇家造幣廠任職，他開開心心下班回家，發現了來自 Johann Bernoulli 的挑戰書。牛爵爺可能有點不太開心，內心也嘀咕着：老子牛逼頓，你們這些外國佬少來跟我在數學問題上囂張！或者按他自己的原話：I do not love to be pestered and teased by foreigners about mathematical things. 於是牛爵爺也忍不住試了試水。以牛爵爺的智商，他大概也就經過了那麼一晚上的思考，就運用變分法解決了問題，轉手就寫了封信寄回給了 Johann。

不過 Newton 很低調地將他的解答匿名寄了回去。然而 Newton 的解法是如此之風流瀟灑，令人拍案叫絕，即便沒有署名，Johann 也很快意識到了真正的作者是何方神聖。對此，他做出了著名的評價：I recognize the lion by his claw mark.

其實早在10多年前，牛爵爺在考慮在流體中會受到最小阻力的旋轉曲面該是什麼形狀的問題時，已經構建起了變分原理的基本思想。經過一大批數學家的傑出工作，現在變分法已經成爲了數學分析中的求極值問題的一種重要方法。

故事說這麼多，我們下面就要來開始硬核的討論了。

變分大法

假設我們有兩個定點和，連接這兩點的任意曲線的方程都將滿足如下的邊界條件：

現在考慮如下形式的定積分：

其中是關於和其一階導數的函數，我們期望找到一個具體的，使得有極值（極大或極小）。

注意在一般的極值問題中，我們考察的是自變量的變化：取值多少時，函數會有極值。而現在這個新問題的不同之處，我們考察的是函數的變化：是什麼形式時，會有極值（高大上叫法：稱作函數的泛函）。然而這兩類問題依然有共通之處：當取極值時，對作微小的變化，在一級近似下應該保持不變。

如果有微小改變（高大上叫法：稱作函數的變分），那麼的變化爲：

相應的變化爲：

方括號裏的第二項可以改寫成，然後我們可以進行分部積分

由於的邊界條件固定，，所以分部積分出來的第一項爲零，僅第二項有貢獻。代回（4）式中，稍作化簡可以得到

如果有極值，對任意滿足邊界條件的都必須有，這就要求：

這便是傳說中的 Euler-Lagrange 方程，它是變分法的核心定理。有了此等大殺器，原則上就可以找出所尋求的極值函數。

通常來講 Euler-Lagrange 方程會是一個二階的微分方程，的通解中含有的兩個待定常數剛好可以通過兩個邊界條件確定。我們下面來舉幾個例子操練操練。

例1：兩點間的最短路經

先來一個簡單的例子小試牛刀。

給定平面上兩點和，連接它們的長度最短的曲線是什麼？

這個問題的答案小學生都知道，我們在這裏用變分法來殺殺這隻小雞仔。

曲線上相近的兩點和之間的曲線元長度爲：

曲線的總長度爲：

現在希望有最小值，我們可以取，運用 Euler-Lagrange 方程來尋找可以讓有極小的函數。注意到

代回（6）式中，容易得到

括號裏這一大坨的導數爲零，那麼括號裏這一大坨必然是一個常數，我們馬上可以推出也必然是一個常數。因此我們需要尋找的滿足直線方程：

斜率和截距很容易通過邊界點的座標算出。由此我們證明了大家非常熟悉的結論：兩點之間直線段的距離最短。

例2：最速降曲線

問題在開篇的歷史故事介紹中已經有提到，我們這裏直接進入解答環節。

爲方便起見，我們將座標系的 -軸搞成朝下的方向，斜向下的軌道可以由函數給出，其中軌道的起點和終點分別設爲和，我們來試求最速降曲線的函數式。

當物理下滑到位置時，它的速度大小可以根據能量守恆關係解出

而根據定義，速度大小等於單位時間內走過的軌道長度

其中我們已經利用了之前（7）式中得到的結果。

（11）與（12）式聯立，可以寫出：

積分後就可以得到總時間的表達式：

爲了找出讓取得極小的，我們可以取，再套用 Euler-Lagrange 方程來怒算一波。

丟回（6）式裏面，我們可以得到這麼一個初步的方程：

看到這種東西，要保持平靜，鐵了頭往下算，要相信好多噁心的東西會神奇地同歸於盡。

瞧，柳暗花明又一村。不過這還遠沒完，解這個二階微分方程還需要一個騷操作。我們對上式乘上一個：

感謝 CCAV 這玩意兒居然是個全微分，它要等於零，方括號裏那一坨等於常數就完兒事了。且讓我們將這個常數寫作

原來的二階微分方程降次變成了一階，我們終於可以愉快地分離變量兩邊積分了

作三角換元，設，則

其中是積分常數。我們再作逆變換變回到，注意到，於是

我們可以得到所求的最速降軌道的函數表達式：

軌道起點爲，很容易得出，於是結果可以進一步簡化

另一方面，軌道終點爲，上面的常數還必須滿足：

可以證明，滿足邊界條件（21）的最速降曲線（20）將是一條擺線（cycloid）：它是圓周上的一個定點在圓沿直線滾動時所形成的軌跡。

從（20）式很難看出這個結論，但其實滿足（17）式的還可以寫成如下的參數方程：

其中給出了滾動的圓的半徑。可以作如下的驗算：

這驗證了（22）式的參數方程確實是（17）式的解。而參數方程可以更明確地表達出擺線的幾何意義（如圖）。

例3：懸鏈線

這個數學問題同樣也起源於物理：懸在等高的兩點間的受重力作用的軟繩形成的曲線應該是什麼形狀？

這類曲線統稱爲懸鏈線（catenary ），在工程和設計中有廣泛的應用。比如懸索橋、架空電纜等都會出現懸鏈線的設計，而在很多拱門、教堂拱頂的設計中，還會出現倒懸鏈線的蹤影。

我們在此考慮一個稍有不同的問題。假設有等高的兩個支點，它們的座標爲和。軟繩搭在這兩個支點上，一部分懸在兩個支點之間，多出來的部分自由下垂耷拉到地面上（如圖所示）。

整個體系會自發去向勢能最低的狀態，因此我們需要找的便是勢能最低狀態隨對應的函數。

記軟繩單位長度的質量爲，並取地面高度爲重力勢能的零點。左右豎着的兩段的質量均爲，重心在的高度，因此它們具有的重力勢能爲

至於懸掛在兩個支點間的部分，我們可以先寫出和之間一小段的重力勢能：

彎曲懸掛着的部分的總的重力勢能就是

結合（23）與（24）式，整個體系的總勢能爲：

注意到爲常數，因此可以取，再套用 Euler-Lagrange 方程來找出讓取得極小的。

代回（6）式中，可以先寫出

不要慌，要繼續相信硬肝一波還是可以看到柳暗花明

似乎看起來也還可以接受？接下來依然一步騷操作，兩邊同乘以：

再次神奇地化成了一個全微分，它要等於零，需要圓括號裏那一坨等於常數。

這問題又簡化成了一個一階的微分方程。常規操作，分離變量再兩邊積分：

不難想到用雙曲換元，令，於是，。（29）式變成

其中爲積分常數，它連同常數都必須匹配邊界條件。

（30）式可以改寫成，我們可以反解出的函數式：

在我們的問題中，顯然關於 -軸對稱，所以。因此

支點座標爲，因此邊界條件還要求：

於是懸在兩個支點之間的軟繩的形態將有（31）式的雙曲函數給出，其中的參數需滿足（32）式的條件。

我們還可以試着討論一下（32）式在什麼情況下有解。令，或，則（32）式可以改寫成

作出圖像，左邊對應一條過原點、斜率爲的直線，右邊對應一條過後斜率快速增長的曲線。

可以想見，如果太小，方程將沒有解。這時，相比支點的高度，支點之間懸着好長一段繩子，兩側蕩着的部分提供的拉力根本拽不住中間那一大段的重量。而如果足夠大，方程將有兩個解，其中一個會對應穩定平衡，另一個對應非穩定平衡。可以證明較大的解會給出穩定平衡。

其他好玩的東西

未完待更

參考資料

Michael Stone & Paul Goldbart, Mathematics for Physics [Chapter 1: Calculus of variations]
Tom W.B. Kibble & Frank H. Berkshire, Classical Mechanics (5th Edition) [Chapter 3.6 The Calculus of Variations]
https://en.wikipedia.org/wiki/Cycloid
https://en.wikipedia.org/wiki/Catenary
https://en.wikipedia.org/wiki/Brachistochrone_curve

編輯於 05-19

贊同 78455 條評論收藏

贊同 784

文章被以下專欄收錄

烤羚羊的理科教室

一隻物理狗灌水的地方，爲人師表也樂於毀人不倦。喜歡一本正經的胡說八道，科學趣味的奇思怪想，牛人大咖的八卦軼事。

進入專欄

偏微分方程基礎——分離變量法

本章內容：介紹波動方程的分離變量法求解一、一維波動方程問題：長爲 l 兩端固定的弦，由於初始狀態而引起振動\left\{ \begin{array}{c} u_{tt}=a^2u_{xx},0<x<l,t>0\\ u\left( …

天涼好個秋發表於伯顏的鹹魚...

計算流體力學 | 偏微分方程的數學性質

闌珊離索發表於CFD 學...

變分法理解2——基本方法

清雅白鹿記

變分法（三）極值曲線場、雅可比方程、魏爾斯特拉斯函數、條件極值與等周問題

Hreyu...發表於俄羅斯本科...

寫下你的評論...

發佈

製冷烤箱05-17
分部積分那一步是不是少了dx
贊回覆踩舉報
烤羚羊 (作者) 回覆製冷烤箱05-19
謝指出錯誤！火眼金睛點贊！
贊回覆踩舉報

清風十里05-22
請問這一步是怎麼得來的: 如果I有極值，對任何滿足邊界條件的delta y(x) 都必須有delta I = 0
1回覆踩舉報
烤羚羊 (作者) 回覆清風十里05-22
可以類比一元函數 y(x) 極值點附近 δy=0，極值點處的導數爲零
2回覆踩舉報
清風十里回覆烤羚羊 (作者) 05-22
好的，謝謝[微笑]
贊回覆踩舉報

展開其他 1 條回覆

Billy Lagrange06-06
讀完了，也學會了，你是第一個把變分法給我講懂的。文章文筆，和思路都特別清晰，感謝大佬的貢獻[調皮]。
11回覆踩舉報
烤羚羊 (作者) 回覆Billy Lagrange06-10
民科老鹹魚不讓腦子生鏽寫的東西還能造福網友，很開森!
5回覆踩舉報

索爾達多拉06-10
最速下降曲線用極座標表示更簡單
贊回覆踩舉報

洗衣機06-10
感謝樓主！大四選修課有一門這個，一直很好奇是什麼，今天看了您的介紹，茅塞頓開，十分感謝！
贊回覆踩舉報
烤羚羊 (作者) 回覆洗衣機06-10
你這種評論會讓我膨脹的。。。。
贊回覆踩舉報

walkingbirdy06-11
每次化爲全微分那個騷操作，學不來學不來，這玩意要是能只需要我物理轉數學建模和選好泛函兩步就好了，其它交給MATLAB
2回覆踩舉報
老陳回覆walkingbirdy06-13
那個其實可以更自然的得出，拉氏量不含自變量的時候，一定有一個守恆量，能量，這樣方程直接變成一階
1回覆踩舉報
walkingbirdy回覆老陳06-13
不明白，他的式15裏完全沒有動能勢能這些東西，怎麼降階呢？
贊回覆踩舉報

展開其他 1 條回覆

知乎用戶06-11
是不是還可以證明定長線段圍成面積最大的圖形是原型啊
贊回覆踩舉報
烤羚羊 (作者) 回覆知乎用戶06-11
目測放進極座標，面積作爲目標函數，再引入拉格朗日乘子來搞定定長的約束條件可以整
贊回覆踩舉報

Nature06-11
學習結構力學一直沒聽懂，謝謝大佬[贊同]
贊回覆踩舉報

蔥蔥06-11
你管這叫小試牛刀...這根本就是集束核彈轟蚊子[捂臉]
贊回覆踩舉報

清風徐來06-11
不愧是牛頓，一晚上能想到這種騷操作
贊回覆踩舉報

能是什麼呢06-11
看得如癡如醉
贊回覆踩舉報

Rainforest06-11
嚴格討論的話要考慮函數的光滑性。對任意delta y 積分爲零推出Euler Language Eq 並不是非常trivial的事情，我記得是一個引理（fundamental lemma of calc of var）需要函數連續可微（當然，物理學家總是把函數當作解析的...
贊回覆踩舉報
知乎用戶回覆Rainforest06-11
用反證法就可以吧
贊回覆踩舉報

聰明的鋼鎖06-11
這圖不是流言終結者嗎？
1回覆踩舉報

羣山之巔06-11
多發些這樣的文章最好
贊回覆踩舉報

閟宮有恤.實實枚枚06-11
感謝作者，終於把變分法弄懂了
贊回覆踩舉報

阿杜06-12
最近在思考一個問題，一個長度和高度確定的簡支梁，另一端加載一個固定的位移，如何優化寬度變化形狀使其上應變分佈最均勻，極值最小，不知道用變分是否可以解?
贊回覆踩舉報

知乎用戶06-12
有兩個問題不理解：
1、爲什麼計算I的那個積分裏的函數只與y和y的一階導數有關？
2、爲什麼當I取極值時，對y做微小的變化，I在一級近似下保持不變？
3回覆踩舉報
烤羚羊 (作者) 回覆知乎用戶06-12
I 若取決於高階導數，Euler-Lagrange 方程的形式就不一樣了，而且實際問題裏似乎不常遇到目標函數會取決於二階以上導數的情況。比如力學中，一個體系的作用量一般取決於質點們的座標和它們的速度，通常與加速度無關，求作用量最小就只需管到廣義座標和它們的一階導數就夠了。
1回覆踩舉報
烤羚羊 (作者) 回覆知乎用戶06-12
第二個問題可以類比一元函數 y(x) 極值點附近 δy=0，極值點處的導數爲零
贊回覆踩舉報

查看全部 6 條回覆

狗頭人06-12
爲什麼物理老師還懂泛函的[思考]
贊回覆踩舉報
蒿里誰家地回覆狗頭人06-12
因爲解多體問題只能靠微擾或者變分，大到天體物理小到量子力學都要用。隔壁的化學家對變分也不要太熟悉
贊回覆踩舉報
蒿里誰家地回覆蒿里誰家地06-12
當然還有蒙特卡羅，不管怎麼說變分是基礎方法了。
贊回覆踩舉報

查看全部 6 條回覆

彼岸06-12
精彩絕倫！！！非常期待下一期！！
贊回覆踩舉報

turingal06-12
(｡◕◡◕｡)ﾉ非常感謝！初中時，我對擺線很感興趣的，嘿嘿
贊回覆踩舉報

變分法原理

淺談變分原理

變分大法軼事

變分大法

例1：兩點間的最短路經

例2：最速降曲線

例3：懸鏈線

其他好玩的東西

參考資料

文章被以下專欄收錄

烤羚羊的理科教室

推薦閱讀

偏微分方程基礎——分離變量法

計算流體力學 | 偏微分方程的數學性質

變分法理解2——基本方法

變分法（三）極值曲線場、雅可比方程、魏爾斯特拉斯函數、條件極值與等周問題

55 條評論

教你用Perl實現Smgp協議

如何通過前端表格控件在10分鐘內完成一張分組報表？

win11關閉自動檢測病毒刪文件

千兆寬帶實際網速能到達多少？

徑向基函數插值(待更新....

design and analysis of computational and physical experiments

SMO算法詳細推導（Sequential Minimal Optimization）

矩陣的Cholesky分解

變分法原理

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結