本文主要介紹了以下幾個方面的內容：簡單介紹了經典的主成分分析方法，包括其數學推導，算法步驟，和幾個實際算例；簡單介紹了其它的數據降維方法，譬如局部線性嵌入以及它的簡單算例；更近一步，我們介紹了函數型主成分分析方法（FPCA），包括其基本思想、數學推導、算法描述等，最爲重要的是，我們將該方法和本領域進行結合，有了一些新的思考。

前言

“維數災難"帶來的直接結果就是很多低維空間行之有效的算法在高維空間中變得不可計算，爲此，我們需要進行降維。在另一個方面，數據偏平化的情況下，降維有助於我們抓住數據的主要結構，過濾可能的誤差帶來的影響，使模型更加真實。另外，在某些情況下，降維可用於可視化。數據降維的方法有很多，比如說基於"最小化投影誤差”（最大化類內方法）的主成分分析方法（PCA），以及基於保持拓撲結構不變（高維空間中是鄰居，到了地位空間中還是鄰居）的局部線性嵌入（LLE）等方法。

在多元統計分析中，主成分分析（Principal Components Analysis，PCA）是一種統計分析、簡化數據集的方法。它利用正交變換來對一系列可能相關的變量的觀測值進行線性變換，從而投影爲一系列線性不相關變量的值，這些不相關變量稱爲主成分（Principal Components）。具體地，主成分可以看做一個線性方程，其包含一系列線性係數來指示投影方向。PCA對原始數據的正則化或預處理敏感（相對縮放）。PCA本質上尋求的是數據點在低秩空間中的一個表示。

高維數據，意味着數據需要多於兩個或三個維度來表示，一般很難被解釋。一種簡化的方法是假設數據嵌在高維空間的一個非線性流形上。如果這個流形維數足夠低，那麼數據可以在低維空間中被可視化。局部線性嵌入(Locally Linear Embedding，LLE)關注於降維時保持樣本局部的線性特徵，由於LLE在降維時保持了樣本的局部特徵，它廣泛的用於圖像圖像識別，高維數據可視化等領域。

有了降維和主成分分析，我們做PDE的就會思考，既然可以對 $\mathbb{R}^n$ 空間中的數據做降維，那麼函數作爲一組基函數的線性組合，如果將基函數看作一些座標系中的一個個座標軸，是否也可以對函數空間中的"數據"做降維呢？答案是肯定的。函數型（數據）主成分分析（Functional Principal Components analysis）可以視爲是傳統的主成分分析的一種推廣。類比於PCA，它希望能將高維函數空間中的函數放到低維空間中去表示，而使得被表示的數據集損失最小。更通俗地說，就是希望用更少的基函數來表示某個已知基函數的函數空間的一堆函數，新空間的基函數用舊空間的基函數來線性表出。那麼，我們就需要定義函數之間的距離，函數空間的內積等等。

主成分分析（PCA）

數據降維簡介

在機器學習和統計學領域，降維是指在某些限定條件下，降低隨機變量個數，得到一組"不相關"主變量的過程。
降維可進一步細分爲變量選擇和特徵提取兩大方法。除了考慮"維數災難"的問題，降維還有一些本質的原因。目前大部分降維算法處理向量表達的數據，也有一些降維算法處理高階張量表達的數據。之所以使用降維後的數據表示是因爲在原始的高維空間中，包含有冗餘信息以及噪音信息，在實際應用例如圖像識別中造成了誤差，降低了準確率，通過降維,我們希望減少冗餘信息所造成的誤差,提高識別（或其他應用）的精度，又或者希望通過降維算法來尋找數據內部的本質結構特徵。目前比較流行的降維算法有主成分分析、線性判別分析、局部線性嵌入和拉普拉斯特徵映射等等。

PCA算法的原理解釋

所謂的主成分分析，不過是在高維的空間中尋找一個低維的正交座標系，比如說在三維空間中尋找一個二維的直角座標系。那麼這個二維的直角座標系就會構成一個平面，將三維空間中的各個點在這個二維平面上做投影，就得到了各個點在二維空間中的一個表示，由此數據點就從三維降成了二維。

這個過程的關鍵在於，我們如何選取這個低維的座標系，即座標系原點在哪？各個軸朝哪個方向？一個原則就是使得各個點到到這個平面的距離平方和達到最小。由此，通過簡單地數學推導，就能得到原點的表達公式和座標系的各個基向量的表達公式。

PCA算法的數學推導

我們假設輸入爲p維的N個對象， $X$ 表示如下圖所示的一個矩陣：

通過PCA降維，將其降爲d維的N個對象，假設爲 $Y$ ,同前，每列表示一個對象，每行表示一個特徵：

我們要將所有點投影到新的座標系中去，無非是尋找新座標系的座標原點和各個座標軸。

我們假設 $W$ 的每一列爲新的座標系中單位正交的座標軸表示， $x_0$ 爲新座標系的原點（相對於原座標系）。
那麼，我們要做的就是找到一個合適的 $W$ 和 $x_0$ ，使其極小化所有點到新的座標平面的距離平方和。
容易知道，每一個點到新座標系的距離平方爲（其中 $\underline X = (x_0,W)$ 表示的是位置參數）：
$\operatorname{Ds}_{X}(x, \underline{X})=\left(x-x_{0}-\sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}\right)^{T}\left(x-x_{0}-\sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}\right)$
對其進行化簡，可得：
$\begin{array}{l}{D s_{X}(x, \underline{X})=\left(x-x_{0}-\sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}\right)^{T}\left(x-x_{0}-\sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}\right)} \\ {=\left(x-x_{0}\right)^{T}\left(x-x_{0}\right)-\left(\sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}\right)^{T}\left(x-x_{0}\right)} \\ {-\left(x-x_{0}\right)^{T} \sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}+\left(\sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}\right)^{T} \sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right) w_{i}}\end{array}$
進而有，
$\operatorname{Ds}_{X}(x, \underline{X})=\left(x-x_{0}\right)^{T}\left(x-x_{0}\right)-\sum_{i=1}^{d} w_{i}^{T}\left(x-x_{0}\right)\left(x-x_{0}\right)^{T} w_{i}$
讓所有點到投影點距離平方和最小，即求解約束優化問題：
$\begin{array}{l}{\min _{\underline{X}} \sum_{k} D s_{X}\left(x_{k}, \underline{X}\right)=\sum_{k}\left(x_{k}-x_{0}\right)^{T}\left(x_{k}-x_{0}\right)} \\ {-\sum_{i=1}^{d} w_{i}^{T} \sum_{k}\left(x_{k}-x_{0}\right)\left(x_{k}-x_{0}\right)^{T} w_{i}} \\ {w_{i}^{T} w_{j}=\delta_{i j} \quad \delta_{i j}=1, \quad i=j} \\ {\delta_{i j}=0, \quad i \neq j}\end{array}$
我們藉助拉格朗日乘子法來求解此約束優化問題：
$L=\sum_{k}\left(x_{k}-x_{0}\right)^{T}\left(x_{k}-x_{0}\right)-\sum_{i=1}^{d} w_{i}^{T} \sum_{k}\left(x_{k}-x_{0}\right)\left(x_{k}-x_{0}\right)^{T} w_{i}-\sum_{i=1}^{d} \lambda_{i}\left(w_{i}^{T} w_{i}-1\right)$
$\begin{array}{l}{\frac{\partial L}{\partial x_{0}}=-2\left(I_{p}-\sum_{i=1}^{d} w_{i} w_{i}^{T}\right) \sum_{k}\left(x_{k}-x_{0}\right)} \\ {\frac{\partial L}{\partial w_{i}}=2 \sum_{k}\left(x_{k}-x_{0}\right)\left(x_{k}-x_{0}\right)^{T} w_{i}-2 \lambda_{i} w_{i}}\end{array}$
由兩個偏導爲0，可以得到：
$\begin{array}{l}{x_{0}=\sum_{k} \frac{x_{k}}{N}} \\ {\sum_{k}\left(x_{k}-x_{0}\right)\left(x_{k}-x_{0}\right)^{T} w_{i}=\lambda_{i} w_{i}}\end{array}$
因爲半正定矩陣的特徵值非負，所以，原最小化損失函數可進行轉化：
$\begin{array}{l}{\min _{\underline{X}} \sum_{k} D s_{X}\left(x_{k}, \underline{X}\right)} \\ {=\sum_{k}\left(x_{k}-x_{0}\right)^{T}\left(x_{k}-x_{0}\right)-\sum_{i=1}^{d} w_{i}^{T} \sum_{k}\left(x_{k}-x_{0}\right)\left(x_{k}-x_{0}\right)^{T} w_{i}} \\ {=\sum_{k}\left(x_{k}-x_{0}\right)^{T}\left(x_{k}-x_{0}\right)-\sum_{i=1}^{d} \lambda_{i} w_{i}^{T} w_{i}} \\ {=\sum_{k}\left(x_{k}-x_{0}\right)^{T}\left(x_{k}-x_{0}\right)-\sum_{i=1}^{d} \lambda_{i}}\end{array}$
我們利用矩陣的性質，要想最小化距離平方和，有：
$\min _{\underline{X}} \sum_{k} \operatorname{Ds}_{X}\left(x_{k}, \underline{X}\right)=\sum_{k}\left(x_{k}-x_{0}\right)^{T}\left(x_{k}-x_{0}\right)-\sum_{i=1}^{d} \lambda_{i}$
令 $\Sigma_{X}=\sum_{k}\left(x_{k}-x_{0}\right)\left(x_{k}-x_{0}\right)^{T}$ 爲 $p\times p$ 的矩陣。有性質：
$\operatorname{tr}\left(\Sigma_{X}\right)=\sum_{k}\left(x_{k}-x_{0}\right)^{T}\left(x_{k}-x_{0}\right)=\sum_{i=1}^{p} \lambda_{i}$
則有，
$\min _{\underline{X}} \sum_{k} \operatorname{Ds}_{X}\left(x_{k}, \underline{X}\right)=\sum_{i=1}^{p} \lambda_{i}-\sum_{i=1}^{d} \lambda_{i}=\sum_{i=d+1}^{p} \lambda_{i}$
由此我們可以看到，要得到極小值，我們只要計算 $XX^T$ 矩陣的前d個最大特徵值，是投影后樣本具有最小損失的特點。那麼此時的 $W$ 就是 $XX^T$ 矩陣前d個最大特徵值對應的特徵向量。
不難知道，對於 $XX^T$ 的特徵分解： $XX^T = U\Lambda U^T$
這裏的U就是前天提到的奇異值分解的U。同理，雖然我們這裏沒有用到 $V$ ，但其實奇異值分解的 $V$ 正式 $X^TX$ 的特徵值分解的特徵矩陣。
爲了比較 $XX^T$ 特徵分解和 $X$ 進行奇異值分解的消耗，寫了一段小程序，並使用matlab探查功能進行比較如下：

這個比較事實上沒有太大的意義。所用的代碼如附錄。

PCA算法簡單描述

假設 $X$ 是一個m*n矩陣，表示n個對象的m個特徵表示數據，即每一列表示一個對象，每一行表示一個特徵。我們希望將特徵降爲d維，d遠小於m。輸出結果爲 $Y$ ，一個d*n的矩陣。

記 $X=[x_1,x_2...x_n]$ ，計算每個對象點的平均值 $x_0 = \frac{1}{n}\sum\limits _{i=1}^nx_i$ 。
對 $X-x_0 : = [x_1-x_0,x_2-x_0...x_n-x_0]$ 做奇異值分解： $X-x_0 = U\Lambda V^T$ 。
則 $x_0$ 即爲新座標系的原點， $U$ 的前d列即爲去中心化後的新的座標系，不妨記爲 $W$ 。那麼，所有點在新座標系下的表示爲: $Y=W^T*(X-x_0)$ 。同樣地，要將新的投影點 $y$ 還原到原座標系中，可以寫爲： $x_0+W*y$ 。

下面以基於矩陣的視角寫出PCA算法的算法流程，輸入爲矩陣p*N矩陣X，輸出爲d*N矩陣Y。矩陣的每一列都表示一個對象，每一行都表示對象的一個特徵表示。

PCA算例一

假設小明和小紅有身高和體重兩個特徵（實際操作數據要進行預處理，這裏不做），如下表：

那麼此時 $X = [178 ~165; 70 ~65]$ ，現在試圖通過PCA降維，將身高和體重合併爲一個特徵。走一遍上面的過程,可得：

$X-x_0 = U\Lambda V^T$

其中，

那麼，有

那就是說，最後數據可降維爲：

這個問題MATLAB計算的小程序在附錄。

PCA算例二

這是一個對於人臉數據進行降維的例子，人臉數據是我從網上找的。MATLAB源代碼見附錄。
選取了2000x1680的數據集進行了測試，選取降維後維數爲20，其降維前後的圖像（降維後的圖像指的是投影點還原到原空間對應的座標值重構出的圖像）如下所示（選取第一個點爲代表）：

我們使用別人製作的降維工具箱"drtoolbox"重新進行計算並和我的程序結果進行比較。工具箱的使用代碼見附錄。結果如下：

當然，我們也可以比較我的程序和工具箱程序的誤差的大小，比如 $L_2$ 誤差。都很簡單，暫且不提。

其他數據降維方法

其他的數據降維方法還有很多，比如說線性判別分析，拉普拉斯特徵映射等等，我這裏就簡單介紹一下局部線性嵌入。

當數據具備某些非線性結構，如流形結構時，我們希望降維後的數據仍然保持這些結構。那麼就提出了LLE降維算法。LLE(Locally linear embedding)：在數據降維後仍然保留原始高維數據的拓撲結構，這種拓撲結構表現爲數據點的局部鄰接關係。

此算法我們首先要尋求每個數據點的k個最近鄰，然後將當前數據點用k個最近鄰線性表出，那麼就有相對的權重係數。
我們希望數據在降維後數據點之間依然能保持這種線性表出的關係，並且在滿足另外一些約束條件的前提下，我們很容易求得降維後的數據。
具體原理和公式網絡上有很多人整理得很好，這裏不提了。

下面是LLE算法的算法流程，輸入爲矩陣p*N矩陣X，輸出爲d*N矩陣Y。矩陣的每一列都表示一個對象，每一行都表示對象的一個特徵表示。

源代碼見附錄。

選取了409×698的圖像數據集進行了測試，選取降維後維數爲2，選取最近鄰個數 $k=12$ ，實驗後的部分結果如下：

我們使用別人製作的降維工具箱"drtoolbox"重新進行計算並和我的程序結果進行比較。工具箱的使用代碼見附錄。

降維後的部分數據截圖如下：

爲了比較性能，找個一個別人寫的LEE算法，算是網絡版本，代碼在附錄。"網絡版"的數據結果和我的版本的結果是一樣的。我們開啓Matlab的探查功能來比較耗時，結果如圖。

函數型數據主成分分析

Idea的萌生

前一段時間我在做一個流體力學上的東西（雖然現在已經不做這個方向了），其中比較關鍵的步驟就是需要用一個帶時間變量的多項式公式，來刻畫一個物理過程。這個多項式的各個項前面的係數是未知的，由物理規律來決定。我們希望從一些物理實驗數據中來通過一些機器學習的手段來學到多項式各個項前面的係數。

這個問題本質的困難在於，我們不知道那些函數項（基函數）是我們需要的。事實上，只要知道了多項式包含哪些項，是可以通過一些物理原理求得前面的係數的。一個基本的想法就是選足夠多的基函數，使得函數空間足夠大而包含真值。但是，函數空間太大會帶來使用物理原理求係數時的計算困難增大。所以，我們希望能找一個原來大的函數空間的一個子空間，使得用這個子空間，就能夠基本刻畫原來的物理過程。再用物理原理來求得以子空間基函數爲各個項的多項式係數。

仔細一想，這不正是函數空間的PCA嗎？如果把每一個函數看做一個數據點，把各個基函數看做是組成座標系的座標軸，那麼"函數點"在高維函數空間中的表示，就可以通過類似於主成分分析的技巧，變成在低維函數空間中的表示。只要有了能表示刻畫整個物理過程的各個數據點的低維空間，那麼刻畫物理過程的多項式的項（即低維空間的基函數）也就明確了，剩下的事情也就自然而然了。

FPCA簡介和理論推導

函數型主成分分析（FPCA，Functional Principal Components Analysis）是傳統的PCA的一種推廣。考慮我們已經從數據中得到擬合曲線 $x_{i}(s), s \in \mathcal{T}, i=1, \cdots, n$ ，所謂的第一主成分，就是我們希望能找到一個模爲1的函數 $\beta(s)$ ，使得 $\{x_i\}$ 在 $\beta$ 上的投影（ $L_2$ 內積） $\{\xi _i\}$ 的方差達到最大，方差最大其實也就體現 $\{x_i\}$ 整體到 $\beta$ 的距離達到最小。 $\beta$ 一般就叫做權重函數（可以理解爲"座標軸"單位長度量）。

我們管各個函數到 $\beta$ 上的投影叫做觀測曲線的主成分得分：
$\xi_{i}=\int_{\mathcal{T}} \beta(s) x_{i}(s) d s, \quad i=1, \cdots, n$ 故而，求解第一個主成分就變成了求解一個優化問題：
$\begin{aligned} \max \frac{1}{n} \sum_{i=1}^{n} \xi_{i}^{2} &=\max \frac{1}{n} \sum_{i=1}^{n}\left(\int_{\mathcal{T}} \beta(s) x_{i}(s) d s\right)^{2} \\ \text { s.t. } &\|\beta\|^{2}=\int_{T} \beta(s) \beta(s) d s=1 \end{aligned}$ 求解這個優化問題，我們就得到了第一主成分 $\beta^1(s)$ 。
第 $k$ 主成分無非就是在滿足和前面 $k-1$ 個主成分權重函數垂直的基礎上，求解上述優化問題而已，即求解
$\begin{array}{l}{\max \frac{1}{n} \sum_{i=1}^{n} \xi_{i}^{2}=\max \frac{1}{n} \sum_{i=1}^{n}\left(\int_{\mathcal{T}} \beta(s) x_{i}(s) d s\right)^{2}} \\ {\text { s.t. }\|\beta\|^{2}=\int_{T} \beta(s) \beta(s) d s=1} \\ {\int_{T} \beta(s) \beta^{l}(s) d s=0, l=1, \cdots, k-1}\end{array}$
這個優化問題的解可以表述如下。記協方差函數：
$v(s, t)=\frac{1}{n-1} \sum_{i=1}^{n}\left(x_{i}(s)-\overline{x}(s)\right)\left(x_{i}(t)-\overline{x}(t)\right)$
那麼權重函數滿足特徵方程：
$\int_{\mathcal{T}} v(s, t) \beta(t) d t=\lambda \beta(s)$
定義積分變換： $V \beta(s)=\int_{\mathcal{T}} v(s, t) \beta(t) d t$
這裏的 $V$ 稱爲協方差算子，它將函數 $\beta$ 變成一個函數。那麼，我們有：
$V \beta(s)=\lambda \beta(s)$
我們也類比PCA，使用特徵值的累積貢獻率來衡量主成分所佔比例：
$\mathrm{FVE}=\sum_{i=1}^{K} \lambda_{i} / \sum_{i=1}^{n-1} \lambda_{i}$ 這裏之所以對 $\lambda$ 只累計到 $n$ 是因爲協方差算子 $V$ 的秩爲樣本數量減一個，則非零特徵根的個數最多爲 $n-1$ 個。
由上述已知，我們求解主成分最後歸結爲求解一個特徵值問題。
求解這個問題，目前比較流行的有三種方法：

對函數進行SVD離散化
對函數進行基函數展開
運用一般性的數值積分方法

我們最後需要的是特徵函數，爲了避免插值而帶來更大的誤差，我選用對基函數進行展開的方法。下面簡單介紹一個對函數進行基函數展開的基本思路。
我們的樣本基函數 $x_i$ 可以通過基函數展開，如下：
$X_{i}(s)=\sum_{k=1}^{K} c_{i k} \Phi_{k}(s), i=1,2, \ldots, N$ 我們記
$X=\left(x_{1}, x_{2}, \ldots, x_{N}\right)^{\prime}, \Phi=\left(\Phi_{1}, \ldots, \Phi_{k}\right)^{\prime}, C=\left(c_{i k}\right)_{N \times K}$
那麼樣本函數就可以寫爲等價的矩陣形式 $X=C \Phi$ 。那麼協方差函數就可以寫爲（假設已經標準化）：
$v(s, t)=\frac{1}{n-1} \Phi^{\prime}(s) C^{\prime} C \Phi(t)$
定義K階對稱矩陣 $W=\int \Phi \Phi^{\prime}$
當選擇正交基的時候，比如說正交傅里葉基，這就是一個單位矩陣。關於這個基如何選取，我們後面還會詳談。
同樣地，將特徵函數進行展開：
$\beta(s)=\sum_{k=1}^{K} b_{k} \Phi_{k}(s)=\Phi^{\prime}(s) b$
將其代入 $\int_{\mathcal{T}} v(s, t) \beta(t) d t =\lambda \beta(s)$
就可以得到（ $N=n-1$ ）：
$\frac{1}{N} \Phi^{\prime}(s) C^{\prime} C W b=\lambda \Phi^{\prime}(s) b$
進一步能得到 $\frac{1}{N} C^{\prime} C W b=\lambda b$ ，由特徵向量正交和單位長度的約束要求，有 $b_{k}^{\prime} W b_{k}=1, b_{k}^{\prime} W b_{m}=0,k \neq m$
對 $W$ 做cholesky分解，可得 $W=LL'$ 。
定義 $u=L'b$ ，那麼上述問題就變成了對稱矩陣的代數特徵值問題：
$\frac{1}{N} L' C^{\prime} C L u=\lambda u$
據此可以求得 $u$ ，進而求得 $b$ ，最後求得特徵函數 $\beta$ 。

常用的基函數有傅里葉基函數和B樣條基函數，傅里葉基函數適用於週期性函數數據，B樣條基函數適用於非週期函數數據，當然，也可以用多項式基函數。
B樣條基函數的遞歸定義爲：
$\begin{array}{c}{B_{j, 0}(x)=\left\{\begin{array}{l}{1, t_{j} \leq x<t_{j+1}} \\ {0, \text {else}}\end{array}\right.} \\ {B_{i, k}(x)=\frac{x-t_{i}}{t_{i+k}-t_{i}} B_{i, k-1}(x)+\frac{t_{i+k+1}-x}{t_{i+k+1}-t_{i+1}} B_{i+1, k-1}(x), k>0}\end{array}$
附錄中有一段簡單的以多項式爲基的MATLAB代碼。

FPCA和PCA的區別和聯繫

如上所述，可以看出，如果所選的基函數是正交的，本質上和PCA的以擬合係數爲座標點的函數空間PCA推廣是實際上是一樣的。若基函數不是正交的，無非就是在此基礎上對要求特徵值的矩陣得多乘一個 $W=\int \Phi \Phi^{\prime}$ ，再求特徵向量，以及進行 $W$ 意義下對特徵向量進行單位化而已（不單位化也沒事，只不過權重函數 $\beta$ 不再是模長爲1的而已， $W$ 意義下的單位話也就意味着讓新的基函數模長爲1）。這個也非常容易理解，因爲在從函數的元（primal）表示左乘一個質量矩陣就到了到它的對偶（dual）表示，而在基函數不正交的情況下，我們應該在對偶空間中再進行它的主成分分析降維，即各個函數的向量表示應該爲這個函數和各個基函數的內積。同理，在對偶框架下得到的新的基函數的向量表示也是在對偶空間下的，應該左乘一個質量矩陣才能回到元空間中去。

基於FPCA的模型約化

Onsager原理簡介

Onsager基本原理是基於物理規律的一個原理，利用它不難得到，如果刻畫物理過程的模型方程有哪些項知道了，也就是基函數知道了，那麼我們可以通過這個原理求得各個項前面的係數。
定義勢能函數（自由能）： $A(a)$ 定義能量耗散函數：
$\Phi(\dot{a}, a)=\frac{1}{2} \sum_{i, j} \zeta_{i j}(a) \dot{a}_{i} \dot{a}_{j}$
那麼系統隨時間演化由最小化以下函數得到：
$R(\dot{a}, a)=\Phi(\dot{a}, a)+\sum_{i} \frac{\partial A}{\partial a_{i}} \dot{a}_{i}$
最小化 $R$ ，可以得到：
$\frac{\partial \Phi}{\partial \dot{a}_{i}}+\frac{\partial A}{\partial a_{i}}=0 \quad \text { or } \quad \sum_{j} \zeta_{i j}(a) \dot{a}_{j}=-\frac{\partial A}{\partial a_{i}}$
這就是我們要求解的ODE系統。

簡單例子：斜板液滴滑動

問題描述

考慮一個液滴在斜板上從靜止開始下滑，如圖。

從正面或者側面拍攝到的圖案大概如圖。

我們現在想要刻畫這個液滴的狀態，即在每一時刻液滴的俯視形狀以及側視高度。
我們可以用一個方程來描述這個過程：
$h(x, y, t)=H(x, t)\left[1-\left(\frac{y}{Y(x, t)}\right)^{2}\right]$
其中 $x$ 爲平行平板沿着液滴運動的方向， $y$ 爲平行平板垂直於液滴運動的方向， $t$ 爲時刻， $h$ 爲垂直於平板距離平板的一個高度。這裏面的 $H、Y$ 是兩個函數，分別刻畫了俯視的形狀和側視的形狀。事實上，取 $h=0$ ，可以得到 $y=Y(x,t)$ 描述了俯視圖（垂直於板）的形狀（一半），取 $y=0$ ，得到 $h=H(x,t)$ ，體現的是側視圖。再者，若給定了 $x$ 值，高度隨着 $y$ 是呈現出拋物的變化。因此，這個公式看起來不無道理。
接下來，我們對 $H,Y$ 做一個簡單的假定：
$\begin{array}{c}{H(x, t)=\left(x-a_{1}(t)\right)\left(a_{2}(t)-x\right)\left(a_{3}(t)+a_{4}(t) x\right)} \\ {Y(x, t)=\left(x-a_{1}(t)\right)^{\frac{1}{2}}\left(a_{2}(t)-x\right)^{\frac{1}{2}}\left(a_{5}(t)+a_{6}(t) x\right)}\end{array}$
容易想到，這裏的 $a_1(t),a_2(t)$ 表示的是液滴的前後端點（採用歐拉座標系），因爲 $H,Y$ 在兩端點處的值爲零。

原理的應用

我們希望能通過上面提到的Onsager原理來確定這裏的係數 $a_i$ 。
固定時刻的液滴體積：
$\Omega=\int_{a_{1}}^{a_{2}} d x \int_{-Y}^{Y} d y h(x, y, t)$
因爲體積是守恆量，所以問題的自由度個數就變成了5。勢能函數定義爲：
$\begin{aligned} A(a)=& \int_{a_{1}}^{a_{2}} d x \int_{-Y}^{Y} d y\left[\frac{1}{2} \gamma \theta_{e}^{2}+\frac{1}{2} \gamma\left[\left(\partial_{x} h\right)^{2}+\left(\partial_{y} h\right)^{2}\right]\right.\\ &+\frac{1}{2} \rho g h^{2} \sin \alpha-\rho g x h \cos \alpha ] \end{aligned}$
這裏的 $\gamma$ 表示液滴的表面張力， $\rho$ 表示密度， $\theta_e$ 是平衡態下的接觸角大小， $g$ 是重力加速度， $\alpha$ 是前面提到的斜面角。我也不知道勢能函數爲什麼能寫成這樣，需要一些物理的分析。
可以把 $h$ 的表達式代入到這個勢能函數的表達式中。我們還需要知道能量耗散函數 $\Phi$ 。由滑潤近似，能量耗散函數可以寫成關於速度的變量：
$\Phi\left[v_{x}, v_{y}\right]=\frac{1}{2} \int_{a_{1}}^{a_{2}} d x \int_{-Y}^{Y} d y \frac{3 \eta}{h}\left(v_{x}^{2}+v_{y}^{2}\right)$
這裏的 $v_x,v_y$ 表示兩個方向上的速度， $\eta$ 表示流體的粘性。但是我們想要的耗散函數是關於 $\dot a$
的，所以要想辦法替換掉速度。由體積守恆，我們有：
$\dot{h}=-\partial_{x}\left(v_{x} h\right)-\partial_{y}\left(v_{y} h\right)$
將 $h$ 的表達式代入上式，可得：
$\begin{array}{c}{\left(1-\frac{y^{2}}{Y^{2}}\right)\left(\dot{H}+\partial_{x}\left(v_{x} H\right)+H \partial_{y} v_{y}\right)} \\ {+\frac{2 H y}{Y^{3}}\left(y \dot{Y}+y v_{x} \partial_{x} Y-Y v_{y}\right)=0}\end{array}$
這個約束滿足的一個充分條件是：
$\begin{array}{l}{\dot{H}+\partial_{x}\left(v_{x} H\right)+H \partial_{y} v_{y}=0} \\ {y \dot{Y}+y v_{x} \partial_{x} Y-Y v_{y}=0}\end{array}$
一個如下所示的速度場能夠滿足這樣的條件：
$v_{x}(x, y, t)=V(x, t), \quad v_{y}(x, y, t)=W(x, t) y$
其中， $V,W$ 的表達爲：
$\begin{aligned} V(x, t) &=-\frac{1}{H Y} \int_{a_{1}}^{x}(\dot{H} Y+H \dot{Y}) d x \\ W &=\frac{1}{Y}\left(\dot{Y}+V \partial_{x} Y\right) \end{aligned}$
那麼，我們得到的能量耗散函數其實是：
$\Phi\left[\dot a, a\right]=\frac{1}{2} \int_{a_{1}}^{a_{2}} d x \int_{-Y}^{Y} d y \frac{3 \eta}{h}\left(V^{2}+{y}^{2}W^2\right)$
我們把 $a$ 看成常量，由於 $\dot H,\dot Y$ 是 $\dot a$ 的線性組合，意味着 $V,W$ 也是，那麼 $\Phi$ 就是 $\dot a$ 的二次函數，不妨記爲：
$\Phi(\dot{a})=\frac{1}{2} \sum_{i, j} \zeta_{i j} \dot{a}_{i} \dot{a}_{j}$
這裏的 $\xi_{ij}$ 是 $a$ 的函數。
這下有了勢能函數和能量耗散函數，我們可以得到關於 $a_i$ 的發展方程爲：
$\sum_{j=1}^{6} \zeta_{i j} \dot{a}_{j}+\frac{\partial A}{\partial a_{i}}=0$
求解之，可得 $a$ 。

算法步驟

總結一下上述的計算過程，就是：

能量耗散函數：
$\Phi\left[\dot a, a\right]=\frac{1}{2} \int_{a_{1}}^{a_{2}} d x \int_{-Y}^{Y} d y \frac{3 \eta}{h}\left(V^{2}+{y}^{2}W^2\right)$
其中，
$\begin{aligned} V(x, t) &=-\frac{1}{H Y} \int_{a_{1}}^{x}(\dot{H} Y+H \dot{Y}) d x \\ W &=\frac{1}{Y}\left(\dot{Y}+V \partial_{x} Y\right) \end{aligned}$
$h(x, y, t)=H(x, t)\left[1-\left(\frac{y}{Y(x, t)}\right)^{2}\right]$
$\begin{array}{c}{H(x, t)=\left(x-a_{1}(t)\right)\left(a_{2}(t)-x\right)\left(a_{3}(t)+a_{4}(t) x\right)} \\ {Y(x, t)=\left(x-a_{1}(t)\right)^{\frac{1}{2}}\left(a_{2}(t)-x\right)^{\frac{1}{2}}\left(a_{5}(t)+a_{6}(t) x\right)}\end{array}$
由此，我們計算出 $\Phi(\dot a)$ 表達式，並提取前面的線性組合的係數：
$\Phi(\dot{a})=\frac{1}{2} \sum_{i, j} \zeta_{i j} \dot{a}_{i} \dot{a}_{j}$
勢能函數：
$\begin{aligned} A(a)=& \int_{a_{1}}^{a_{2}} d x \int_{-Y}^{Y} d y\left[\frac{1}{2} \gamma \theta_{e}^{2}+\frac{1}{2} \gamma\left[\left(\partial_{x} h\right)^{2}+\left(\partial_{y} h\right)^{2}\right]\right.\\ &+\frac{1}{2} \rho g h^{2} \sin \alpha-\rho g x h \cos \alpha ] \end{aligned}$
求解ODE方程組（數值解），得出 $a$ 。
$\sum_{j=1}^{6} \zeta_{i j} \dot{a}_{j}+\frac{\partial A}{\partial a_{i}}=0$

數值實驗

所用的參數如下：
$\eta=104 \mathrm{cP}, \rho=964 \mathrm{kg} \mathrm{m}^{-3}$
$\gamma=20.9 \mathrm{mNm}^{-1},$ $\theta_{e}=53^{\circ}$
$\Omega = 6.3 \mathrm{mm}^{3}$ $\alpha=15^{\circ},25^\circ,45^\circ$

下面有一些數值結果如圖。

所用的程序比較冗長，就不往本文後面貼了。

FPCA在液滴下滑問題的應用

這只是我的一個想法，目前有很多問題都沒有明確。由於時間關係，我這裏也不會展開細述這一部分內容。基本的做法可以分成以下幾個步驟：

收集數據：除了網絡上搜到的三個物理實驗視頻和論文中的一些截圖之外，我沒有找到更多的數據，數據嚴重不足。和文章作者聯繫，也未要到數據。
圖像處理：對收集到的視頻，按幀提取圖像，對每個圖像進行去噪，二值化，歸一化，提取邊緣的座標位置。
FPCA降維：對於提取到的數據，選用適當的基函數，做小二乘意義下的擬合，得到擬合係數。這一組組擬合係數，就是我們做FPCA降維的數據。做FPCA，得到子函數空間。
Onsager原理確定係數：在子函數空間中，使用Onsager基本原理，得到液滴下滑物理過程的表達式係數。

數據不夠怎麼辦？有兩個基本的想法。一個是利用同一組參數（如斜板角度）下不同時刻的數據（一個視頻），來降維生成這組參數下的隨時間變化的物理過程表達過程。另一個是查找更多的數據，哪怕利用上別人文章中的圖片，堆砌所有的數據，尋求刻畫這個物理過程的"真"表達，找到物理上的"真"規律。

收集到的原始數據如圖所示。

處理後的數據如圖所示。

其中用到的一些代碼見附錄。根據這個問題的特殊性，有一個新的想法就是Robust
PCA和流行學習能不能推廣到FPCA上？這也是一個有趣的問題。其實我們還是不太清楚這個問題中數據的分佈。

參考文獻

[1] Rio E , Daerr A , Andreotti B , et al. Boundary Conditions in the
Vicinity of a Dynamic Contact Line: Experimental Investigation of
Viscous Drops Sliding Down an Inclined Plane[J]. Physical Review
Letters, 2005, 94(2):024503.

[2] Rudy S H , Brunton S L , Proctor J L , et al. Data-driven
discovery of partial differential equations[J]. Science Advances,
2017, 3(4):e1602614.

[3] Brunton S L , Proctor J L , Kutz J N . Discovering governing
equations from data by sparse identification of nonlinear dynamical
systems[J]. Proceedings of the National Academy of Sciences,
2016:201517384.

[4] Xu X , Di Y , Doi M . Variational method for liquids moving on a
substrate[J]. Physics of Fluids, 2016, 28(8):087101.

[5] 胡宇. 函數型數據分析方法研究及其應用[D]. 東北師範大學, 2011.

[6] 陳宜治. 函數型數據分析若干方法及應用[D]. 浙江工商大學, 2011.

[7] 沈關友. 基於函數型數據主成分分析的銀行股票數據預測[D].

[8] 吳剛, 胡新榮. 基於函數型主成分分析的織物狀態研究[J].
科技創業月刊, 2017(12).

[9] 李敏. 基於函數型主成分分析方法的用水量數據分析[J].
合肥學院學報(綜合版), 2014(4):21-25.
ear dynamical
systems[J]. Proceedings of the National Academy of Sciences,
2016:201517384.