卡爾曼濾波 – Kalman Filter (通俗的解釋)

轉自:http://www.cnblogs.com/u2usoft/articles/809011.html

1. 什麼是卡爾曼濾波
(What is the Kalman Filter?) 
在學習卡爾曼濾波之前,首先看看爲什麼叫“卡爾曼”。跟其他著名的理論(例如傅立葉變換,泰勒級數等等)一樣,卡爾曼也是一個人的名字,而跟他們不同的是,他是個現代人! 
卡爾曼全名Rudolf Emil Kalman,匈牙利數學家,1930年出生於匈牙利首都布達佩斯。1953,1954年於麻省理工學院分別獲得電機工程學士及碩士學位。1957年於哥倫比亞大學獲得博士學位。我們現在要學習的卡爾曼濾波,正是源於他的博士論文和1960年發表的論文《A New Approach to Linear Filtering and Prediction Problems》(線性濾波與預測問題的新方法)。如果對這編論文有興趣,可以到這裏的地址下載: http://www.cs.unc.edu/~welch/media/pdf/Kalman1960.pdf。 
簡單來說,卡爾曼濾波是一個“optimal recursive data processing algorithm(最優化自迴歸數據處理算法)”。對於解決很大部分的問題,他是最優,效率最高甚至是最有用的。他的廣泛應用已經超過30年,包括機器人導航,控制,傳感器數據融合甚至在軍事方面的雷達系統以及導彈追蹤等等。近年來更被應用於計算機圖像處理,例如頭臉識別,圖像分割,圖像邊緣檢測等等。 
2.卡爾曼濾波的介紹 
(Introduction to the Kalman Filter) 
爲了可以更加容易的理解卡爾曼濾波,這裏會應用形象的描述方法來講解,而不是像大多數參考書那樣羅列一大堆的數學公式和數學符號。但是,他的5條公式是其核心內容。結合現代的計算機,其實卡爾曼的程序相當的簡單,只要你理解了他的那5條公式。 
在介紹他的5條公式之前,先讓我們來根據下面的例子一步一步的探索。 
假設我們要研究的對象是一個房間的溫度。根據你的經驗判斷,這個房間的溫度是恆定的,也就是下一分鐘的溫度等於現在這一分鐘的溫度(假設我們用一分鐘來做時間單位)。假設你對你的經驗不是100%的相信,可能會有上下偏差幾度。我們把這些偏差看成是高斯白噪聲(White Gaussian Noise),也就是這些偏差跟前後時間是沒有關係的而且符合高斯分配(Gaussian Distribution)。另外,我們在房間裏放一個溫度計,但是這個溫度計也不準確的,測量值會比實際值偏差。我們也把這些偏差看成是高斯白噪聲。 
好了,現在對於某一分鐘我們有兩個有關於該房間的溫度值:你根據經驗的預測值(系統的預測值)和溫度計的值(測量值)。下面我們要用這兩個值結合他們各自的噪聲來估算出房間的實際溫度值。 
假如我們要估算k時刻的是實際溫度值。首先你要根據k-1時刻的溫度值,來預測k時刻的溫度。因爲你相信溫度是恆定的,所以你會得到k時刻的溫度預測值是跟 k-1時刻一樣的,假設是23度,同時該值的高斯噪聲的偏差是5度(5是這樣得到的:如果k-1時刻估算出的最優溫度值的偏差是3,你對自己預測的不確定度是4度,他們平方相加再開方,就是5)。然後,你從溫度計那裏得到了k時刻的溫度值,假設是25度,同時該值的偏差是4度。 
由於我們用於估算k時刻的實際溫度有兩個溫度值,分別是23度和25度。究竟實際溫度是多少呢?相信自己還是相信溫度計呢?究竟相信誰多一點,我們可以用他們的 covariance來判斷。因爲Kg^2=5^2/(5^2+4^2),所以Kg=0.78,我們可以估算出k時刻的實際溫度值是:23+0.78* (25-23)=24.56度。可以看出,因爲溫度計的covariance比較小(比較相信溫度計),所以估算出的最優溫度值偏向溫度計的值。 
現在我們已經得到k時刻的最優溫度值了,下一步就是要進入k+1時刻,進行新的最優估算。到現在爲止,好像還沒看到什麼自迴歸的東西出現。對了,在進入k+ 1時刻之前,我們還要算出k時刻那個最優值(24.56度)的偏差。算法如下:((1-Kg)*5^2)^0.5=2.35。這裏的5就是上面的k時刻你預測的那個23度溫度值的偏差,得出的2.35就是進入k+1時刻以後k時刻估算出的最優溫度值的偏差(對應於上面的3)。 
就是這樣,卡爾曼濾波就不斷的把covariance遞歸,從而估算出最優的溫度值。他運行的很快,而且它只保留了上一時刻的covariance。上面的Kg,就是卡爾曼增益(Kalman Gain)。他可以隨不同的時刻而改變他自己的值,是不是很神奇! 
下面就要言歸正傳,討論真正工程系統上的卡爾曼。 
3. 卡爾曼濾波算法 
(The Kalman Filter Algorithm) 
在這一部分,我們就來描述源於Dr Kalman 的卡爾曼濾波。下面的描述,會涉及一些基本的概念知識,包括概率(Probability),隨即變量(Random Variable),高斯或正態分配(Gaussian Distribution)還有State-space Model等等。但對於卡爾曼濾波的詳細證明,這裏不能一一描述。 
首先,我們先要引入一個離散控制過程的系統。該系統可用一個線性隨機微分方程(Linear Stochastic Difference equation)來描述: 
X(k)=A X(k-1)+B U(k)+W(k) 
再加上系統的測量值: 
Z(k)=H X(k)+V(k) 
上兩式子中,X(k)是k時刻的系統狀態,U(k)是k時刻對系統的控制量。A和B是系統參數,對於多模型系統,他們爲矩陣。Z(k)是k時刻的測量值,H 是測量系統的參數,對於多測量系統,H爲矩陣。W(k)和V(k)分別表示過程和測量的噪聲。他們被假設成高斯白噪聲(White Gaussian Noise),他們的covariance 分別是Q,R(這裏我們假設他們不隨系統狀態變化而變化)。 
對於滿足上面的條件(線性隨機微分系統,過程和測量都是高斯白噪聲),卡爾曼濾波是最優的信息處理器。下面我們來用他們結合他們的covariances 來估算系統的最優化輸出(類似上一節那個溫度的例子)。 
首先我們要利用系統的過程模型,來預測下一狀態的系統。假設現在的系統狀態是k,根據系統的模型,可以基於系統的上一狀態而預測出現在狀態: 
X(k|k-1)=A X(k-1|k-1)+B U(k) ……….. (1) 
式(1)中,X(k|k-1)是利用上一狀態預測的結果,X(k-1|k-1)是上一狀態最優的結果,U(k)爲現在狀態的控制量,如果沒有控制量,它可以爲0。 
到現在爲止,我們的系統結果已經更新了,可是,對應於X(k|k-1)的covariance還沒更新。我們用P表示covariance: 
P(k|k-1)=A P(k-1|k-1) A’+Q ……… (2) 
式(2) 中,P(k|k-1)是X(k|k-1)對應的covariance,P(k-1|k-1)是X(k-1|k-1)對應的covariance,A’表示 A的轉置矩陣,Q是系統過程的covariance。式子1,2就是卡爾曼濾波器5個公式當中的前兩個,也就是對系統的預測。 
現在我們有了現在狀態的預測結果,然後我們再收集現在狀態的測量值。結合預測值和測量值,我們可以得到現在狀態(k)的最優化估算值X(k|k): 
X(k|k)= X(k|k-1)+Kg(k) (Z(k)-H X(k|k-1)) ……… (3) 
其中Kg爲卡爾曼增益(Kalman Gain): 
Kg(k)= P(k|k-1) H’ / (H P(k|k-1) H’ + R) ……… (4) 
到現在爲止,我們已經得到了k狀態下最優的估算值X(k|k)。但是爲了要另卡爾曼濾波不斷的運行下去直到系統過程結束,我們還要更新k狀態下X(k|k)的covariance: 
P(k|k)=(I-Kg(k) H)P(k|k-1) ……… (5) 
其中I 爲1的矩陣,對於單模型單測量,I=1。當系統進入k+1狀態時,P(k|k)就是式子(2)的P(k-1|k-1)。這樣,算法就可以自迴歸的運算下去。 
卡爾曼濾波的原理基本描述了,式子1,2,3,4和5就是他的5 個基本公式。根據這5個公式,可以很容易的實現計算機的程序。 
下面,我會用程序舉一個實際運行的例子。。。 
4. 簡單例子 
(A Simple Example) 
這裏我們結合第二第三節,舉一個非常簡單的例子來說明卡爾曼濾波的工作過程。所舉的例子是進一步描述第二節的例子,而且還會配以程序模擬結果。 
根據第二節的描述,把房間看成一個系統,然後對這個系統建模。當然,我們見的模型不需要非常地精確。我們所知道的這個房間的溫度是跟前一時刻的溫度相同的,所以A=1。沒有控制量,所以U(k)=0。因此得出: 
X(k|k-1)=X(k-1|k-1) ……….. (6) 
式子(2)可以改成: 
P(k|k-1)=P(k-1|k-1) +Q ……… (7) 
因爲測量的值是溫度計的,跟溫度直接對應,所以H=1。式子3,4,5可以改成以下: 
X(k|k)= X(k|k-1)+Kg(k) (Z(k)-X(k|k-1)) ……… (8) 
Kg(k)= P(k|k-1) / (P(k|k-1) + R) ……… (9) 
P(k|k)=(1-Kg(k))P(k|k-1) ……… (10) 
現在我們模擬一組測量值作爲輸入。假設房間的真實溫度爲25度,我模擬了200個測量值,這些測量值的平均值爲25度,但是加入了標準偏差爲幾度的高斯白噪聲(在圖中爲藍線)。 
爲了令卡爾曼濾波開始工作,我們需要告訴卡爾曼兩個零時刻的初始值,是X(0|0)和P(0|0)。他們的值不用太在意,隨便給一個就可以了,因爲隨着卡爾曼的工作,X會逐漸的收斂。但是對於P,一般不要取0,因爲這樣可能會令卡爾曼完全相信你給定的X(0|0)是系統最優的,從而使算法不能收斂。我選了X (0|0)=1度,P(0|0)=10。 
該系統的真實溫度爲25度,圖中用黑線表示。圖中紅線是卡爾曼濾波輸出的最優化結果(該結果在算法中設置了Q=1e-6,R=1e-1)。 
附matlab下面的kalman濾波程序: 
clear 
N=200; 
w(1)=0; 
w=randn(1,N) 
x(1)=0; 
a=1; 
for k=2:N; 
x(k)=a*x(k-1)+w(k-1); 
end 
V=randn(1,N); 
q1=std(V); 
Rvv=q1.^2; 
q2=std(x); 
Rxx=q2.^2; 
q3=std(w); 
Rww=q3.^2; 
c=0.2; 
Y=c*x+V; 
p(1)=0; 
s(1)=0; 
for t=2:N; 
p1(t)=a.^2*p(t-1)+Rww; 
b(t)=c*p1(t)/(c.^2*p1(t)+Rvv); 
s(t)=a*s(t-1)+b(t)*(Y(t)-a*c*s(t-1)); 
p(t)=p1(t)-c*b(t)*p1(t); 
end 
t=1:N; 
plot(t,s,'r',t,Y,'g',t,x,'b');

算法實現
X(k) = F(k,k-1)·X(k-1)+T(k,k-1)·U(k-1) 
Y(k) = H(k)·X(k)+N(k) 
其中 
X(k)和Y(k)分別是k時刻的狀態矢量與觀測矢量 
F(k,k-1)爲狀態轉移矩陣 
U(k)爲k時刻動態噪聲 
T(k,k-1)爲系統控制矩陣 
H(k)爲k時刻觀測矩陣 
N(k)爲k時刻觀測噪聲 
則卡爾曼濾波的算法流程爲: 
X(k)^= F(k,k-1)·X(k-1) 
計算協方差矩陣 
C(k)^=F(k,k-1)×C(k)×F(k,k-1)'+T(k,k-1)×Q(k)×T(k,k-1)' 
Q(k) = U(k)×U(k)' 
計算卡爾曼增益矩陣 
K(k) = C(k)^×H(k)'×[H(k)×C(k)^×H(k)'+R(k)]^(-1) 
R(k) = N(k)×N(k)' 
更新
X(k)~=X(k)^+K(k)×[Y(k)-H(k)×X(k)^] 
計算更新後協防差矩陣 
C(k)~ = [I-K(k)×H(k)]×C(k)^×[I-K(k)×H(k)]'+K(k)×R(k)×K(k)' 
X(k+1) = X(k)~ 
C(k+1) = C(k)~ 
重複以上步驟 
#include "stdlib.h" 
#include "rinv.c" 
int lman(n,m,k,f,q,r,h,y,x,p,g) 
int n,m,k; 
double f[],q[],r[],h[],y[],x[],p[],g[]; 
{ int i,j,kk,ii,l,jj,js; 
double *e,*a,*b; 
e=malloc(m*m*sizeof(double)); 
l=m; 
if (l<n) l=n; 
a=malloc(l*l*sizeof(double)); 
b=malloc(l*l*sizeof(double)); 
for (i=0; i<=n-1; i++) 
for (j=0; j<=n-1; j++) 
{ ii=i*l+j; a[ii]=0.0; 
for (kk=0; kk<=n-1; kk++) 
a[ii]=a[ii]+p[i*n+kk]*f[j*n+kk]; 

for (i=0; i<=n-1; i++) 
for (j=0; j<=n-1; j++) 
{ ii=i*n+j; p[ii]=q[ii]; 
for (kk=0; kk<=n-1; kk++) 
p[ii]=p[ii]+f[i*n+kk]*a[kk*l+j]; 

for (ii=2; ii<=k; ii++) 
{ for (i=0; i<=n-1; i++) 
for (j=0; j<=m-1; j++) 
{ jj=i*l+j; a[jj]=0.0; 
for (kk=0; kk<=n-1; kk++) 
a[jj]=a[jj]+p[i*n+kk]*h[j*n+kk]; 

for (i=0; i<=m-1; i++) 
for (j=0; j<=m-1; j++) 
{ jj=i*m+j; e[jj]=r[jj]; 
for (kk=0; kk<=n-1; kk++) 
e[jj]=e[jj]+h[i*n+kk]*a[kk*l+j]; 

js=rinv(e,m); 
if (js==0) 
{ free(e); free(a); free(b); return(js);} 
for (i=0; i<=n-1; i++) 
for (j=0; j<=m-1; j++) 
{ jj=i*m+j; g[jj]=0.0; 
for (kk=0; kk<=m-1; kk++) 
g[jj]=g[jj]+a[i*l+kk]*e[j*m+kk]; 

for (i=0; i<=n-1; i++) 
{ jj=(ii-1)*n+i; x[jj]=0.0; 
for (j=0; j<=n-1; j++) 
x[jj]=x[jj]+f[i*n+j]*x[(ii-2)*n+j]; 

for (i=0; i<=m-1; i++) 
{ jj=i*l; b[jj]=y[(ii-1)*m+i]; 
for (j=0; j<=n-1; j++) 
b[jj]=b[jj]-h[i*n+j]*x[(ii-1)*n+j]; 

for (i=0; i<=n-1; i++) 
{ jj=(ii-1)*n+i; 
for (j=0; j<=m-1; j++) 
x[jj]=x[jj]+g[i*m+j]*b[j*l]; 

if (ii<k) 
{ for (i=0; i<=n-1; i++) 
for (j=0; j<=n-1; j++) 
{ jj=i*l+j; a[jj]=0.0; 
for (kk=0; kk<=m-1; kk++) 
a[jj]=a[jj]-g[i*m+kk]*h[kk*n+j]; 
if (i==j) a[jj]=1.0+a[jj]; 

for (i=0; i<=n-1; i++) 
for (j=0; j<=n-1; j++) 
{ jj=i*l+j; b[jj]=0.0; 
for (kk=0; kk<=n-1; kk++) 
b[jj]=b[jj]+a[i*l+kk]*p[kk*n+j]; 

for (i=0; i<=n-1; i++) 
for (j=0; j<=n-1; j++) 
{ jj=i*l+j; a[jj]=0.0; 
for (kk=0; kk<=n-1; kk++) 
a[jj]=a[jj]+b[i*l+kk]*f[j*n+kk]; 

for (i=0; i<=n-1; i++) 
for (j=0; j<=n-1; j++) 
{ jj=i*n+j; p[jj]=q[jj]; 
for (kk=0; kk<=n-1; kk++) 
p[jj]=p[jj]+f[i*n+kk]*a[j*l+kk]; 



free(e); free(a); free(b); 
return(js); 
}


PS:

以下爲本人對matlab code的修正和註釋

clear;
N=200;
w=normrnd(0,3,1,N);%%%系統過程的noise
w(1)=0;
a=1;
x=ones(1,N);
x=x.*25;
for k=2:N
    x(k)=a*x(k-1)+w(k-1)%%%狀態預測值
end
V=normrnd(0,4,1,N);%%%測量的noise
q1=std(V);
Rvv=q1.^2;
q2=std(x);
Rxx=q2.^2;
q3=std(w);
Rww=q3.^2;
c=1;
Y=c*x+V;%%%系統測量值
p(1)=0;
s(1)=0;
for t=2:N
    p1(t)=a.*2*p(t-1)+Rww;%%%系統covariance估計
    b(t)=c*p1(t)/(c.^2*p1(t)+Rvv);%%計算卡爾曼增益
    s(t)=a*s(t-1)+b(t)*(Y(t)-a*c*s(t-1));%%系統狀態估計
    p(t)=p1(t)-c*b(t)*p1(t);%%%%系統covariance更新
end
t=1:N; 
plot(t,s,'r',t,Y,'g',t,x,'b');


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章