最小中值平方估計

最小中值平方法

最小中值平方法是通過求解下面的非線性最小問題來估計參數的

LMedS記錄的是所有樣本中,偏差值居中的那個樣本的偏差,這種方法對錯誤匹配和外點有很好的魯棒性。

不像M-estimator,LMedS問題不能直接化簡爲帶權重的最小二乘問題,對於LMedS估計沒有一個具體的公式。

LMedS是從樣本中隨機抽選出一個樣本子集,使用LS對子集計算模型參數,然後計算所有樣本與該模型的偏差。

具體方法是根據下面方法進行曲線估計:

假設給定n個點:
1.採用Monte Carlo技術進行抽取包含p個點的m個樣本集。對於目前的問題,選擇p=5,因爲5 個點就可以確定一個二次曲線。

2.用每一個樣本集求出二次曲線Pj。

3.對於每一個二次曲線Pj,可求出整個數據集殘差平方的中值Mj。

displaymath3815

對於第i個點到二次曲線 tex2html_wrap_inline3838的殘差tex2html_wrap_inline3844有多種選擇,根據需要的精度和計算效率,可以選擇algebraic distance、Euclidean distance 、gradient weighted distance。

4.求取使得tex2html_wrap_inline3842最小的tex2html_wrap_inline3838

現在的問題是:怎樣確定m的值??如果一個樣本的p個點均是內點,則爲一個好的樣本。假設一個數據集包含 tex2html_wrap_inline3862的外點,則m個樣本中至少有一個是好的樣本的概率是

 equation1714

一般包含好點的概率P接近於1,給定p和tex2html_wrap_inline3862

displaymath3816

若包含外點的百分比tex2html_wrap_inline3862=40%,P=0.99,則m=57;可以通過並行算法加快算法的速度,使得對於每個子集的處理均相互獨立。

如果數據集存在高斯噪音,LMedS的效率將會非常低。爲了彌補這種缺陷,提出了帶權重的最小二乘法,標準差的估計由下式給出

displaymath3817

 tex2html_wrap_inline3842爲最小的中值。常數1.4826使得在出現高斯噪音的時候,和最小二乘方法的效率一樣。5/(n-p)用來補償數量太少。基於tex2html_wrap_inline3884,我們可以給每一項分配一個權重係數

displaymath3818

tex2html_wrap_inline3528 是第i個點相對於二次曲線P的殘差,如果某個點所對應的權重係數爲0,則爲外點,應剔除掉。二次曲線P則可以由下面帶權重的最小二乘問題求解

displaymath3819

如前所述,可以通過採用Monte-Carlo技術來提高LMedS方法計算效率。然而,通過這種方法生成的樣本中的5個點很有可能非常靠近,這種情況在曲線擬合過程中是應該儘量避免的,因爲用這些點進行曲線擬合非常不穩定,而且通常會得到錯誤的結果。對每一個樣本進行有效性檢驗,將會非常耗時,降低整個算法的計算效率。爲了保證算法的魯棒性和有效性,我們採用一種基於分組的規則的隨機抽樣法(regularly random selection method based on bucketing techniques),具體實現過程如下:

首先,計算第一幅圖像中點座標的極大極小值,然後將座標點所在的區域均勻劃分成tex2html_wrap_inline3896組(在實驗中,b=8)。每一個組將包含一系列的點,同時也包括一些匹配點。最後,剔除沒有匹配點的分組。爲了生成包含5個點的一個樣本,首先隨機選擇5個相互不同的組,然後在每一個組裏隨機選取一個匹配點。

figure1738 

Figure 5: Illustration of a bucketing technique

現在任然存在的問題是:到底需要多少個樣本?如果壞點在空間中均勻分佈,且每一組有相同的點數,隨機選擇是一種均勻分佈則33式仍然可用。但是,一般情況下各組所包含的點數可能相差會非常大。由此造成的結果就是,包含點數少的組中的點比包含點數多的組中的點被選擇地可能性更大。可以用如下的方法來說明:

假設共有I個組,我們將0到1分成I個區間,則第i個區間的寬度是tex2html_wrap_inline3908 tex2html_wrap_inline3910是第i組點的個數。在選擇組的過程中,由均勻隨機數發生器(uniform random generator)產生一個0到1的隨機數,這個隨機數落入哪個區間,則選擇哪個組。

figure1749 

Figure 6: Interval and bucket mapping

可以用這種方法對兩幅非標定的圖像進行匹配。對於給定的兩幅未標定圖像,唯一能用的幾何約束是極線約束。先採用傳統的方法(correlation and relaxation methods)找到初始的匹配點,然後利用最小中值平方法(LMedS)剔除初始匹配中的錯誤匹配。圖像間的極線幾何關係可以由圖像中有實際意義的準則精確估計出來。

英文版見:http://research.microsoft.com/en-us/um/people/zhang/INRIA/Publis/Tutorial-Estim/node25.html#SECTION000105000000000000000

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章