原文鏈接:http://my.oschina.net/u/1455799/blog/292145 ,轉載請註明
原理簡介 霍夫變換(Hough Transform) 霍夫變換是圖像處理中從圖像中識別幾何形狀的基本方法之一,應用很廣泛,也有很多改進算法。最基本的霍夫變換是從黑白圖像中檢測直線(線段)。
1詳細內容
我們先看這樣一個問題:設已知一黑白圖像上畫了一條直線,要求出這條直線所在的位置。我們知道,直線的方程可以用y=k*x+b 來表示,其中k和b是參數,分別是斜率和截距。過某一點(x0,y0)的所有直線的參數都會滿足方程y0=kx0+b。即點(x0,y0)確定了一組直線。方程y0=kx0+b在參數k--b平面上是一條直線,(你也可以是方程b=-x0*k+y0對應的直線)。這樣,圖像x--y平面上的一個前景像素點就對應到參數平面上的一條直線。我們舉個例子說明解決前面那個問題的原理。設圖像上的直線是y=x, 我們先取上面的三個點:A(0,0), B(1,1), C(2,2)。可以求出,過A點的直線的參數要滿足方程b=0, 過B點的直線的參數要滿足方程1=k+b, 過C點的直線的參數要滿足方程2=2k+b, 這三個方程就對應着參數平面上的三條直線,而這三條直線會相交於一點(k=1,b=0)。 同理,原圖像上直線y=x上的其它點(如(3,3),(4,4)等) 對應參數平面上的直線也會通過點(k=1,b=0)。
2應用
這個性質就爲我們解決問題提供了方法:
首先,我們初始化一塊緩衝區,對應於參數平面,將其所有數據置爲0.
對於圖像上每一前景點,求出參數平面對應的直線,把這直線上的所有點的值都加1。最後,找到參數平面上最大點的位置,這個位置就是原圖像上直線的參數。上面就是霍夫變換的基本思想。就是把圖像平面上的點對應到參數平面上的線,最後通過統計特性來解決問題。假如圖像平面上有兩條直線,那麼最終在參數平面上就會看到兩個峯值點,依此類推。
在實際應用中,y=k*x+b形式的直線方程沒有辦法表示x=c形式的直線(這時候,直線的斜率爲無窮大)。所以實際應用中,是採用參數方程p=x*cos(theta)+y*sin(theta)。這樣,圖像平面上的一個點就對應到參數p---theta平面上的一條曲線上。其它的還是一樣。
3應用實例1
在看下面一個問題:我們要從一幅圖像中檢測出半徑已知的圓形來。這個問題比前一個還要直觀。我們可以取和圖像平面一樣的參數平面,以圖像上每一個前景點爲圓心,以已知的半徑在參數平面上畫圓,並把結果進行累加。最後找出參數平面上的峯值點,這個位置就對應了圖像上的圓心。在這個問題裏,圖像平面上的每一點對應到參數平面上的一個圓。
把上面的問題改一下,假如我們不知道半徑的值,而要找出圖像上的圓來。這樣,一個辦法是把參數平面擴大稱爲三維空間。就是說,參數空間變爲x--y--R三維,對應圓的圓心和半徑。
圖像平面上的每一點就對應於參數空間中每個半徑下的一個圓,這實際上是一個圓錐。最後當然還是找參數空間中的峯值點。不過,這個方法顯然需要大量的內存,運行速度也會是很大問題。有什麼更好的方法麼?我們前面假定的圖像都是黑白圖像(2值圖像),實際上這些2值圖像多是彩色或灰度圖像通過邊緣提取來的。我們前面提到過,圖像邊緣除了位置信息,還有方向信息也很重要,這裏就用上了。根據圓的性質,圓的半徑一定在垂直於圓的切線的直線上,也就是說,在圓上任意一點的法線上。這樣,解決上面的問題,我們仍採用2維的參數空間,對於圖像上的每一前景點,加上它的方向信息,都可以確定出一條直線,圓的圓心就在這條直線上。這樣一來,問題就會簡單了許多。
4應用實例2
接下來還有許多類似的問題,如檢測出橢圓,正方形,長方形,圓弧等等。這些方法大都類似,關鍵就是需要熟悉這些幾何形狀的數學性質。霍夫變換的應用是很廣泛的,比如我們要做一個支票識別的任務,假設支票上肯定有一個紅顏色的方形印章,我們可以通過霍夫變換來對這個印章進行快速定位,在配合其它手段進行其它處理。霍夫變換由於不受圖像旋轉的影響,所以很容易的可以用來進行定位。
霍夫變換有許多改進方法,一個比較重要的概念是廣義霍夫變換,它是針對所有曲線的,用處也很大。就是針對直線的霍夫變換也有很多改進算法,比如前面的方法我們沒有考慮圖像上的這一直線上的點是否連續的問題,這些都要隨着應用的不同而有優化的方法。
順便說一句,搞圖像處理這一行,在理論方面,有幾本雜誌是要看的,自然是英文雜誌,中文期刊好像沒有專門的圖像處理期刊,當然也有不少涉及這方面的期刊,但實事求是來說,的確比英文雜誌水平差很多。
‘IEEE Transactions on Pattern Recognition And Machine Intelligence’
‘IEEE Transactions on Image Processing’
是最重要的兩本,其它的如ICCV、CVPR、ECCV、NIPS、BMVC等的會議文章也非常好
(1)理論之通俗理解:
1.在圖像中檢測直線的問題,其實質是找到構成直線的所有的像素點。那麼問題就是從找到直線,變成找到符合y=mx+c的所有(x,y)的點的問題。
2.進行座標系變化y=mx+c,變成c=-xm+b。直線上的點(x1,y1),在轉換座標系後爲一條直線。這個原理應該是高中的。
3.直線上每一個點在MC座標系中都表現爲直線,而且,這些直線都相交於一個點,(m,c)。找到所有點的問題,轉變爲尋找直線的問題。
4.對於圖像中的每一個點,在MC座標系中對應着很多的直線。找到直線的交點,就對應着找到圖像中的直線。
實際在使用這一原理的時候,不是採用直線的斜率和截距公式,而是用
如何實現:
1. 將θ角在-90度到90度的範圍裏,劃分爲很多區間,對所有的像素點(x,y)在所有θ角的時候,求出ρ.從而累加ρ值出現的次數。高於某個閾值的ρ就是一個直線。
2. 這個過程就類似於如下一個二維的表格,橫座標就是θ角,ρ就是到直線的最短距離。
橫座標θ不斷變換,對於所有的不爲0的像素點,計算出ρ,找到ρ在座標(θ,ρ)的位置累加1.
-
上圖中局部最大的就是找到的直線的θ和ρ的值。
(2) 具體代碼片段
for(
ang = 0, n = 0; n < numangle; ang += theta, n++ )
{
tabSin[n] = (float)(sin(ang) * irho);
tabCos[n] = (float)(cos(ang) * irho);
}
// stage 1. fill accumulator
for( i = 0; i < height; i++ )
for( j = 0; j < width; j++ )
{
if( image[i * step + j] != 0 )
for( n = 0; n < numangle; n++ )
{
r = cvRound( j * tabCos[n] + i * tabSin[n] );
r += (numrho - 1) / 2;
accum[(n+1) * (numrho+2) + r+1]++;
}
}
// stage 2. find local maximums
for( r = 0; r < numrho; r++ )
for( n = 0; n < numangle; n++ )
{
int base = (n+1) * (numrho+2)
+ r+1;
if( accum[base] > threshold &&
accum[base] > accum[base - 1] && accum[base]
>= accum[base + 1] &&
accum[base] > accum[base - numrho - 2] && accum[base]
>= accum[base + numrho + 2] )
sort_buf[total++] = base;
}
// stage 3. sort the detected lines by accumulator value
icvHoughSortDescent32s( sort_buf, total, accum );
// stage 4. store the first min(total,linesMax) lines to the output buffer
linesMax = MIN(linesMax, total);
scale = 1./(numrho+2);
for( i = 0; i < linesMax; i++ )
{
CvLinePolar line;
int idx = sort_buf[i];
int n = cvFloor(idx*scale) - 1;
int r = idx - (n+1)*(numrho+2) - 1;
line.rho = (r - (numrho - 1)*0.5f) * rho;
line.angle = n * theta;
cvSeqPush( lines, &line );
}