OpenCV成長之路(2):圖像的遍歷

我們在實際應用中對圖像進行的操作,往往並不是將圖像作爲一個整體進行操作,而是對圖像中的所有點或特殊點進行運算,所以遍歷圖像就顯得很重要,如何高效的遍歷圖像是一個很值得探討的問題。

一、遍歷圖像的4種方式:at<typename>(i,j)

Mat類提供了一個at的方法用於取得圖像上的點,它是一個模板函數,可以取到任何類型的圖像上的點。下面我們通過一個圖像處理中的實際來說明它的用法。

在實際應用中,我們很多時候需要對圖像降色彩,因爲256*256*256實在太多了,在圖像顏色聚類或彩色直方圖時,我們需要用一些代表性的顏色代替豐富的色彩空間,我們的思路是將每個通道的256種顏色用64種代替,即將原來256種顏色劃分64個顏色段,每個顏色段取中間的顏色值作爲代表色。

void colorReduce(Mat& image,int div)
{
    for(int i=0;i<image.rows;i++)
    {
        for(int j=0;j<image.cols;j++)
        {
            image.at<Vec3b>(i,j)[0]=image.at<Vec3b>(i,j)[0]/div*div+div/2;
            image.at<Vec3b>(i,j)[1]=image.at<Vec3b>(i,j)[1]/div*div+div/2;
            image.at<Vec3b>(i,j)[2]=image.at<Vec3b>(i,j)[2]/div*div+div/2;
        }
    }
}


通過上面的例子我們可以看出,at方法取圖像中的點的用法:

image.at<uchar>(i,j):取出灰度圖像中i行j列的點。

image.at<Vec3b>(i,j)[k]:取出彩色圖像中i行j列第k通道的顏色點。其中uchar,Vec3b都是圖像像素值的類型,不要對Vec3b這種類型感覺害怕,其實在core裏它是通過typedef Vec<T,N>來定義的,N代表元素的個數,T代表類型。

更簡單一些的方法:OpenCV定義了一個Mat的模板子類爲Mat_,它重載了operator()讓我們可以更方便的取圖像上的點。

Mat_<uchar> im=image;

im(i,j)=im(i,j)/div*div+div/2;

二、高效一點:用指針來遍歷圖像

上面的例程中可以看到,我們實際喜歡把原圖傳進函數內,但是在函數內我們對原圖像進行了修改,而將原圖作爲一個結果輸出,很多時候我們需要保留原圖,這樣我們需要一個原圖的副本。

void colorReduce(const Mat& image,Mat& outImage,int div)
{
    // 創建與原圖像等尺寸的圖像
    outImage.create(image.size(),image.type());
    int nr=image.rows;
    // 將3通道轉換爲1通道
    int nl=image.cols*image.channels();
    for(int k=0;k<nr;k++)
    {
        // 每一行圖像的指針
        const uchar* inData=image.ptr<uchar>(k);
        uchar* outData=outImage.ptr<uchar>(k);
        for(int i=0;i<nl;i++)
        {
            outData[i]=inData[i]/div*div+div/2;
        }
    }
}

從上面的例子中可以看出,取出圖像中第i行數據的指針:image.ptr<uchar>(i)。

值得說明的是:程序中將三通道的數據轉換爲1通道,在建立在每一行數據元素之間在內存裏是連續存儲的,每個像素三通道像素按順序存儲。也就是一幅圖像數據最開始的三個值,是最左上角的那像素的三個通道的值。

但是這種用法不能用在行與行之間,因爲圖像在OpenCV裏的存儲機制問題,行與行之間可能有空白單元。這些空白單元對圖像來說是沒有意思的,只是爲了在某些架構上能夠更有效率,比如intel MMX可以更有效的處理那種個數是4或8倍數的行。但是我們可以申明一個連續的空間來存儲圖像,這個話題引入下面最爲高效的遍歷圖像的機制。

三、更高效的方法

上面已經提到過了,一般來說圖像行與行之間往往存儲是不連續的,但是有些圖像可以是連續的,Mat提供了一個檢測圖像是否連續的函數isContinuous()。當圖像連通時,我們就可以把圖像完全展開,看成是一行。

void colorReduce(const Mat& image,Mat& outImage,int div)
{
    int nr=image.rows;
    int nc=image.cols;
    outImage.create(image.size(),image.type());
    if(image.isContinuous()&&outImage.isContinuous())
    {
        nr=1;
        nc=nc*image.rows*image.channels();
    }
    for(int i=0;i<nr;i++)
    {
        const uchar* inData=image.ptr<uchar>(i);
        uchar* outData=outImage.ptr<uchar>(i);
        for(int j=0;j<nc;j++)
        {
            *outData++=*inData++/div*div+div/2;
        }
    }
}

用指針除了用上面的方法外,還可以用指針來索引固定位置的像素:

image.step返回圖像一行像素元素的個數(包括空白元素),image.elemSize()返回一個圖像像素的大小。

image.at<uchar>(i,j)=image.data+i*image.step+j*image.elemSize();

四、還有嗎?用迭代器來遍歷。

下面的方法可以讓我們來爲圖像中的像素聲明一個迭代器:

MatIterator_<Vec3b> it;

Mat_<Vec3b>::iterator it;

如果迭代器指向一個const圖像,則可以用下面的聲明:

MatConstIterator<Vec3b> it; 或者

Mat_<Vec3b>::const_iterator it;

下面我們用迭代器來簡化上面的colorReduce程序:

void colorReduce(const Mat& image,Mat& outImage,int div)
{
    outImage.create(image.size(),image.type());
    MatConstIterator_<Vec3b> it_in=image.begin<Vec3b>();
    MatConstIterator_<Vec3b> itend_in=image.end<Vec3b>();
    MatIterator_<Vec3b> it_out=outImage.begin<Vec3b>();
    MatIterator_<Vec3b> itend_out=outImage.end<Vec3b>();
    while(it_in!=itend_in)
    {
        (*it_out)[0]=(*it_in)[0]/div*div+div/2;
        (*it_out)[1]=(*it_in)[1]/div*div+div/2;
        (*it_out)[2]=(*it_in)[2]/div*div+div/2;
        it_in++;
        it_out++;
    }
}

如果你想從第二行開始,則可以從image.begin<Vec3b>()+image.rows開始。

上面4種方法中,第3種方法的效率最高!

五、圖像的鄰域操作

很多時候,我們對圖像處理時,要考慮它的鄰域,比如3*3是我們常用的,這在圖像濾波、去噪中最爲常見,下面我們介紹如果在一次圖像遍歷過程中進行鄰域的運算。

下面我們進行一個簡單的濾波操作,濾波算子爲[0 –1 0;-1 5 –1;0 –1 0]。

它可以讓圖像變得尖銳,而邊緣更加突出。核心公式即:sharp(i.j)=5*image(i,j)-image(i-1,j)-image(i+1,j

)-image(i,j-1)-image(i,j+1)。

void ImgFilter2d(const Mat &image,Mat& result)
{
    result.create(image.size(),image.type());
    int nr=image.rows;
    int nc=image.cols*image.channels();
    for(int i=1;i<nr-1;i++)
    {
        const uchar* up_line=image.ptr<uchar>(i-1);//指向上一行
        const uchar* mid_line=image.ptr<uchar>(i);//當前行
        const uchar* down_line=image.ptr<uchar>(i+1);//下一行
        uchar* cur_line=result.ptr<uchar>(i);
        for(int j=1;j<nc-1;j++)
        {
            cur_line[j]=saturate_cast<uchar>(5*mid_line[j]-mid_line[j-1]-mid_line[j+1]-
                up_line[j]-down_line[j]);
        }
    }
    // 把圖像邊緣像素設置爲0
    result.row(0).setTo(Scalar(0));
    result.row(result.rows-1).setTo(Scalar(0));
    result.col(0).setTo(Scalar(0));
    result.col(result.cols-1).setTo(Scalar(0));
}


上面的程序有以下幾點需要說明:

1,staturate_cast<typename>是一個類型轉換函數,程序裏是爲了確保運算結果還在uchar範圍內。

2,row和col方法返回圖像中的某些行或列,返回值是一個Mat。

3,setTo方法將Mat對像中的點設置爲一個值,Scalar(n)爲一個灰度值,Scalar(a,b,c)爲一個彩色值。

六、圖像的算術運算

Mat類把很多算數操作符都進行了重載,讓它們來符合矩陣的一些運算,如果+、-、點乘等。

下面我們來看看用位操作和基本算術運算來完成本文中的colorReduce程序,它更簡單,更高效。

將256種灰度階降到64位其實是拋棄了二進制最後面的4位,所以我們可以用位操作來做這一步處理。

首先我們計算2^8降到2^n中的n:int n=static_cast<int>(log(static_cast<double>(div))/log(2.0));

然後可以得到mask,mask=0xFF<<n;

用下面簡直的語句就可以得到我們想要的結果:

result=(image&Scalar(mask,mask,mask))+Scalar(div/2,div/2,div/2);

很多時候我們需要對圖像的一個通信單獨進行操作,比如在HSV色彩模式下,我們就經常把3個通道分開考慮。

vector<Mat> planes;
// 將image分爲三個通道圖像存儲在planes中
split(image,planes);
planes[0]+=image2;
// 將planes中三幅圖像合爲一個三通道圖像
merge(planes,result);
發佈了25 篇原創文章 · 獲贊 5 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章