【查蟲日誌】快速判斷一副灰度圖像中是否只有黑色和白色值（即是否爲二值圖像）過程中bool變量的是是非非。

原創

2019-07-01 13:55

　　二值圖像我們在圖像處理過程中是經常遇到的，有的時候我們在進行一個算法處理前，需要判斷下一副圖像的數據是否符合二值圖的需求，這個時候我們可以寫個簡單的函數來做個判斷，比如我寫了一個很簡單的的代碼如下：

bool IM_IsBinaryImage_C(unsigned char *Src, int Width, int Height, int Stride)
{
    int Channel = Stride / Width;
    if (Src == NULL)                            return false;
    if ((Width <= 0) || (Height <= 0))            return false;
    if (Channel != 1)                            return false;
    for (int Y = 0; Y < Height; Y++)                                        
    {
        unsigned char *LinePS = Src + Y * Stride;
        for (int X = 0; X < Width * Channel; X++)
        {
            if ((LinePS[X] != 255) && (LinePS[X] != 0))    return false;
            //if (((LinePS[X] == 255) || (LinePS[X] == 0)) == false) return false;
        }
    }
    return true;
}

　　即如果存在一個像素如果不爲255，也不爲0，則這副圖就不是二值圖，立即可以返回了，而無需進行後續的判斷了。　　

　　當一副圖不是二值圖時，通常，我們很快就能返回結果了，那麼最壞的情況就是他恰好是二值圖，這樣，我們就要遍歷完所有的像素。我們測試過對於16MB的二值圖（4000*4000），測試需要15ms的時間，爲了能儘量減少耗時，可以使用如下的SIMD指令來優化這個判斷：

bool IM_IsBinaryImage_SSE_Bug(unsigned char *Src, int Width, int Height, int Stride)
{
    int Channel = Stride / Width;
    if (Src == NULL)                            return false;
    if ((Width <= 0) || (Height <= 0))            return false;
    if (Channel != 1)                            return false;
    int BlockSize = 16, Block = (Width * Channel)/ BlockSize;

    for (int Y = 0; Y < Height; Y++)                                        //    速度提升約16倍
    {
        unsigned char *LinePS = Src + Y * Stride;
        for (int X = 0; X < Block * BlockSize; X += BlockSize)
        {
            __m128i SrcV = _mm_loadu_si128((__m128i *)(LinePS + X));
            __m128i MaskW = _mm_cmpeq_epi8(SrcV, _mm_set1_epi8(255));        
            __m128i MaskB = _mm_cmpeq_epi8(SrcV, _mm_setzero_si128());
            __m128i Mask = _mm_or_si128(MaskW, MaskB);
            if (_mm_movemask_epi8(Mask) != 65535)    return false;            //    if (((LinePS[X] == 255) || (LinePS[X] == 0)) == false) return false;
        }
        for (int X = Block * BlockSize; X < Width * Channel; X++)
        {
            if ((LinePS[X] != 255) && (LinePS[X] != 0))    return false;
        }
    }
    return true;
}

　　由於SIMD指令裏沒有_mm_cmpneq_epi8函數，我們該用代碼1片段裏被註釋掉的那種邏輯來判斷一個像素是否是黑色和白色，這裏當然也有一些技巧，比如_mm_movemask_epi8指令的運用。我們判斷這個像素是否等於255和0，當然，一個像素不可能同時滿足這兩個條件，不滿足的Mask返回0，滿足則Mask返回255，所以如果他是黑色和白色，你們這兩個Mask進行或操作肯定就爲255，否則或操作後就爲0，SIMD中這樣的比較可以一次性進行16個像素，如果這16個像素都符合條件，那麼或操作後的mask都爲255，這樣通過使用_mm_movemask_epi8來判斷這個mask就完成了16個像素的判斷。

　　很顯然，這個過程的效率要高很多，測試16MB的真二值圖，也就1ms就完成了判斷。

　　好，我用上面的那個代碼寫成DLL，供C#調用，相關的函數聲明如下：

[DllImport("IsBinaryImage.dll", CallingConvention = CallingConvention.StdCall, CharSet = CharSet.Unicode, ExactSpelling = true)]
 private static extern bool IM_IsBinaryImage_C(byte* Src, int Width, int Height, int Stride);
[DllImport("IsBinaryImage.dll", CallingConvention = CallingConvention.StdCall, CharSet = CharSet.Unicode, ExactSpelling = true)]
private static extern bool IM_IsBinaryImage_SSE_Bug(byte* Src, int Width, int Height, int Stride);

　　可出來的結果令我非常詫異，我測試了下面這2幅圖：

　　　　　　　　　　　　測試圖1　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　測視圖2 （頁面壓縮了）

　　這兩幅圖都不是二值圖，他們在某些邊緣位置都有抗鋸齒操作。但是那個IM_IsBinaryImage_C檢測圖1不是二值圖像，檢測圖2 是二值圖像，而IM_IsBinaryImage_SSE_Bug則檢測圖1是二值圖像，圖2不是二值圖像。開始我以爲是我的SSE代碼寫錯了，我就又換了一種寫法，如下所示：

bool IM_IsBinaryImage_SSE(unsigned char *Src, int Width, int Height, int Stride)
{
    int Channel = Stride / Width;
    if (Src == NULL)                            return false;
    if ((Width <= 0) || (Height <= 0))            return false;
    if (Channel != 1)                            return false;
    int BlockSize = 16, Block = (Width * Channel) / BlockSize;
    bool Flag = true;
    for (int Y = 0; Y < Height; Y++)                                        //    速度提升約16倍
    {
        unsigned char *LinePS = Src + Y * Stride;
        if (Flag == false)    break;
        for (int X = 0; X < Block * BlockSize; X += BlockSize)
        {
            __m128i SrcV = _mm_loadu_si128((__m128i *)(LinePS + X));
            __m128i MaskW = _mm_cmpeq_epi8(SrcV, _mm_set1_epi8(255));        //    _mm_cmpeq_epi8是自帶的，如果使用_mm_cmpneq_epu8則慢了一些。
            __m128i MaskB = _mm_cmpeq_epi8(SrcV, _mm_setzero_si128());
            __m128i Mask = _mm_or_si128(MaskW, MaskB);
            if (_mm_movemask_epi8(Mask) != 65535)
            {
                Flag = false;                            //    if ((LinePS[X] == 255) || (LinePS[X] == 0)) = false, return  false
                break;
            }
        }
        for (int X = Block * BlockSize; X < Width * Channel; X++)
        {
            if ((LinePS[X] != 255) && (LinePS[X] != 0))
            {
                Flag = false;
                break;
            }
        }
    }
    return Flag;
}

　　這個時候測繪對所有的圖像結果都正確了。

　　但是，我覺得代碼片段2應該是不會有任何錯誤的啊。爲什麼會出現這種現象呢。

　　後面從網上查了下，C++的bool變量就只有true和false，是字節變量，這個可以用printf("%d", sizeof(false));來驗證，會打印1。而在其他語言中，似乎是int類型。但是我在C#中用 MessageBox.Show(sizeof(bool).ToString()); 似乎也是彈出1。

　　但是，當我們把這些函數的返回值都改爲int後，在C#中調用就正常了，比如:

int IM_IsBinaryImage_C(unsigned char *Src, int Width, int Height, int Stride)

　　也就是說上述的IM_IsBinaryImage_SSE_Bug函數體並無Bug。這到底是怎麼回事，還請萬能的網絡高手有空予以解疑。

　　附上測試工程和代碼：https://files.cnblogs.com/files/Imageshop/ISBinaryImage.rar

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【查蟲日誌】快速判斷一副灰度圖像中是否只有黑色和白色值（即是否爲二值圖像）過程中bool變量的是是非非。

杭州的 IT 崩盤了麼？

開源高性能結構化日誌模塊NanoLog

Python 潮流週刊#55：分享 9 個高質量的技術類信息源！

Azure Virtual Network (22) 多訂閱使用Azure DNS解析問題 Windows Azure Platform 系列文章目錄

【簡寫Mybatis-02】註冊機的實現以及SqlSession處理

手繪二維碼

.NET藉助虛擬網卡實現一個簡單異地組網工具

[快速閱讀七] Halcon裏emphasize函數相關資料.

[快速閱讀六] 統計內存數據中二進制1的個數（SSE指令集優化版）.

【工程應用九】再談基於離散夾角餘弦相似度指標的形狀匹配優化（十六角度量化+指令集加速+目標只有部分在圖像內的識別+最小外接矩形識別重疊等）

【快速閱讀五】VS2019自帶的增強型指令集和自我優化的版本速度比較.

【快速閱讀四】基於邊緣信息的模版匹配中貪婪度參數的簡單解析。

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結