OpenCV大津二值化算法OTSU簡單理解

otsu 大津算法介紹

OTSU算法是由日本學者OTSU於1979年提出的一種對圖像進行二值化的高效算法。
利用閾值將原圖像分成前景,背景兩個圖象。
前景:用n1,csum,m1來表示在當前閾值下的前景的點數,質量矩,平均灰度
背景:用n2, sum-csum,m2來表示在當前閾值下的背景的點數,質量矩,平均灰度
當取最佳閾值時,背景應該與前景差別最大,關鍵在於如何選擇衡量差別的標準,而在otsu算法中這個衡量差別的標準就是最大類間方差,在本程序中類間方差用sb表示,最大類間方差用fmax

這段引用自百度百科,不是很好懂。

otsu 大津算法原理

otsu 大津算法是一種圖像二值化算法,作用是確定將圖像分成黑白兩個部分的閾值。
將圖像背景和前景分成黑白兩類很好理解,但是如何確定背景和前景的二值化界限(閾值)呢?
對於不同的圖像,這個閾值可能不同,這就需要有一種算法來根據圖像的信息自適應地確定這個閾值。

首先,需要將圖像轉換成灰度圖像,255個灰度等級。
可以將圖像理解成255個圖層,每一層分佈了不同的像素,這些像素垂直疊加合成了一張完整的灰度圖。

我們的目的就是找到一個合適的灰度值,大於這個值的我們將它稱之爲背景(灰度值越大像素越黑),小於這個值的我們將它稱之爲前景(灰度值越小像素越白)。

怎麼確定這個值就是我們想要的值呢?
這裏引入方差的概念,方差越大,相關性越低,黑白越分明。
我們將每一個灰度值之上下之間的像素的方差求出來不就行了嗎?找到方差最大的那個灰度值,那個就是我們想要的二值化分隔閾值。

先定義幾個符號代表的意義:
h:圖像的寬度
w:圖像的高度(h*w 得到圖像的像素數量)

t :灰度閾值(我們要求的值,大於這個值的像素我們將它的灰度設置爲255,小於的設置爲0)

n0:小於閾值的像素,前景
n1:大於等於閾值的像素,背景
n0 + n1 == h * w

w0:前景像素數量佔總像素數量的比例
w0 = n0 / (h * w)

w1:背景像素數量佔總像素數量的比例
w1 = n1 / (h * w)
w0 + w1 == 1

u0:前景平均灰度
u0 = n0灰度累加和 / n0
u1:背景平均灰度
u1 = n1灰度累加和 / n1

u:平均灰度
u = (n0灰度累加和 + n1灰度累加和) / (h * w) 根據上面的關係
u = w0 * u0 + w1 * u1

g:類間方差(那個灰度的g最大,哪個灰度就是需要的閾值t)
g = w0 * (u0 - u)^2 + w1 * (u1 - u)^2
根據上面的關係,可以推出:(這個一步一步推導就可以得到)
g = w0 * w1 * (u0 - u1) ^ 2

然後,遍歷每一個灰度值,找到這個灰度值對應的 g
找到最大的 g 對應的 t

代碼實現:

import cv2
import numpy as np

# 這裏直接將數據轉換成float32了,方便後續計算
img = cv2.imread(r'001.jpg').astype(np.float32)

# 灰度化
def bgr2gray(img):
    b = img[:, :, 0].copy()
    g = img[:, :, 1].copy()
    r = img[:, :, 2].copy()

    gray_img = 0.2126 * r + 0.7152 * g + 0.0722 * b
    gray_img = gray_img.astype(np.uint8)

    return gray_img

# 大津二值化算法
def otsu(gray_img):
    h = gray_img.shape[0]
    w = gray_img.shape[1]
    threshold_t = 0
    max_g = 0
    
    # 遍歷每一個灰度層
    for t in range(255):
    	# 使用numpy直接對數組進行運算
        n0 = gray_img[np.where(gray_img < t)]
        n1 = gray_img[np.where(gray_img >= t)]
        w0 = len(n0) / (h * w)
        w1 = len(n1) / (h * w)
        u0 = np.mean(n0) if len(n0) > 0 else 0.
        u1 = np.mean(n1) if len(n0) > 0 else 0.
        
        g = w0 * w1 * (u0 - u1) ** 2
        if g > max_g:
            max_g = g
            threshold_t = t
    print('類間方差最大閾值:', threshold_t)
    gray_img[gray_img < threshold_t] = 0
    gray_img[gray_img >= threshold_t] = 255
    return gray_img

gray_img = rgb2gray(img)
otsu_img = otsu(gray_img)
cv2.imshow('otsu_img ', otsu_img )

cv2.waitKey(0)
cv2.destroyAllWindows()
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章