Python 圖像處理 OpenCV (3):圖像屬性、圖像感興趣 ROI 區域及通道處理

前文傳送門:

「Python 圖像處理 OpenCV (1):入門」

「Python 圖像處理 OpenCV (2):像素處理與 Numpy 操作以及 Matplotlib 顯示圖像」

圖像屬性

圖像屬性包括行數,列數和通道數,圖像數據類型,像素數等。

1. 形狀:shape

圖像的形狀可以通過 shape 關鍵字進行獲取,使用 shape 關鍵的後,獲取的信息包括行數、列數、通道數的元祖。

需要注意的是,如果是灰度圖片,只會返回圖像的行數和列數,而彩色圖片纔會圖像的行數、列數和通道數。

示例如下:

import cv2 as cv

# 讀取彩色圖片
color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)

print(color_img.shape)

# 結果打印
(310, 560, 3)

# 讀取灰度圖片
gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)

print(gray_img.shape)

# 結果打印
(310, 560)

2. 像素數量:size

圖像的像素數量可以通過關鍵字 size 進行獲取。

同樣需要注意的是,灰度圖片的像素數量是要小於彩色圖片的,具體的關係是 1/3 。

import cv2 as cv

# 讀取彩色圖片
color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)

print(color_img.size)

# 結果打印
520800

# 讀取灰度圖片
gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)

print(gray_img.size)

# 結果打印
173600

3. 圖像類型-dtype

圖像類型是通過關鍵字 dtype 獲取的,通常返回 uint8 ,這個屬性在彩色圖片和灰度圖片中是保持一致的。

注意 dtype 在調試時非常重要,因爲 OpenCV-Python 代碼中的大量錯誤是由無效的數據類型引起的。

import cv2 as cv

# 讀取彩色圖片
color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)

print(color_img.dtype)

# 結果打印
uint8

# 讀取灰度圖片
gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)

print(gray_img.dtype)

# 結果打印
uint8

獲取圖像感興趣 ROI 區域

ROI(Region of Interest)表示感興趣區域。

它是指從被處理圖像以方框、圓形、橢圓、不規則多邊形等方式勾勒出需要處理的區域。可以通過各種算子(Operator)和函數求得感興趣ROI區域,並進行圖像的下一步處理,被廣泛應用於熱點地圖、人臉識別、圖像分割等領域。

如果我們要對於圖像中的眼睛檢測,首先對整個圖像進行人臉檢測。在獲取人臉圖像時,我們只選擇人臉區域,搜索其中的眼睛,而不是搜索整個圖像。它提高了準確性(因爲眼睛總是在面部上:D )和性能(因爲我們搜索的區域很小)。

我們通過像素矩陣可以直接得到 ROI 區域,如: img[200:400, 200:400]

比如下面這個示例我們獲取馬里奧的臉,然後再把它顯示出來:

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

face = img[10:175, 100:260]

# 原始圖像顯示
cv.imshow("demo", img)

# 馬里奧的臉顯示
cv.imshow("face", face)

#等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

它的結果如下:

如果我們要把這兩張圖像合成一張圖像,可以對圖像進行區域賦值:

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

# 獲取 ROI 區域
face = img[10:175, 100:260]
# 圖像賦值
img[0:165, 0:160] = face

# 原始圖像顯示
cv.imshow("demo", img)

#等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下:

這裏我稍微偷點懶,直接就把 ROI 區域放在了圖片的左上角,這個位置可以隨意指定,但是指定的區域要和 ROI 的區域一樣大,否則會報一個 ValueError 的錯誤。

拆分和合並圖像通道

1. 拆分圖像通道

有些時候,我們需要分別處理圖像的 B,G,R 通道。的通道,用 PS 摳過圖的人應該都清楚摳圖的時候可以使用單通道進行摳圖操作。

將圖像的通道拆分出來可以使用 split() 函數,如下:

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

#拆分通道
b, g, r = cv.split(img)

# 分別顯示三個通道的圖像
cv.imshow("B", b)
cv.imshow("G", g)
cv.imshow("R", r)

# 等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下:

可以看到,三個通道的圖像看起來都是灰白色的,這個玩過 PS 的人應該都很熟悉。

除了使用 split() 函數獲取圖像通道,還可以通過索引進行獲取,代碼如下:

b = img[:, :, 0]
g = img[:, :, 1]
r = img[:, :, 2]

如果需要將所有紅色像素都設置爲零,無需先拆分通道,索引更快:

img[:, :, 2] = 0

注意: split() 函數是一項耗時的操作(就時間而言)。因此,僅在必要時才這樣做。否則請進行Numpy索引。

2. 合併圖像通道

合併圖像通道我們使用函數 merge() ,示例如下:

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

# 拆分通道
b, g, r = cv.split(img)

# 合併圖像通道
m = cv.merge([r, g, b])

cv.imshow('merge', m)

# 等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下:

這裏如果是按照 [r, g, b] 進行圖像通道合併,我們的馬里奧就會變身成爲藍精靈,因爲 OpenCV 是按照 BGR 讀取的,如果想要顯示會原圖,合併的時候也按照 [b, g, r] 合併即可,如下:

如果我們想要做一個真正的藍精靈,可以只提取 B 顏色通道,其餘兩個 G 、 R 通道全部設置爲 0 ,這樣,我們就獲得了一個真正的藍精靈(整個圖像只有藍色通道),代碼如下:

import cv2 as cv
import numpy as np

# 讀取圖片
img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)
rows, cols, chn = img.shape

# 拆分通道
b = img[:, :, 0]
g = np.zeros((rows,cols), dtype=img.dtype)
r = np.zeros((rows,cols), dtype=img.dtype)

# 合併圖像通道
m = cv.merge([b, g, r])

cv.imshow('merge', m)

# 等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下:

同理,如果想要綠精靈和紅精靈,一樣可以做出來。

示例代碼

如果有需要獲取源碼的同學可以在公衆號回覆「OpenCV」進行獲取。

參考

https://blog.csdn.net/eastmount/article/details/82177300

http://woshicver.com/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章