Python 圖像處理 OpenCV （3）：圖像屬性、圖像感興趣 ROI 區域及通道處理

前文傳送門：

「Python 圖像處理 OpenCV （1）：入門」

「Python 圖像處理 OpenCV （2）：像素處理與 Numpy 操作以及 Matplotlib 顯示圖像」

圖像屬性

圖像屬性包括行數，列數和通道數，圖像數據類型，像素數等。

1. 形狀：shape

圖像的形狀可以通過 shape 關鍵字進行獲取，使用 shape 關鍵的後，獲取的信息包括行數、列數、通道數的元祖。

需要注意的是，如果是灰度圖片，只會返回圖像的行數和列數，而彩色圖片纔會圖像的行數、列數和通道數。

示例如下：

import cv2 as cv

# 讀取彩色圖片
color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)

print(color_img.shape)

# 結果打印
(310, 560, 3)

# 讀取灰度圖片
gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)

print(gray_img.shape)

# 結果打印
(310, 560)

2. 像素數量：size

圖像的像素數量可以通過關鍵字 size 進行獲取。

同樣需要注意的是，灰度圖片的像素數量是要小於彩色圖片的，具體的關係是 1/3 。

import cv2 as cv

# 讀取彩色圖片
color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)

print(color_img.size)

# 結果打印
520800

# 讀取灰度圖片
gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)

print(gray_img.size)

# 結果打印
173600

3. 圖像類型-dtype

圖像類型是通過關鍵字 dtype 獲取的，通常返回 uint8 ，這個屬性在彩色圖片和灰度圖片中是保持一致的。

注意 dtype 在調試時非常重要，因爲 OpenCV-Python 代碼中的大量錯誤是由無效的數據類型引起的。

import cv2 as cv

# 讀取彩色圖片
color_img = cv.imread("maliao.jpg", cv.IMREAD_ANYCOLOR)

print(color_img.dtype)

# 結果打印
uint8

# 讀取灰度圖片
gray_img = cv.imread("maliao.jpg", cv.IMREAD_GRAYSCALE)

print(gray_img.dtype)

# 結果打印
uint8

獲取圖像感興趣 ROI 區域

ROI（Region of Interest）表示感興趣區域。

它是指從被處理圖像以方框、圓形、橢圓、不規則多邊形等方式勾勒出需要處理的區域。可以通過各種算子（Operator）和函數求得感興趣ROI區域，並進行圖像的下一步處理，被廣泛應用於熱點地圖、人臉識別、圖像分割等領域。

如果我們要對於圖像中的眼睛檢測，首先對整個圖像進行人臉檢測。在獲取人臉圖像時，我們只選擇人臉區域，搜索其中的眼睛，而不是搜索整個圖像。它提高了準確性(因爲眼睛總是在面部上:D )和性能(因爲我們搜索的區域很小)。

我們通過像素矩陣可以直接得到 ROI 區域，如： img[200:400, 200:400] 。

比如下面這個示例我們獲取馬里奧的臉，然後再把它顯示出來：

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

face = img[10:175, 100:260]

# 原始圖像顯示
cv.imshow("demo", img)

# 馬里奧的臉顯示
cv.imshow("face", face)

#等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

它的結果如下：

如果我們要把這兩張圖像合成一張圖像，可以對圖像進行區域賦值：

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

# 獲取 ROI 區域
face = img[10:175, 100:260]
# 圖像賦值
img[0:165, 0:160] = face

# 原始圖像顯示
cv.imshow("demo", img)

#等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下：

這裏我稍微偷點懶，直接就把 ROI 區域放在了圖片的左上角，這個位置可以隨意指定，但是指定的區域要和 ROI 的區域一樣大，否則會報一個 ValueError 的錯誤。

拆分和合並圖像通道

1. 拆分圖像通道

有些時候，我們需要分別處理圖像的 B，G，R 通道。的通道，用 PS 摳過圖的人應該都清楚摳圖的時候可以使用單通道進行摳圖操作。

將圖像的通道拆分出來可以使用 split() 函數，如下：

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

#拆分通道
b, g, r = cv.split(img)

# 分別顯示三個通道的圖像
cv.imshow("B", b)
cv.imshow("G", g)
cv.imshow("R", r)

# 等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下：

可以看到，三個通道的圖像看起來都是灰白色的，這個玩過 PS 的人應該都很熟悉。

除了使用 split() 函數獲取圖像通道，還可以通過索引進行獲取，代碼如下：

b = img[:, :, 0]
g = img[:, :, 1]
r = img[:, :, 2]

如果需要將所有紅色像素都設置爲零，無需先拆分通道，索引更快：

img[:, :, 2] = 0

注意： split() 函數是一項耗時的操作（就時間而言）。因此，僅在必要時才這樣做。否則請進行Numpy索引。

2. 合併圖像通道

合併圖像通道我們使用函數 merge() ，示例如下：

import cv2 as cv

img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)

# 拆分通道
b, g, r = cv.split(img)

# 合併圖像通道
m = cv.merge([r, g, b])

cv.imshow('merge', m)

# 等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下：

這裏如果是按照 [r, g, b] 進行圖像通道合併，我們的馬里奧就會變身成爲藍精靈，因爲 OpenCV 是按照 BGR 讀取的，如果想要顯示會原圖，合併的時候也按照 [b, g, r] 合併即可，如下：

如果我們想要做一個真正的藍精靈，可以只提取 B 顏色通道，其餘兩個 G 、 R 通道全部設置爲 0 ，這樣，我們就獲得了一個真正的藍精靈（整個圖像只有藍色通道），代碼如下：

import cv2 as cv
import numpy as np

# 讀取圖片
img = cv.imread("maliao.jpg", cv.IMREAD_UNCHANGED)
rows, cols, chn = img.shape

# 拆分通道
b = img[:, :, 0]
g = np.zeros((rows,cols), dtype=img.dtype)
r = np.zeros((rows,cols), dtype=img.dtype)

# 合併圖像通道
m = cv.merge([b, g, r])

cv.imshow('merge', m)

# 等待顯示
cv.waitKey(0)
cv.destroyAllWindows()

結果如下：

同理，如果想要綠精靈和紅精靈，一樣可以做出來。

示例代碼

如果有需要獲取源碼的同學可以在公衆號回覆「OpenCV」進行獲取。

參考

https://blog.csdn.net/eastmount/article/details/82177300

http://woshicver.com/

Python 圖像處理 OpenCV （3）：圖像屬性、圖像感興趣 ROI 區域及通道處理

圖像屬性

1. 形狀：shape

2. 像素數量：size

3. 圖像類型-dtype

獲取圖像感興趣 ROI 區域

拆分和合並圖像通道

1. 拆分圖像通道

2. 合併圖像通道

示例代碼

參考

「補課」進行時：設計模式(17)——備忘錄模式

「補課」進行時：設計模式(16)——簡單又實用的門面模式

「補課」進行時：設計模式(15)——觀察者模式

「補課」進行時：設計模式(14)——組合模式

「補課」進行時：設計模式(13)——迭代器模式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結