原文链接:Geometric Transformations of Images
图像的几何变换
目标
- 在本教程中,你将学习几种简单变换。如:移动、旋转、仿射变换。
- 你将学习这些函数:cv2.getPerspectiveTransform等。
变换
openCv 提供了两种变换函数,cv2.warpAffine 和 cv2.warpPerspective。通过这两个函数,你可以实现所有的图像变换。cv2.warpAffine接受的参数是2x3的变换矩阵。cv2.warpPerspective 接受的参数是3x3的变换矩阵。
扩展缩放
扩展缩放只是改变图像的尺寸大小。OpenCV 提供的函数 cv2.resize() 可以实现这个功能。图像的尺寸可以自己手动设置,你也可以指定缩放因子。我们可以选择使用不同的插值方法。在缩放时我们推荐使用 cv2.INTER_AREA 。在扩展时我们推荐使用 v2.INTER_CUBIC(慢) 和 v2.INTER_LINEAR。默认情况下所有改变图像尺寸大小的操作使用的插值方法都是 cv2.INTER_LINEAR。 你可以使用下面任意一种方法改变图像的尺寸:
import cv2
import numpy as np
img = cv2.imread('./image/messi5.jpg')
res = cv2.resize(img,None,fx=2, fy=2, interpolation = cv2.INTER_CUBIC)
#或者
height, width = img.shape[:2]
res = cv2.resize(img,(2*width, 2*height), interpolation = cv2.INTER_CUBIC)
while(1):
cv2.imshow('res',res)
cv2.imshow('img',img)
if cv2.waitKey(1) & 0xFF == 27:
break
cv2.destroyAllWindows()
平移
平移是转换一个对象的位置。如果你沿(x ,y) 方向移动,移动的距离是你可以用下面的方式构建移动矩阵:M = $ \begin{bmatrix} 1 & 0 & t_x \ 0 & 1 & t_y \ \end{bmatrix} $你可以使用 Numpy 数组构建一个矩阵数据类型是 np.float32 ,然后把它传给函数 cv2.warpAffine()。看下面的这个例子,它移动了(100,50)个像素。
import cv2
import numpy as np
img = cv2.imread('image/messi5.jpg',0)
rows,cols = img.shape
M = np.float32([[1,0,100],[0,1,50]])
dst = cv2.warpAffine(img,M,(cols,rows))
cv2.imshow('img',dst)
cv2.waitKey(0)
cv2.destroyAllWindows()
警告
函数 cv2.warpAffine() 的第三个参数的是输出图像的大小,它的格式应该是图像的宽和高。应记住的是图像的宽对应的是列数,高对应的是行数。
看结果展示:
旋转
对一个图像旋角度 θ,需要使用到下面形式的旋转矩阵:M = $ \begin{bmatrix} cos𝛳 & -sin𝛳 \ sin𝛳 & cos𝛳 \ \end{bmatrix} $ 但是OpenCV提供了可调旋转中心的缩放旋转,这样你可以在任何你喜欢的位置旋转。修正后的变换矩阵为:$ \begin{bmatrix} å & ß & (1-å)·center.x - ß·center.y \ -ß & å & ß·center.x + (1-å)center.y \ \end{bmatrix} $其中,å = scale·cos𝛳,ß = scale·sin𝛳
为了构建这个旋转矩阵 OpenCV 提供了一个函数 cv2.getRotationMatrix2D。 下面的例子是在不缩放的情况下将图像旋 90 度。
img = cv2.imread('messi5.jpg',0)
rows,cols = img.shape
M = cv2.getRotationMatrix2D((cols/2,rows/2),90,1)
dst = cv2.warpAffine(img,M,(cols,rows))
看这个结果:
仿射变换
在仿射变换中,原图中所有的平行线在结果图像中同样平行。为了创建这个个矩阵我们从原图像中找到三个点以及他们在输出图像中的位置。然后 cv2.getAffineTransform 会创建一个 2X3 的矩阵。最后这个矩阵会传给函数 cv2.warpAffine。
来看看下面的例子,以及我选择的点(被标记为绿色的点 )
img = cv2.imread('drawing.png')
rows,cols,ch = img.shape
pts1 = np.float32([[50,50],[200,50],[50,200]])
pts2 = np.float32([[10,100],[200,50],[100,250]])
M = cv2.getAffineTransform(pts1,pts2)
dst = cv2.warpAffine(img,M,(cols,rows))
plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()
看下面结果,
透视变换
对于透视变换,我们需要一个 3X3 变换矩阵。在变换前后直线还是直线。要构建这个变换矩,你需要在在输入图像上找 4 个点,以及他们在输出图像上对应的位置。 四个点中的任意三个不能共线。这个变换矩阵可以由函数 cv2.getPerspectiveTransform() 构建。然后把这个矩阵传给函数 cv2.warpPerspective。
代码如下:
img = cv2.imread('sudokusmall.png')
rows,cols,ch = img.shape
pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]])
pts2 = np.float32([[0,0],[300,0],[0,300],[300,300]])
M = cv2.getPerspectiveTransform(pts1,pts2)
dst = cv2.warpPerspective(img,M,(300,300))
plt.subplot(121),plt.imshow(img),plt.title('Input')
plt.subplot(122),plt.imshow(dst),plt.title('Output')
plt.show()
结果: