3.3. 图像的几何变换¶
3.3.1. 目标¶
学习将不同的几何变换应用于图像,如平移、旋转、仿射变换等。
您将看到这些功能: cv2.getPerspectiveTransform
3.3.2. 变换¶
OpenCV提供了两个转换函数, cv2.warpAffine 和 cv2.warpPerspective ,可以进行各种转换。 cv2.warpAffine 获取2x3转换矩阵,而 cv2.warpPerspective 以3x3变换矩阵作为输入。
缩放比例¶
缩放只是调整图像的大小。OpenCV带有一个函数 调整大小() 为此目的。可以手动指定图像的大小,也可以指定缩放因子。使用不同的插值方法。较好的插值方法是 cv2.INTER_AREA 为了收缩和 cv2.INTER_CUBIC (慢)& cv2.INTER_LINEAR 用于缩放。默认情况下,使用的插值方法是 cv2.INTER_LINEAR 用于所有调整大小的目的。可以使用以下方法之一调整输入图像的大小:
>>> import cv2
>>> import numpy as np
>>>
>>> img = cv2.imread('/cvdata/messi5.jpg')
>>>
>>> res = cv2.resize(img,None,fx=2, fy=2, interpolation = cv2.INTER_CUBIC)
>>>
>>> #OR
>>>
>>> height, width = img.shape[:2]
>>> res = cv2.resize(img,(2*width, 2*height), interpolation = cv2.INTER_CUBIC)
翻译¶
翻译是物体位置的转移。如果你知道(x,y)方向的变化,就让它 \((t_x,t_y)\) ,可以创建转换矩阵 \(\textbf{{M}}\) 如下:
你可以把它变成 np.float32
把它传给 变形() 功能。关于(100,50)的移位,请参见下面的示例:
>>> import cv2
>>> import numpy as np
>>>
>>> img = cv2.imread('/cvdata/messi5.jpg',0)
>>> rows,cols = img.shape
>>>
>>> M = np.float32([[1,0,100],[0,1,50]])
>>> dst = cv2.warpAffine(img,M,(cols,rows))
>>>
>>> # cv2.imshow('img',dst)
>>> # cv2.waitKey(0)
>>> # cv2.destroyAllWindows()
>>> %matplotlib inline
>>> import matplotlib.pyplot as plt
>>> plt.imshow(dst)
<matplotlib.image.AxesImage at 0x7ff412133828>
警告
cv2.warpAffine()
函数第三个参数是输出图像的大小,它应该是 (宽度,高度) . 记住width=列数,height=行数。
结果如下:
旋转¶
图像旋转一个角度 \(\theta\) 由形式的转换矩阵实现
但是OpenCV提供了旋转中心可调的缩放旋转,因此您可以在任何您喜欢的位置旋转。修正的变换矩阵由
在哪里?
为了找到这个转换矩阵,OpenCV提供了一个函数, cv2.getRotationMatrix2D . 选中下面的示例,该示例将图像相对于中心旋转90度而不进行任何缩放。
>>> # img = cv2.imread('messi5.jpg',0)
>>> rows,cols = img.shape
>>>
>>> M = cv2.getRotationMatrix2D((cols/2,rows/2),90,1)
>>> dst = cv2.warpAffine(img,M,(cols,rows))
>>>
>>> plt.imshow(dst)
<matplotlib.image.AxesImage at 0x7ff4108574e0>
查看结果:
仿射变换¶
在仿射变换中,原始图像中的所有平行线在输出图像中仍然是平行的。为了找到变换矩阵,我们需要从输入图像中提取三个点,并在输出图像中找到它们的对应位置。那么 cv2.getAffineTransform 将创建一个2x3矩阵,传递给 cv2.warpAffine .
检查下面的示例,并查看我选择的点(这些点用绿色标记):
>>> # img = cv2.imread('/cvdata/drawing.png')
>>> import cv2
>>>
>>> img = cv2.imread('/cvdata/cards.png')
>>>
>>> rows,cols,ch = img.shape
>>>
>>> pts1 = np.float32([[50,50],[200,50],[50,200]])
>>> pts2 = np.float32([[10,100],[200,50],[100,250]])
>>>
>>> M = cv2.getAffineTransform(pts1,pts2)
>>>
>>> dst = cv2.warpAffine(img,M,(cols,rows))
>>>
>>> plt.subplot(121),plt.imshow(img),plt.title('Input')
>>> plt.subplot(122),plt.imshow(dst),plt.title('Output')
>>> plt.show()
查看结果:
透视变换¶
对于透视变换,需要3x3变换矩阵。即使经过改造,直线仍将保持笔直。要找到这个变换矩阵,需要输入图像上的4个点和输出图像上的相应点。在这四点中,有三点不应共线。然后通过函数求出变换矩阵 cv2.getPerspectiveTransform . 然后申请 cv2.warpPerspective 用这个3x3变换矩阵。
请参见下面的代码:
>>> img = cv2.imread('/cvdata/sudoku.png')
>>> rows,cols,ch = img.shape
>>>
>>> pts1 = np.float32([[56,65],[368,52],[28,387],[389,390]])
>>> pts2 = np.float32([[0,0],[300,0],[0,300],[300,300]])
>>>
>>> M = cv2.getPerspectiveTransform(pts1,pts2)
>>>
>>> dst = cv2.warpPerspective(img,M,(300,300))
>>>
>>> plt.subplot(121),plt.imshow(img),plt.title('Input')
>>> plt.subplot(122),plt.imshow(dst),plt.title('Output')
>>> plt.show()
结果:
3.3.3. 额外资源¶
“计算机视觉:算法和应用”,Richard Szeliski