2 图像基础操作(侧重Numpy)-OpenCV

    技术2022-07-13  74

    作者:Irain QQ:2573396010 微信:18802080892 GitHub链接:https://github.com/Irain-LUO/OpenCV-Python

    目录

    1 目标2 图像基础操作(侧重Numpy)2.1 访问像素值并对其进行修改2.1.1 加载图片2.1.2 访问其中一个像素和绿色像素。2.1.3 修改像素2.1.4 更好的像素访问和编辑方法: 2.2 访问图像属性2.3 设置感兴趣区域(ROI)2.4 拆分和合并图像2.5 设置图像边框(填充)

    1 目标

    访问像素值并对其进行修改访问图像属性设置感兴趣区域(ROI)拆分和合并图像设置图像边框(填充)图像基础操作(侧重Numpy)官方链接Matplotlib使用手册链接

    本节中的几乎所有操作都主要与Numpy相关,而不是OpenCV。要使用OpenCV编写更好的优化代码,需要Numpy的丰富知识。 (示例将在Python终端中显示,因为其中大多数只是单行代码)

    2 图像基础操作(侧重Numpy)

    2.1 访问像素值并对其进行修改

    2.1.1 加载图片

    import numpy as np import cv2 as cv img = cv.imread('dog.jpg')

    可以通过像素值的行和列坐标来访问它。对于BGR图像,它将返回一个蓝色,绿色,红色值的数组。对于灰度图像,仅返回相应的强度。

    2.1.2 访问其中一个像素和绿色像素。

    px = img[0,0] px Green = img[0,0,1] Green

    2.1.3 修改像素

    img[0,0] = [0,0,0] img[0,0]

    警告

    Numpy是用于快速数组计算的优化库。 因此,简单地访问每个像素值并对其进行修改将非常缓慢,因此不建议使用。注意上面的方法通常用于选择数组的区域,例如前5行和后3列。对于单个像素访问,Numpy数组方法array.item()和array.itemset()被认为更好。但是,它们始终返回标量,因此,如果要访问所有B,G,R值,则需要为每个值分别调用array.item()。

    2.1.4 更好的像素访问和编辑方法:

    img.item(0,0,0) # 访问某个颜色像素(B、G、R) img.itemset((0,0,0),255) # 修改某个颜色像素(B、G、R) img.item(0,0,0)

    提醒

    不能访问一个完整像素。

    2.2 访问图像属性

    图像属性包括行数,列数和通道数;图像数据类型;像素数;等等。图像的形状可以通过img.shape访问。它返回行,列和通道数的元组(如果图像是彩色的):

    img.shape # 访问图像形状

    注意

    如果图像是灰度的,则返回的元组仅包含行数和列数,因此这是检查加载的图像是灰度还是彩色的好方法。 总像素数由img.size访问: img.size # 访问总像素数

    图片数据类型是通过img.dtype获取的:

    img.dtype # 访问图片数据类型

    注意

    img.dtype在调试时非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。

    2.3 设置感兴趣区域(ROI)

    有时,您将不得不使用图像的某些区域。对于图像中的眼睛检测,首先要在整个图像上进行面部检测。当获得一张脸时,我们仅选择脸部区域并在其中搜索眼睛,而不是搜索整个图像。它提高了准确性(因为眼睛总是在脸上)和性能(因为我们在较小的区域搜索)。使用Numpy索引再次获得ROI。 在这里,我要选择狗的鼻子并将其复制到狗的头额上:

    nouse = img[295:365,375:445] img[100:170,275:345] = nouse cv.imshow('dog',img) cv.waitKey(100)

    2.4 拆分和合并图像

    有时您需要在图像的B,G,R通道上单独工作。在这种情况下,您需要将BGR图像拆分为单个通道。在其他情况下,您可能需要加入这些单独的渠道来创建BGR图像。您可以通过以下方式简单地执行此操作:

    split方法使用手册链接merge方法使用手册链接 b,g,r = cv.split(img) # 拆分图像 image = cv.merge((b,g,r)) # 合并图像 blue = img[:,:,0] # 获得所有蓝色像素

    假设要将所有红色像素都设置为零-不需要先拆分通道。 numpy索引速度更快:

    img[0,0,2] = 0 img[1,0:10,2]

    警告

    cv.split()是一项昂贵的操作(就时间而言)。因此,仅在必要时使用它。否则请进行Numpy索引。

    2.5 设置图像边框(填充)

    如果要在图像周围创建边框(如相框),则可以使用cv.copyMakeBorder()。但是它在卷积运算,零填充等方面有更多应用。此函数采用以下参数:

    src-输入图像。top, bottom, left, right-边框宽度(在相应方向上以像素数表示)。borderType-定义要边框类型的标志添加。它可以是以下类型: cv.BORDER_CONSTANT-添加恒定的彩色边框。该值应作为下一个参数给出。cv.BORDER_REFLECT-边框将是边框元素的镜像,例如:fedcba | abcdefgh | hgfedcb 。cv.BORDER_REFLECT_101或cv.BORDER_DEFAULT-与上面相同,但略有不同,例如:gfedcb | abcdefgh | gfedcba 。cv.BORDER_REPLICATE-最后一个元素被复制,像这样:aaaaaa | abcdefgh | hhhhhhh 。cv.BORDER_WRAP-无法解释,看起来像这样:cdefgh | abcdefgh | abcdefg。 value-如果边框类型为cv.BORDER_CONSTANT时,边框的颜色是value。copyMakeBorder方法使用手册链接 演示所有这些边框类型的示例代码,以便更好地理解(考虑jupyte notebook环境使用): import cv2 as cv import numpy as np from matplotlib import pyplot as plt BLUE = [255,0,0] img1 = cv.imread('opencv-logo.jpg') replicate = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REPLICATE) reflect = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT) reflect101 = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT_101) wrap = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_WRAP) constant= cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_CONSTANT,value=BLUE) plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值 plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL') plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值 plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE') plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值 plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT') plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值 plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101') plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值 plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP') plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值 plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT') plt.xticks([]), plt.yticks([]) # 在 X 轴和 Y 轴上隐藏刻度值 plt.show()

    请参阅下面的结果。 (图像与matplotlib一起显示。因此红色和蓝色通道将互换):

    发表:2020年7月2日

    Processed: 0.016, SQL: 9