>>> from env_helper import info; info()
页面更新时间: 2024-04-07 16:01:24
运行环境:
    Linux发行版本: Debian GNU/Linux 12 (bookworm)
    操作系统内核: Linux-6.1.0-18-amd64-x86_64-with-glibc2.36
    Python版本: 3.11.2

1.3. 图像像素的访问与裁剪

图片读入程序中后,是以numpy数组存在的。 因此对numpy数组的一切功能,对图片也适用。对数组元素的访问,实际上就是对图片像素点的访问。

彩色图片访问方式为:

img[i,j,c]

i 表示图片的行数, j 表示图片的列数, c 表示图片的通道数(RGB三通道分别对应0,1,2)。 坐标是从左上角开始。

灰度图片访问方式为:

gray[i,j]

1.3.1. 例1:输出小猫图片的G通道中的第20行30列的像素值

>>> from skimage import io,data
>>> img=data.chelsea()
>>> pixel=img[20,30,1]
>>> pixel
129

1.3.2. 例2:显示红色单通道图片

>>> R=img[:,:,0]
>>> io.imshow(R)
<matplotlib.image.AxesImage at 0x7f25a21f1c10>
_images/sec03_clip_4_1.png

除了对像素进行读取,也可以修改像素值。

1.3.3. 例3:对小猫图片随机添加椒盐噪声

随机生成5000个椒盐

>>> import numpy as np
>>> rows,cols,dims=img.shape
>>> for i in range(5000):
>>>     x=np.random.randint(0,rows)
>>>     y=np.random.randint(0,cols)
>>>     img[x,y,:]=255
>>>
>>> io.imshow(img)
<matplotlib.image.AxesImage at 0x7f25a2281c10>
_images/sec03_clip_7_1.png

这里用到了numpy包里的random来生成随机数,randint(0,cols)表示随机生成一个整数,范围在0到cols之间。

用img[x,y,:]=255这句来对像素值进行修改,将原来的三通道像素值,变为255

通过对数组的裁剪,就可以实现对图片的裁剪。

1.3.4. 例4:对小猫图片进行裁剪

>>> roi=img[80:180,100:200,:]
>>> io.imshow(roi)
<matplotlib.image.AxesImage at 0x7f25a0893510>
_images/sec03_clip_9_1.png

对多个像素点进行操作,使用数组切片方式访问。切片方式返回的是以指定间隔下标访问 该数组的像素值。下面是有关灰度图像的一些例子:

img[i,:] = im[j,:] # 将第 j 行的数值赋值给第 i 行

img[:,i] = 100 # 将第 i 列的所有数值设为 100

img[:100,:50].sum() # 计算前 100 行、前 50 列所有数值的和

img[50:100,50:100] # 50~100 行,50~100 列(不包括第 100 行和第 100 列)

img[i].mean() # 第 i 行所有数值的平均值

img[:,-1] # 最后一列

img[-2,:] #(or im[-2]) # 倒数第二行

最后我们再看两个对像素值进行访问和改变的例子:

1.3.5. 例5:将lena图片进行二值化,像素值大于128的变为1,否则变为0

>>> from skimage import color
>>>
>>> img=data.coffee()
>>> img_gray=color.rgb2gray(img)
>>> rows,cols=img_gray.shape
>>> for i in range(rows):
>>>     for j in range(cols):
>>>         if (img_gray[i,j]<=0.5):
>>>             img_gray[i,j]=0
>>>         else:
>>>             img_gray[i,j]=1
>>> io.imshow(img_gray)
<matplotlib.image.AxesImage at 0x7f25a0923450>
_images/sec03_clip_13_1.png

这个例子,使用了color模块的 rgb2gray() 函数,将彩色三通道图片转换成灰度图。 转换结果为float64类型的数组,范围为 [0,1] 之间。

1.3.6. 例6:

>>> # from skimage import io,data
>>> img=data.chelsea()
>>> reddish = img[:, :, 0] > 170
>>> img[reddish] = [0, 255, 0]
>>> io.imshow(img)
<matplotlib.image.AxesImage at 0x7f25a09401d0>
_images/sec03_clip_15_1.png
这个例子先对R通道的所有像素值进行判断,如果大于 170 ,则将这个地方的像素值变为 [0,255,0] ,
即G通道值为 255 ,R和B通道值为 0