查看原文
其他

好玩的OpenCV:图片操作的基本知识(1)

2017-08-23 大邓 大邓带你玩python

图像基本知识

图像是由像素组成的,而像素实际上就是带有坐标位置和颜色信息的点。我们把图片想象成由若干行,若干列的点组成的, 现实中有RGB颜色系统,我们可以把图中任意一点(位置在第m行,第n列)的点A表示为 

A[m,n] = [blue,green,red]

图片数据解读

A[m,n] = [blue,green,red]
参数解读
mA点在图像中的第m行
nA点在图像中的第n列
blue表示蓝色,三原色(RGB)的第一个数值
green表示绿色,三原色(RGB)的第二个数值
red表示红色,三原色(RGB)的第一个数值

一、OpenCV-python基本操作

1.1读入图像文件


import cv2 img_path = 'test.jpg'
image = cv2.imread(filename=img_path)

#winname弹出窗口的名字,mat为传入的图片对象
cv2.imshow(winname='show the image',mat=image)

#窗口默认一直处于弹出窗状态
cv2.waitKey()

#按任意键盘,销毁窗口
cv2.destroyAllWindows()


1.2我们先检验下图片数据类型

在一开始我们说图片是由像素组成的,我们可以先检验下读入的图片数据是什么类型数据,长什么样?

其实读入的是数组,不信你看下面

>>>import cv2
>>>img_path = 'test.jpg'
>>>image = cv2.imread(filename=img_path)
>>>print(type(image))  
>>><class 'numpy.ndarray'>

image这个数据是三维的

>>>print(image.ndim)
>>>3

image的shape

800行,480列的点组成的图片,RGB三色,图片为彩色

>>>print(image.shape)
>>>(800,480,3)  

我们检查下第5行,第6列像素的值

>>>print(image[4,5])
>>>[161 185 221]
>>>print(type(image[4,5]))
>>><class 'numpy.ndarray'>

好像很复杂,但实际上就是ndarray数组,对此有疑惑的可以看看我公众号的numpy基本知识。

1.3获取图片尺寸

首先我们查看测试图片的详情  这个图片选自iphone7壁纸,最大数800肯定是高,宽是480。

那么问题来了,我们如何通过程序运行获得图片的尺寸?

>>>import cv2
>>>img_path = '/test.jpg'
>>>image = cv2.imread(filename=img_path)
>>>print(image.shape)
>>>(800, 480, 3)

程序返回(800, 480, 3),说明image.shape返回的元组中第一个参数是高,第二个是宽。请记住!

1.4图像亮度

blue,green,red分别代表蓝绿红,每个数值代表的原色的亮度大小。

blue,green,red值越大,图像越亮,当[255,255,255]时,图像为纯白色。越小,图像越黑暗,当[0,0,0]时,图像为纯黑。

搞明白这点,我们把原图分别调亮50%,调黑50%如图。即将green,blue,red数值乘以1.5或0.5 。

import cv2 img_path = 'test.jpg'
image = cv2.imread(filename=img_path)
cv2.imshow(winname='raw image',mat=image)

#获取图片像素数组的行数和列数
row_num = image.shape[0]
column_num = image.shape[1]

#对image数据进行复制
bright_image = image.copy()

#对像素blue/green/red值整体变为原来的1.5倍,图片变亮
for row in range(row_num):    for column in range(column_num):        bright_image[row, column, 0] = bright_image[row, column, 0]* 1.5        bright_image[row, column, 1] = bright_image[row, column, 1] * 1.5        bright_image[row, column, 2] = bright_image[row, column, 2] * 1.5

cv2.imshow(winname='show bright image',mat=bright_image)

black_image = image.copy()
#对像素blue/green/red值整体变为原来的0.5倍,图片变黑暗
for row in range(row_num):    for column in range(column_num):        black_image[row, column, 0] = black_image[row, column, 0]* 0.5        black_image[row, column, 1] = black_image[row, column, 1] * 0.5        black_image[row, column, 2] = black_image[row, column, 2] * 0.5

cv2.imshow(winname='show black image',mat=black_image)
cv2.waitKey()
cv2.destroyAllWindows()


中间为原图,左侧为调亮30%后的效果,右侧为调黑30%的效果。

1.5 制作日落效果图

观看了《机器学习实践指南》,里面有个将图片制作成日落效果的案例。只需要把blue、green值变为原来的70%即可实现日落效果。

import cv2 img_path = 'test.jpg'
image = cv2.imread(filename=img_path)

#显示原图
cv2.imshow(winname='raw image',mat=image)

row_num = image.shape[0]
column_num = image.shape[1]

#日落效果,将蓝色与绿色调整为原来的70%
for row in range(row_num):    for column in range(column_num):        image[row, column, 0] = image[row, column, 0]* 0.7        image[row, column, 1] = image[row, column, 1] * 0.7

#显示日落效果图
cv2.imshow(winname='show sunload image',mat=image)

cv2.waitKey()
cv2.destroyAllWindows()


左侧为原图,右侧为日落效果图。

1.6在图片上输出文本

使用cv2.putText即可在图片中添加文字。

cv2.putText(img,text,org,fontFace,fontScale,color)
参数解读
imgcv2读入的图片数据
txt要写入的文本
org文字在图片中的坐标。坐标原点位于图片左上角。如org=(100,400),从图片最左边起100,从最最上面往下400。
fontFace字体。如cv2.FONTHERSHEYTRIPLEX、cv2.FONTHERSHEYPLAIN
color颜色,三原数组,使用RGB模式编码。如白色为(255,255,255)
import cv2 img_path = 'test.jpg'
image = cv2.imread(filename=img_path)

cv2.imshow(winname='raw image',mat=image)

#文字在图中的坐标(注意:这里的坐标原点是图片左上角)
x, y = 100, 400
cv2.putText(img = image, text = 'Beautiful Scene!',            org = (x, y), fontFace = cv2.FONT_HERSHEY_TRIPLEX,            fontScale = 1, color = (255,255,255))

cv2.imshow(winname='add text  on image',mat=image)

cv2.waitKey()
cv2.destroyAllWindows()


左侧为原图,右侧为加文字的图片效果。Beautiful Scene

1.7缩放图片

使用下面方法缩放图片

resize(src, dsize, fx, fy)
参数解读
src读入的图片数据
dsize输出图片的尺寸。如果dsize为None(或0),程序会默认执行disze=(fx*src*cols,fy*src*rows)
fx图片水平方向的缩放比例(倍数)
fy图片垂直方向的缩放比例(倍数)
import cv2import os img_path = 'test.jpg'
image = cv2.imread(filename=img_path)

#显示原图
cv2.imshow(winname='raw image',mat=image)
#更改fx,fy即可改变图片比例。垂直方向fy大小不变,水平方向fx变为原来的0.5倍。
smaller_image = cv2.resize(src=image,dsize=None,fx=0.5,fy=1)

cv2.imshow(winname='smaller image',mat=smaller_image)
cv2.waitKey()
cv2.destroyAllWindows()

右侧为原图,左侧为缩小后的图片(水平变原图的0.5倍,垂直方向保持不变。)

图像的旋转

getRotationMatrix2D(center, angle, scale),这个函数需要三个参数,旋转中心,旋转角度,旋转后图像的缩放比例

import cv2 image_path = 'test.jpg'

image = cv2.imread(filename=image_path)
rows,cols = image.shape[:2]

#第一个参数旋转中心,第二个参数旋转角度,第三个参数:缩放比例
M = cv2.getRotationMatrix2D((cols/2,rows/2), 10, 0.4)
new_image = cv2.warpAffine(image,M,(rows,cols))

cv2.imshow('raw image',image)
cv2.imshow('new_image',new_image)

cv2.waitKey()
cv2.destroyAllWindows()

左侧为原图,右侧为以图片中心旋转10,尺寸为原图0.4倍,操作后的图片。




您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存