K-Means算法、非负矩阵分解(NMF)与图像压缩

大数据技术派 2022-10-15

K-Means算法是最基础的聚类算法、也是最常用的机器学习算法之一。本教程中，我们利用K-Means对图像中的像素点进行聚类，然后用每个像素所在的簇的中心点来代替每个像素的真实值，从而达到图像压缩的目的。

非负矩阵分解(Non-negativeMatrix Factorization, NMF)是一种对非负矩阵进行低维近似逼近的常见方法，同样也能达到图像压缩的目的。

预计学习用时：30分钟。

本教程基于Python 3.5。

原创者：SofaSofa TeamM | 修改校对：SofaSofa TeamC |

0. 前言

K Means算法比NMF算法慢很多，尤其是当聚类数较大时，所以实验时请耐心等待。此外，由于两者重建图像的原理不同，所以两者的视觉也相差很大，k Means牺牲了颜色的个数而保留了边界和形状，而NMF牺牲了形状以及边界却尽量保留颜色。整个实验过程中会产生一些有趣风格的图像，注意留意哦！

完整的代码在第4节。

1. 图像的读取

本教程以台湾省台北市最高建筑“台北101”大厦的夜景图为例，该图的分辨率为600 * 800。

下载实验图片: http://sofasofa.io/tutorials/image_compression/taibei101.jpg

我们需要skimage、numpy、matplotlib.pyplot这三个库来实现图像的读取以及显示。

import numpy as np
import matplotlib.pyplot as plt
from skimage import io

利用io.imread直接读取图像文件，并存入np.ndarray类型的变量d。注意：为了图像在plt中无色差地显示，请一定要将d中的元素转成0到1的浮点数。

d = io.imread('taibei101.jpg')
d = np.array(d, dtype=np.float64) / 255

d是三维array，第一个维度代表行数，第二个维度代表列数，第三个维度代表该图像是RGB图像，每个像素点由三个数值组成。

d.shape

(600,800,3)

调用plt.imshow函数便可以显示图像。

plt.axis('off')
plt.imshow(d); plt.show()

2. K Means 压缩图像

在我们的例子当中，每个像素点都是一个数据；每个数据拥有三个特征，分别代表R(红色)，G(绿色)，B(蓝色)。 K Means是一种常见的聚类方法，其思想就是让“距离”近的数据点分在一类。这里的“距离”就是指两个像素点RBG差值的平方和的根号。

Dist(P1,P2)=||P1−P2||

K Means压缩图像的原理是，用每个聚类(cluster)的中心点(center)来代替聚类中所有像素原本的颜色，所以压缩后的图像只保留了KK个颜色。

假如这个600×800600×800的图像中每个像素点的颜色都不一样，那么我们需要

800×600×3=1440000800×600×3=1440000

个数来表示这个图像。对于K Means压缩之后的图像，我们只需要

800×600×1+K×3800×600×1+K×3

个数来表示。800×600×1800×600×1是因为每个像素点需要用一个数来表示其归属的簇，K×3K×3是因为我们需要记录KK个中心点的RGB数值。所以经过K Means压缩后，我们只需要三分之一左右的数就可以表示图像。

下面的函数KMeansImage(d, n_colors)就可以用来生成n_colors个颜色构成的图像。

from sklearn.cluster import KMeansdef KMeansImage(d, n_colors):
    w, h, c = d.shape
    dd = np.reshape(d, (w * h, c))
    km = KMeans(n_clusters=n_colors)
    km.fit(dd)
    labels = km.predict(dd)
    centers = km.cluster_centers_
    new_img = d.copy()
    for i in range(w):
        for j in range(h):
            ij = i * h + j
            new_img[i][j] = centers[labels[ij]]
    return {'new_image': new_img, 'center_colors': centers}

运行以上函数，我们可以看看在不同的KK的取值之下，图像压缩的效果。

plt.figure(figsize=(12, 9))
plt.imshow(d); plt.axis('off')
plt.show()for i in [2, 3, 5, 10, 30]:
    print('Number of clusters:', i)
    out = KMeansImage(d, i)
    centers, new_image = out['center_colors'], out['new_image']
    plt.figure(figsize=(12, 1))
    plt.imshow([centers]); plt.axis('off')
    plt.show()
    plt.figure(figsize=(12, 9))
    plt.imshow(new_image); plt.axis('off')
    plt.show()

Number of clusters: 2

Number of clusters: 3

Number of clusters: 5

Number of clusters: 10

Number of clusters: 30

3. NMF压缩图像

非负矩阵分解(NMF)是一个常用的对矩阵进行填充、平滑的算法。一个著名的案例就是Netflix利用NMF来填充“用户-电影”矩阵。这里，我们将对三个颜色逐一进行矩阵分解。

dRed = PRedQRedd

这里dReddRed是600×800600×800的矩阵，PRedPRed是600×K600×K的非负矩阵，QRedQRed是K×800K×800的非负矩阵，其中KK的矩阵分解中成分的个数。通常成分个数越多，拟合效果越好。

假如这个600×800600×800的图像中每个像素点的颜色都不一样，那么我们需要

800×600×3=1440000800×600×3=1440000

个数来表示这个图像。对于NMF压缩之后的图像，我们只需要

600×K×3+K×800×3600×K×3+K×800×3

个数来表示。在KK较小时，比如100以内，NMF的压缩效率明显优于K Means。

下面，我们就来看看NMF压缩后的图像的视觉效果。

下面的函数NMFImage(d, num_components)就可以用来生成根据NMF压缩得到的图像。

from sklearn.decomposition import NMF
def NMFImage(d, num_components):
    w, h, c = d.shape
    new_img = d.copy()
    for i in range(c):
        nmf = NMF(n_components=num_components)
        P = nmf.fit_transform(d[:, :, i])
        Q = nmf.components_
        new_img[:, : ,i] = np.clip(P @ Q, 0, 1)
    return {'new_image': new_img}

运行以上函数，我们可以看看在不同的成分个数取值之下，图像压缩的效果。

plt.figure(figsize=(12, 9))
plt.imshow(d); plt.axis('off')
plt.show()for i in [1, 2, 3]:
    print('Number of components:', i)
    out = NMFImage(d, i)
    new_image = out['new_image']
    plt.figure(figsize=(12, 9))
    plt.imshow(new_image); plt.axis('off')
    plt.show()

Number of components: 1

Number of components: 2

Number of components: 3

Number of components: 5

Number of components: 10

Number of components: 20

Number of components: 80

Number of components: 150

4. 完整代码

下载实验图片: http://sofasofa.io/tutorials/image_compression/taibei101.jpg

import numpy as np
import matplotlib.pyplot as plt
from skimage import io
from sklearn.cluster import KMeansfrom sklearn.decomposition import NMF

# 利用K Means进行压缩def KMeansImage(d, n_colors):
    w, h, c = d.shape
    dd = np.reshape(d, (w * h, c))
    km = KMeans(n_clusters=n_colors)
    km.fit(dd)
    labels = km.predict(dd)
    centers = km.cluster_centers_
    new_img = d.copy()
    for i in range(w):
        for j in range(h):
            ij = i * h + j
            new_img[i][j] = centers[labels[ij]]
    return {'new_image': new_img, 'center_colors': centers}# 利用NMF进行压缩def NMFImage(d, n_components):
    w, h, c = d.shape
    new_img = d.copy()
    for i in range(c):
        nmf = NMF(n_components=n_components)
        P = nmf.fit_transform(d[:, :, i])
        Q = nmf.components_
        new_img[:, : ,i] = np.clip(P @ Q, 0, 1)
    return {'new_image': new_img}# 查看K Means在不同聚类个数下的视觉效果
plt.figure(figsize=(12, 9))
plt.imshow(d); plt.axis('off')
plt.show()for i in [2, 3, 5, 10, 20, 30]:
    print('Number of clusters:', i)
    out = KMeansImage(d, i)
    centers, new_image = out['center_colors'], out['new_image']
    plt.figure(figsize=(12, 1))
    plt.imshow([centers]); plt.axis('off')
    plt.show()
    plt.figure(figsize=(12, 9))
    plt.imshow(new_image); plt.axis('off')
    plt.show()# 查看NMF在不同成分个数下的视觉效果 
plt.figure(figsize=(12, 9))
plt.imshow(d); plt.axis('off')
plt.show()for i in [1, 2, 3, 5, 10, 20, 30, 50, 80, 150]:
    print('Number of components:', i)
    out = NMFImage(d, i)
    new_image = out['new_image']
    plt.figure(figsize=(12, 9))
    plt.imshow(new_image); plt.axis('off')
    plt.show()

猜你可能喜欢

R语言（绘图入门）

多元线性回归、逐步回归、逻辑回归的总结

Python系列之——好用的Python开发工具

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

K-Means算法、非负矩阵分解(NMF)与图像压缩

4. 完整代码

您可能也对以下帖子感兴趣

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

生成图片，分享到微信朋友圈

K-Means算法、非负矩阵分解(NMF)与图像压缩

4. 完整代码

您可能也对以下帖子感兴趣