查看原文
其他

机器学习算法实践——K-Means算法与图像分割

2016-10-31 深度学习世界

一、理论准备

1.1、图像分割

图像分割是图像处理中的一种方法,图像分割是指将一幅图像分解成若干互不相交区域的集合,其实质可以看成是一种像素的聚类过程。通常使用到的图像分割的方法可以分为:

  • 基于边缘的技术

  • 基于区域的技术

基于聚类的图像分割属于基于区域的技术。

1.2、K-Means算法

K-Means算法是基于距离相似性的聚类算法,通过比较样本之间的相似性,将形式的样本划分到同一个类别中,K-Means算法的基本过程为:

  • 初始化常数 ,随机初始化k个聚类中心

  • 重复计算以下过程,直到聚类中心不再改变

    • 计算每个样本与每个聚类中心之间的相似度,将样本划分到最相似的类别中

    • 计算划分到每个类别中的所有样本特征的均值,并将该均值作为每个类新的聚类中心

  • 输出最终的聚类中心以及每个样本所属的类别

在K-Means算法中,需要随机初始化k个聚类中心,而K-Means算法对初始聚类中心的选取较为敏感,若选择的聚类中心不好,则得到的聚类结果会非常差,因此,对K-Means算法提出了很多的改进的方法,如K-Means++算法,在K-Means++算法中,希望初始化的k个聚类中心之间的距离尽可能的大,其具体过程为:

  • 在数据集中随机选择一个样本点作为第一个初始化的聚类中心

  • 选择出其余的聚类中心:

    • 计算样本中的每一个样本点与已经初始化的聚类中心之间的距离,并选择其中最短的距离

    • 以概率选择距离最大的样本作为新的聚类中心,重复上述过程,直到 个聚类中心都被确定

  • 对k个初始化的聚类中心,利用K-Means算法计算最终的聚类中心。

对于K-Means算法的具体过程可以参考博文,K-Means++算法的具体过程稍后会补充。

二、实践准备

实践中使用作为开发语言,使用到的模块包括numpy和Image。numpy模块是python中矩阵计算使用最多的模块。

Image模块是PIL(Python Imaging Library)中的模块,对于Image模块,主要是对图像的一些操作:

  • 模块的头文件

import Image as image

  • 打开图片

fp = open("003.JPG", "rb")
im = image.open(fp)

首先是以二进制文件的形式打开文件,再利用Image模块的open方法导入图片。

对于如下的图片(圣托里尼):

  • 图片的属性

im.format, im.size, im.mode

得到的结果为:JPEG (1600, 1067) RGB

  • 通道分离:

r,g,b = im.split()

分割成三个通道,此时r,g,b分别为三个图像对象。

  • 取得像素点的值

im.getpixel((4,4))

由于是RGB三通道的,因此此处的值为:(151, 169, 205)

  • 改变单个像素点的值

im.putpixel(xy, color)

  • 图像类型转换:

im=im.convert("L")

由RGB的图像转成灰度的图像,其结果为:

  • 生成新的图像

Image.new(mode, size)  

Image.new(mode, size, color)  

如:newImg = Image.new(“GBA”,(640,480),(0,255,0))

  • 保存图片

im.save("save.gif","GIF")

三、利用K-Means++算法进行图像分割

3.1、利用K-Means++聚类

在利用K-Means++算法进行图像分割时,将图像中的每一个像素点作为一个样本,对RGB图像来说,每个样本包括三维:(151, 169, 205),通过归一化,将每个通道的值压缩到[0,1]区间上。数据的导入和处理如下面程序所示:

#coding:UTF-8 import Image as image import numpy as np from KMeanspp import run_kmeanspp def load_data(file_path):    '''导入数据    input:  file_path(string):文件的存储位置    output: data(mat):数据    '''    f = open(file_path, "rb")  # 以二进制的方式打开图像文件    data = []    im = image.open(f)  # 导入图片    m, n = im.size  # 得到图片的大小    print m, n    for i in xrange(m):        for j in xrange(n):            tmp = []            x, y, z = im.getpixel((i, j))            tmp.append(x / 256.0)            tmp.append(y / 256.0)            tmp.append(z / 256.0)            data.append(tmp)    f.close()    return np.mat(data)

最终保存成矩阵的形式,矩阵的行为样本的个数,列为每一个通道的数值(RGB)。在利用K-Means++算法对样本进行聚类。主函数如下述代码所示:

if __name__ == "__main__": k = 10#聚类中心的个数 # 1、导入数据 print "---------- 1.load data ------------" data = load_data("001.jpg") # 2、利用kMeans++聚类 print "---------- 2.run kmeans++ ------------" run_kmeanspp(data, k)

k表示的是聚类的个数。K-Means++程序的实现如下面程序所示:

# coding:UTF-8 ''' Date:20160923 @author: zhaozhiyong ''' import numpy as np from random import random from KMeans import distance, kmeans, save_result FLOAT_MAX = 1e100  # 设置一个较大的值作为初始化的最小的距离 def nearest(point, cluster_centers):    '''计算point和cluster_centers之间的最小距离    input:  point(mat):当前的样本点        cluster_centers(mat):当前已经初始化的聚类中心    output: min_dist(float):点point和当前的聚类中心之间的最短距离    '''    min_dist = FLOAT_MAX    m = np.shape(cluster_centers)[0]  # 当前已经初始化的聚类中心的个数    for i in xrange(m):        # 计算point与每个聚类中心之间的距离        d = distance(point, cluster_centers[i, ])        # 选择最短距离        if min_dist > d:            min_dist = d    return min_dist def get_centroids(points, k):    '''KMeans++的初始化聚类中心的方法    input:  points(mat):样本        k(int):聚类中心的个数    output: cluster_centers(mat):初始化后的聚类中心    '''    m, n = np.shape(points)    cluster_centers = np.mat(np.zeros((k , n)))    # 1、随机选择一个样本点为第一个聚类中心    index = np.random.randint(0, m)    cluster_centers[0, ] = np.copy(points[index, ])    # 2、初始化一个距离的序列    d = [0.0 for _ in xrange(m)]    for i in xrange(1, k):        sum_all = 0        for j in xrange(m):            # 3、对每一个样本找到最近的聚类中心点            d[j] = nearest(points[j, ], cluster_centers[0:i, ])            # 4、将所有的最短距离相加            sum_all += d[j]        # 5、取得sum_all之间的随机值        sum_all *= random()        # 6、获得距离最远的样本点作为聚类中心点        for j, di in enumerate(d):            sum_all -= di            if sum_all > 0:                continue            cluster_centers[i] = np.copy(points[j, ])            break    return cluster_centers def run_kmeanspp(data, k):    # 1、KMeans++的聚类中心初始化方法    print "\t---------- 1.K-Means++ generate centers ------------"    centroids = get_centroids(data, k)    # 2、聚类计算    print "\t---------- 2.kmeans ------------"    subCenter = kmeans(data, k, centroids)    # 3、保存所属的类别文件    print "\t---------- 3.save subCenter ------------"    save_result("sub_pp", subCenter)    # 4、保存聚类中心    print "\t---------- 4.save centroids ------------" save_result("center_pp", centroids)

在上述代码中主要是初始化k个聚类中心,K-Means算法的核心程序如下所示:

# coding:UTF-8 ''' Date:20160923 @author: zhaozhiyong ''' import numpy as np def distance(vecA, vecB):    '''计算vecA与vecB之间的欧式距离的平方    input:  vecA(mat)A点坐标        vecB(mat)B点坐标    output: dist[0, 0](float)A点与B点距离的平方    '''    dist = (vecA - vecB) * (vecA - vecB).T    return dist[0, 0] def randCent(data, k):    '''随机初始化聚类中心    input:  data(mat):训练数据        k(int):类别个数    output: centroids(mat):聚类中心    '''    n = np.shape(data)[1]  # 属性的个数    centroids = np.mat(np.zeros((k, n)))  # 初始化k个聚类中心    for j in xrange(n):  # 初始化聚类中心每一维的坐标        minJ = np.min(data[:, j])        rangeJ = np.max(data[:, j]) - minJ        # 在最大值和最小值之间随机初始化        centroids[:, j] = minJ * np.mat(np.ones((k , 1))) + np.random.rand(k, 1) * rangeJ    return centroids def kmeans(data, k, centroids):    '''根据KMeans算法求解聚类中心    input:  data(mat):训练数据        k(int):类别个数        centroids(mat):随机初始化的聚类中心    output: centroids(mat):训练完成的聚类中心        subCenter(mat):每一个样本所属的类别    '''    m, n = np.shape(data)  # m:样本的个数,n:特征的维度    subCenter = np.mat(np.zeros((m, 2)))  # 初始化每一个样本所属的类别    change = True  # 判断是否需要重新计算聚类中心    while change == True:        change = False  # 重置        for i in xrange(m):            minDist = np.inf  # 设置样本与聚类中心之间的最小的距离,初始值为争取穷            minIndex = 0  # 所属的类别            for j in xrange(k):                # 计算i和每个聚类中心之间的距离                dist = distance(data[i, ], centroids[j, ])                if dist < minDist:                    minDist = dist                    minIndex = j            # 判断是否需要改变            if subCenter[i, 0] <> minIndex:  # 需要改变                change = True                subCenter[i, ] = np.mat([minIndex, minDist])        # 重新计算聚类中心        for j in xrange(k):            sum_all = np.mat(np.zeros((1, n)))            r = 0  # 每个类别中的样本的个数            for i in xrange(m):                if subCenter[i, 0] == j:  # 计算第j个类别                sum_all += data[i, ]                r += 1            for z in xrange(n):                try:                    centroids[j, z] = sum_all[0, z] / r                    print r                except:                    print " r is zero"      return subCenter def save_result(file_name, source):    '''保存source中的结果到file_name文件中    input:  file_name(string):文件名        source(mat):需要保存的数据    output:    '''    m, n = np.shape(source)    f = open(file_name, "w")    for i in xrange(m):        tmp = []        for j in xrange(n):            tmp.append(str(source[i, j]))        f.write("\t".join(tmp) + "\n")    f.close()

3.2、利用聚类结果生成新的图片

上述的过程中,对每一个像素点进行了聚类,最终利用聚类中心点的RGB值替换原图中每一个像素点的值,便得到了最终的分割后的图片,代码如下所示:

#coding:UTF-8 import Image as image f_center = open("center_pp") center = [] for line in f_center.readlines():    lines = line.strip().split("\t")    tmp = []    for x in lines:        tmp.append(int(float(x) * 256))    center.append(tuple(tmp)) print center f_center.close() fp = open("001.jpg", "rb") im = image.open(fp) # 新建一个图片 m, n = im.size pic_new = image.new("RGB", (m, n)) f_sub = open("sub_pp") i = 0 for line in f_sub.readlines():    index = float((line.strip().split("\t"))[0])    index_n = int(index)    pic_new.putpixel(((i/n),(i % n)),center[index_n])    i = i + 1 f_sub.close() pic_new.save("result.jpg", "JPEG")      

对于上述的圣托里尼的图片,取不同的k值,得到如下的一些结果:

  • 原图

  • k=3

  • k=5

  • k=7

  • k=10


点击“阅读原文”了解我的PM2.5空气监测仪
↓↓↓

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存