基于FCM聚类及其改进的遥感图像分割算法
李勇发, 左小清, 杨芳, 林思, 张建柱
昆明理工大学 国土资源工程学院,云南 昆明 650093

作者简介:李勇发(1990—),男,云南宣威人,硕士研究生,主要研究方向为图像处理与数据挖掘,E-mail: 549850669@qq.com

摘要

在遥感图像分割中,某些像素分类具有不确定性和随机性,模糊C-均值(FCM)聚类算法对处理这种不确定性和随机性具有很大的优势,但传统的FCM算法具有很大的缺点。对此,该研究提出一种改进的FCM遥感图像分割算法。首先,该算法在选取聚类中心和聚类数时使用直方图进行选取,克服了传统FCM算法选取时的随机性和人为性;然后,使用叉熵距离测度代替欧氏距离测度,克服了传统FCM算法依赖于球状分布的缺点;最后,利用传统FCM算法和改进后的FCM算法对某水电站大坝遥感图像进行分割实验,比较2种方法的分割效果,结果显示,改进的FCM算法大大提高了遥感图像聚类的效率和分类的精度。

关键词: 图像分割; 聚类分析; 模糊C-均值
中图分类号:TP75 文献标志码:A 文章编号:0528-9017(2017)03-0518-03 doi: 10.16178/j.issn.0528-9017.20170348

遥感图像作为制作和更新GIS数据库的重要数据源, 已被广泛应用于土地利用、环境监测、资源勘探、灾害评估、城市规划等领域中。随着遥感与信息技术的不断发展, 各种海量的遥感数据都可以通过对地观测技术进行获取, 然而数据转化成信息的过程当中仍存在很多瓶颈, 其中遥感图像分割就是一项非常关键的技术, 同时也是图像处理领域的难点和重点。遥感图像分割是指对遥感图像进行处理、分析, 从中提取目标的技术和过程。当前虽然已经有了大量的图像分割算法, 但由于遥感图像通常具有灰度级多、信息量较大、边界不清晰、目标类型较多等特点, 导致这些算法在实际应用中还存在很多问题, 如适用性差、分割效率低、分割精度不高等[1], 加之遥感图像的分割本身具有不确定性, 不同的应用目的和用户对图像感兴趣的部分不同, 期望从图像中获得的信息层次也往往不同, 致使难以建立完全准确的分割方法对遥感图像进行分割。总体来看, 在进行遥感图像分割处理时, 通常采用模糊理论的方法。但传统的模糊C-均值(FCM)聚类算法存在以下不足:(1)传统FCM算法的运行效果与初始聚类中心和聚类数密切相关, 而初始聚类中心和聚类数具有随机性, 导致每次运行效果差异较大; (2)由于FCM算法很大程度上依赖于球状样本数据, 对于非球状样本数据, 其聚类效果并不理想[2]。为此, 本研究提出一种改进的FCM聚类算法。现报道如下。

1 传统聚类的分割算法及其实现
1.1 FCM聚类算法

FCM聚类算法是一种无监督的分类方法, 根据最小二乘原理, 计算目标函数的均方差, 得到每个数据点对类中心的隶属度和目标函数的最小值, 是一种基于目标函数的非线性迭代的最优化方法[3]

1.2 FCM聚类算法的原理

1.2.1 聚类目标函数

聚类算法的目标函数由开始的类内误差平方和的形式演化而来, 之后经推广, 演变成了更具普遍意义的形式。类内误差平方和形式的目标函数实际上是Ruspini提出的硬聚类分析的目标函数[2], 它的形式为:

J(U, V)= i=1cXjXdij2, s.t.U∈ Ω f

式中:J表示目标函数; U=[uij]c× n表示硬划分矩阵, 取值范围为{0, 1}; V=(v1, v2, …, vc)是一个聚类中心向量, 对所有的i=1, 2, …c, 有v1(vi1, vi2, …, vis)∈ Rs, 它代表第i类聚类中心; dij表示第j个样本点与第i类聚类中心之间的失真度, 经常用距离函数来度量。

利用硬划分矩阵的取值不是0就是1的特点, 可以将uij作为权值对距离函数进行加权, 此时目标函数可以表示为:

J(U, V)= i=1cXjXuij dij2, s.t. U∈ Ω h

把硬聚类算法的目标函数运用到模糊情形, 将隶属度的平方对聚类中心与样本点之间的距离进行加权, 就把类内误差平方和目标函数变成类内加权误差平方和目标函数[3, 4], 如下所示:

J(U, V)= j=1ni=1cuij2dij2, s.t.U∈ Ω f

式中, U=[uij]c× n表示模糊划分矩阵, 取值范围为[0, 1], 其他变量不改变含义, 将其推广为更广泛的形式, 并对FCM目标函数的表示作更广泛的描述:

J(U, V)= j=1ni=1cuijαdij2, s.t.U∈ Ω f

式中α ∈ [1, +∞ )为模糊因子, 主要用它来控制分享程度, α 越大, 表明隶属关系越模糊, 反之表明隶属关系越清楚。

α +∞ 时, J→ 0且U中全部元素都靠近1/c, 就会失去模糊聚类的意义; 当α =1时, 就成为了硬聚类。因此主要由α 来控制隶属度的值, 使模糊分类的特点更加明确。

1.2.2 拉格朗日(Lagrange)乘数法[5]

FCM算法中数据集的模糊划分是采用迭代的方法来实现, 用数学的方式表示为:

min{J(U, V)}=min{ j=1ni=1cuijαdij2}= j=1nmin{ i=1cuijαdij2}。

式中利用了矩阵U中各列独立的性质, 且隶属度函数应满足 i=1cuij=1, 再运用Lagrange乘数法, 得到一个无约束的准则函数:

ψ = i=1cuijαdij2(1- i=1cuij)。

用欧氏距离表示失真度dij, 则目标函数的表达式为:

J(U, V)= j=1ni=1cuijαdij2= j=1ni=1cuijαxf-vi2

对目标函数J求导, 可获得聚类中心的更新式, 即:

Jvi= j=1nuijαvixj-vi2=2 j=1nuijαxj-2 j=1nuijαvi=0。

2 基于改进的FCM聚类的遥感图像分割算法
2.1 改进FCM聚类算法的原理

2.1.1 初始聚类中心与聚类数的选取

在传统FCM算法中, 初始聚类中心与聚类数的选取对于聚类效果具有很大的影响[4]。为解决聚类中心和聚类数在选取过程中的随机性, 利用直方图交互获取初始聚类中心与聚类数。具体做法如下:将彩色的遥感图像从RGB颜色空间变为特征颜色空间, 并计算出它的直方图, 利用直方图波峰的个数来确定图像的聚类数, 然后再利用在原先基础上减1或加1的方法进一步修正聚类数。聚类中心为波峰处的像素值。

2.1.2 距离测度的选择

传统FCM算法假定样本呈球状或者椭球状排列, 并据此选用了欧氏距离测度。但实际情况中。样本数据并不完全呈球状排列, 因此, 传统FCM算法不能很好地用于非球状排列数据的聚类。为提高其鲁棒性, 本研究选用交叉熵距离测度。

交叉熵距离是用来衡量2种概率分布之间信息量差异的量, 又称为特征散度距离, 设样本数据集X={x1, x2, …, xn}, Y={y1, y2, …yn}, 则交叉熵距离可表示为:

D(X:Y)=[d(x1, y1), d(x2, y2), …d(xn, yn)]T;

d(xi, yi)=xiln xiyi+yiln xiyi(i=1, 2, …n)。

若样本集中数据取值为正值时, 则特征散度的分量满足同一性和非负性。

鉴于人的视觉感受相同, 所以考虑在Lab均匀颜色空间中分割图像。L分量表示图像的亮度, a分量和b分量分别对称。人对于通过均匀颜色空间内任意一点距离相同的地方的视觉感受是一样的, 因此本文在Lab均匀颜色空间中对图像进行分割。L分量表示图像的亮度, a分量和b分量分别对称, Δ C代表图像色差, 图像中第ij个像素在Lab空间中的色差可以表示为:

Δ C= (Li-Lj)2+(ai-aj)2+(bi-bj)2

Δ C的值越小, 表明两点间的色差越小。因此, 可用下列目标函数描述像素间相似程度的非相似性:

J= i=1cJi= i=1c(L, a, b)cd2(Lj, Li)+d2(aj, ai)+d2(bj, bi)

式中d是利用叉熵测度定义的距离。

2.2 改进FCM聚类算法的步骤

根据以上原理, 改进的FCM算法分割步骤如下:首先, 将彩色图像从RGB颜色空间转换到Lab空间; 其次, 提取图像像素的ab分量(色度空间); 然后, 计算ab分量的直方图, 并运用直方图交互获取图像的聚类中心与聚类数; 最后, 利用目标函数进行FCM聚类, 记录聚类结果。

3 传统FCM与改进FCM聚类的图像分割对比实验

对某水电站大坝遥感图像进行分割实验, 图1为传统FCM分割算法在不同聚类次数下的效果图和最终分割效果图, 图2为改进的FCM分割算法在不同聚类次数下的效果图和最终分割效果图。传统FCM聚类算法和改进的FCM聚类算法对比结果如表1所示。

图1 传统FCM分割算法在不同聚类下的效果以及最终分割效果

图2 改进的FCM分割算法在不同聚类下的效果以及最终分割效果

表1 传统FCM聚类算法和改进的FCM聚类算法对比

通过实验可以看出:运用改进的FCM聚类算法分割后的遥感图像, 分割效果明显, 程序运行时间较短, 能够有效地提高图像分割的精度与效率。这是因为改进的FCM算法利用图像直方图获取初始聚类中心和聚类数, 克服了传统FCM算法获取初始聚类中心和聚类数的随机性, 同时又选用了叉熵距离测度, 使得该方法不必依赖于球状数据分布, 聚类分割效果较好, 边缘清晰, 效率也大大提高。

4 小结

本研究基于集合论、模糊数学的相关理论, 介绍了基于FCM聚类的遥感图像分割算法, 通过引入叉熵距离测度, 对其做了改进, 提出一种基于改进的FCM聚类的遥感图像分割算法, 并进行验证实验, 结果表明, 该方法具有更高的分割效率和分割精度, 解决了传统方法对球状数据分布的依赖。

The authors have declared that no competing interests exist.

参考文献:
[1] 周家香. Mean Shift遥感图像分割方法与应用研究[D]. 长沙: 中南大学, 2012. [本文引用:1]
[2] 贲志伟, 赵勋杰. 基于改进的FCM算法提取彩色图像有意义区域[J]. 计算机工程与设计, 2010, 31(18): 4082-4084. [本文引用:2]
[3] 王洪蕾. 基于模糊聚类的图像分割算法研究[D]. 长沙: 湖南大学, 2008. [本文引用:2]
[4] QIU C, XIAO J, YU L, et al. A modified interval type-2 fuzzy C-means algorithm with application in MR image segmentation[J]. Pattern Recognition Letters, 2013, 34(12): 1329-1338. [本文引用:2]
[5] 贲志伟. 彩色图像有意义区域提取算法研究[D]. 苏州: 苏州大学, 2010. [本文引用:1]