信号处理与模式识别
基于Gabor小波变换的彩色图像分割
ColorImageSegmentationBasedonGaborwaveletTransform
王广东3 付永生
WANGGuang2dong FUYong2sheng
摘 要
本文提出了一种基于Gabor小波变换的彩色图像分割方法,首先对彩色图像进行Gabor小波变换,然后进行特征提取,并采用动态聚类K2均值算法进行分类,最后得到图像分割的结果。实验和分析表明,该方法对于彩色自然图像的分割具有较好的效果。
关键词
小波变换 图像分割 动态聚类
Abstract Inthispaper,weintroduceamethodcalledcolorimagesegmentationbasedonGaborwavelettransfor2mation.First,wegettheGaborwavelettransformationofthecolorimagebyasetofGaborfilters.ThenimagefeaturesareobtainedanddynamicclusteringK2meansclassificationmethodisapplied.Aftersomeexperimentsandanalysis,itcanbeseenthatourmethodcanbeusedtosegmentdifferentcolorimagesandtheresultsarequitebetter.
Keywords WaveletTransformation Imagesegmentation Dynamicclustering
1 引言
图像分割的目的是理解图像的内容,提取感兴趣的对象。图像分割按照具体应用的要求和具体图像的内容将图像分割成一块块区域。图像分割是模式识别和图像分析的预处理阶段。由于图像分割的重要性和困难性,虽然从20世纪70年代起就已经引起人们的高度重视,但目前还没有找到一个通用的方法和评判图像分割结果的客观标准。人们提出了大量的算法,这些算法大多是基于灰度图像的,大致分为两大类:基于区域的算法和基于边缘检测的算法。
由于现在彩色图像的大量存在,对彩色图像的分割显得尤为重要。文献[2]直接用ISODATA聚类方法对彩色图像进行了分割。文献[3]将Gabor小波变换技术与无监督神经网络技术联系在一起,对纹理图像进行分割,并取得了良好的效果。本文所提出的方法与他们的不同之处在于:首先是对图像采用奇Gabor函数变换,其次是,针对人眼对颜色的感觉比较敏感的特点,选取了更多的色彩特征。实验表明,本文的方法对于不同彩色图像都具有良好的分割效果。图1所示为该文的彩色图像分割方法色系统框图。
子。Gabor函数具有一些非常特殊的性质:
图1
a.具有最佳时间2频率局部化特性;
b.具有旋转相位信息,反映不同方向的纹理和边界;c.在心理学上具有接近人类视觉神经的反映特性,并
用Gabor函数模拟视觉神经模型。
Daugman给出了Gabor函数在二维情况下的一般形式:(x-x0)2(y-y0)21G(x,y)=exp-π+22
παβ2αβ
ξ・expj[0x0+v0y0]
(221)
其中(x0,y0)表示二维空间接受域的中心点,(ξ0,v0)表示滤波器在频率域最优空间频率,α和β分别表示椭圆高斯函数沿x,y方向上的标准偏差。我们从(221)式可以看出,
Gabor函数可以表示为一个椭圆高斯函数与一个复平面函数
2 Gabor小波变换
Gabor小波是由Gabor函数通过尺度伸缩和旋转生成的
的乘积形式。复数形式的二维Gabor函数包含两个正交投影:实数的偶对称余弦部分和虚数的奇对称正弦部分,分别称之为:实Gabor函数(RealGaborFunction,RGF)和虚Gabor函数(ImaginaryGaborFunction,IGF)。
将(221)式表示二维Gabor函数实部和虚部分开写。并令α=β=σ;得到Gabor滤波器的如下数学表达式:
一组复函数系,含有实部和虚部,可以分别作为边界检测算
3山东大学信息科学与工程学院 济南 250100
2004年第4期11
信号处理与模式识别
信息技术与信息化
he(x,y,f,θ,σ)=g(x,y,σ)・cos[2πf(xcos
θ+ysinθ)]ho(x,y,f,θ,σ)=g(x,y,σ)・sin[2πf(xcos
θ+ysinθ)]其中he和ho分别表示偶、奇Gabor滤波器,g(x,y,σ
)是高斯函数:
g(x,y,σ
)=1x2
+y22πσ
2exp-2σ2
f、
θ和σ分别是Gabor滤波器中的三个重要参数:空间频率、相位以及空间常数,奇、偶Gabor函数分别有不同的滤波特性,对于目标检测来说,偶Gabor函数(RGF)适合检测块状的物体,奇Gabor函数(IGF)适合检测目标的边缘。这里我们选择奇Gabor函数来实现特征提取的目的。
由于Gabor滤波器在频域的共轭对称性,因此只需在02
180度内选择方向参数θ即可。我们选择七个相位参数:0
度、30度、60度、90度、120度、150度和180度。中心频率f跟图像有关,这里我们选择两个:0.06和0.08。Gabor通道的空间常数σ决定了通道的宽度,这里我们选择σ与中心频率成反比。然后对彩色图像进行如下的Gabor小波变换:
F(x,y)=‖T(x,y)3ho(x,y)‖
其中T(x,y)为将要处理的图像;ho(x,y)为上述由奇
Gabor函数变换后得到的Gabor小波滤波器组;F(x,y)为二
者经过卷积后得到的一组滤波结果。
3 特征选取
这里把彩色图像由RGB颜色空间转换到YUV颜色空间中,Y分量为亮度,相当于灰度。首先去掉亮度不同对特征的影响,这对自然图像的分割是很重要的。去掉局部亮度的方法是用像素点的Y分量值减去该像素点周围区域的亮度平均值。然后对各个分量进行Gabor小波变换,这样每个分量便得到与之对应的14个矩阵。由于人的视觉中对亮度的感觉一般只有20级左右。而对色调或彩色的深浅可区分
130级左右。同时如果选取过多的特征不仅会降低算法的收
敛速度,而且会导致图像被分割的过于零碎。因此我们对于亮度分量Y只进行3个方向(0度、90度和180度)的滤波。而对于颜色分量则进行7个方向的滤波。
这样,对于原始图像中的任一个像素(x,y)便得到一个
34维的特征向量。其中亮度特征分量有6个,颜色特征分量
有28个。
4 动态聚类算法描述
聚类算法采用K2均值算法。该方法基于使聚类性能指标最小化。这里所用的聚类准则函数是聚类集中每一样本点到该类中心的距离平方之和,并使它最小化。K2均值算法需要两个参数:聚类的个数和聚类中心。对人的视觉而言,
12 2004年第4期能比较容易地看出图像应该分为几类。而对于初始聚类中心的选择则比较难。因此本文采用文献[4]提出的方法初始化K个聚类中心。动态聚类算法的基本步骤如下:
a.根据文献[4]的方法初始化K个初始聚类中心:z1
(1),z2(1)…,zk(1)。括号内的序号为寻找聚类中心的迭代
运算的次序号。
b.逐个将需分类的模式样本(x)按最小距离原则分配
给K个聚类中心的某一个zj(1)。原则是:Dj(k)=min{‖x
-zj(k)‖,则x∈sj(k)其中sj表示第j个聚类,其聚类中心
为zj。
c.计算各个聚类中心的新的向量值:z1j(k+1)=
Nj
x∈∑sx。j=1,2,…,K
j
(k)
d.如果zj(k+1)≠zj(k),j=1,2,…,K,则回到步骤b,
将模式样本逐个重新分类,重复迭代运算。
如果zj(k+1)=zj(k),j=1,2,…,K算法收敛,计算完毕。
5 试验结果和分析
基于以上算法,本文对一幅图像进行了试验。效果如图
2所示。
试验1:
图2
图(a)为原图像,图(b)为利用本文的算法把图像分为三类的结果,图(c)是利用本文的算法把图像分为七类的结果。从(b)图和(c)图可以看出。利用本文的算法对图像进行分割,能够得到较好的物体分割效果;并且随着聚类数目的增加,能够对图像进行更细致的分割,但是同时也会对一些物体造成过分割。因此要想取得对图像分割较好的效果,选择合适的分类数目是很必要的。
试验2:
图3
(下转第18页)
信号处理与模式识别
信息技术与信息化
要显示的数据作为一次读入的单位)一次性的读入内存中我们申请的缓冲区中。这样显示线程在显示完上次读入的数据后就可以不间断的显示已经装入新数据的缓冲区。这样系统的整体速度得到了很大的提高。
图4 系统结构
a.读入模块:根据控制信息从AVI格式的文件中将视频
4 结束语
本文在分析研究了视频的编解码技术、播放技术和视频的一般存储结构的基础上,提出了一种控制视频流文件、以任意速度和随机的设计方法,另外还讨论了MPEG标准的视频编解码原理,提出了一种倒序播放视频流的算法,并与正向播放原理进行了有益的比较。
流读入,以帧为单位放入缓冲区中。
b.输出模块:从缓冲区中读入各帧图像信息,并解压,
根据控制信息将图像以一定的速度方式输出到屏幕。
c.控制模块:实时的获取控制平台的信息,更新相应的
控制量。
参考文献:
1 张益贞,刘涛.VisualC++实现MPEGΠJPEG编解码技术2 吴乐南.数据压缩.北京:电子工业出版社,20003 http:ΠΠwww.jpeg.org
4 钟玉琢等.基于对象的对媒体数据压缩编码国际标准2MPEG4及其效验模型.北京:科学出版社,2000
5 鄂大伟.多媒体技术基础与应用,北京:高等教育出版社
(收稿日期:2004204216)
3 图象数据缓冲方式
视频流的数据以AVI文件的形式存在了硬盘上,一直以来硬盘的速度是计算机I/O速度的瓶颈之一。系统需要高速的显示视频流,就需要解决硬盘数据传输瓶颈的问题,因此我们使用了多缓冲区并且使用了多线程技术。在需要高速显示视频数据的时候,数据读入线程在同步机制的控制下,将一定数量的视频数据(一般的我们将一秒钟的时间内
(上接第12页)态聚类的方法K2均值算法对图像进行分割。通过对自然图像进行分割的实验,表明本文提出的方法对彩色图像的分割有较好的效果。
图(d)是转化为灰度图像后用Canny算子提取边缘后的图像,图(e)为利用本文算法把图像分割为五类的结果。图(f)为直接利用K2均值算法对图像进行分割的结果。从(d)图可以看到如果只考虑颜色(此处为灰度),对这幅图像的分割会产生较大的误差,对图像中的一些岛屿会产生过分割的现象。从图(f)中也可以看出,它对空中的云彩的分割很模糊。然而,在图像(e)中,对图像的分割基本不存在上述两个问题,它能够基本反映物体的大致轮廓。
参考文献:
1 陈纯.计算机图像处理技术与算法.清华大学出版社,20032 万建,王继成.基于ISODATA算法的彩色图像分割[J].计
算机工程,2002;28(5):135~137
3 P.P.Raghu,R.Pcongodi,B.Yegnanarayana,“Unsupervised
TextureClassificationUsingVectorQuantizationandDeterminis2ticRelaxationNeuralNetwork”,IEEETrans.ImageProcessing,Vol6,No.10,pp137621387,Oct,1997
4 UFayyad,CReina,PSBradley.InitializationofIterativeRe2finementClusteringAlgorithms[C].In:Proc4Int1ConfonKnowledgeDiscoveryandDataMining(KCC98),1998:194~198
(收稿日期:2004204227)
th
6 结论
本文从奇Gabor函数(IGF)适合检测物体边缘的特性出发,并利用Gabor变换在频率域和空间域表现出来的可调局部特性,通过选取适当的参数,我们得到了一组具有不同空间相位和中心频率的滤波器。通过这组滤波器,我们得到了图像在各个方向上的特征。然后把得到的这组特征,利用动
18 2004年第4期
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务