Computer Engineering and Applications计算机工程与应用 2007,43(10)81 模糊理论在基于特征向量的模式识别中的应用 王晓君 ,魏书华 WANG Xiao_jun1,2,WEI Shu—hua 1.北京理工大学.北京100081 2.河北科技大学,石家庄050054 1.Beijing Institute of Technology,Beijing 10008 1,China 2.Hebei University of Science&Technology,Shijiazhuang 050054,China WANG Xiao-jun,WEI Shu-hua.Application research of fuzzy theory in pattern recognition based on characteristic vec- tor.Computer Engineering and Applications,2007,43(10):81—83. Abstract:The problem of pattern recognition based on characteristic vector is often encountered in computer measurement and control system.But the characteristic vectors of existing patterns in database and that of object will be recognized are all to present somewhat uncertainty due to the error during extracting procedure.This research puts fuzzy theory into recognizing procedure with transforming it into a similarity or distance problem of two fuzzy sets.he recogniTtion algorithms based on shortest distance and largest d similarity degree are provided in this paper,and to be successfully used in personal identiifcation system based on hand shape. Key words: fuzzy;pattern recognition;similarity degree;distance;personal identiifcation 摘 要:在计算机测量与控制系统中经常会遇到基于特征向量的模式识别问题,由于特征向量提取过程所带来的误差,使得数据 库中标准模式的特征向量与待识对象的特征向量都具有一定的不确定性。将模糊理论应用于识别过程中,将识别过程转换为两个 模糊集的贴近度或距离问题,设计实现了基于格贴近度和距离的识别算法,并成功应用于基于手掌形状的身份识别系统中。 关键词:模糊;模式识别;贴近度;距离;身份识别 文章编号:1002—8331(2007)10—0081—03 文献标识码:A 中图分类号:TP391 l 引言 在计算机识别与控制系统中,经常要解决基于特征向量的 模式识别问题。在这类识别问题中,标准模式与待识模式均以 特征向量表征。由于在特征向量提取过程中存在着一定的随机 误差,从而使标准模式库的建立过程与正常识别过程一样,两 者的特征向量都具有一定的不确定性,或者说,标准模式的特 级而且要求一个明确的判决结果,那么可根据待识模式相对各 类标准模式的贴近度和其他的一些指标进行硬性判别。 解决模糊模式识别问题的关键及难点在于如何根据具体 情况构建隶属度函数。在大多数情形下,特征参数提取时引入 的随机误差符合正态分布,因此可使用正态形的隶属度函数。 本文给出在这种情况下,基于两模糊集的贴近度及距离的模糊 模式识别算法及具体的隶属度函数设计方法。限于篇幅,只给 出基于距离的模糊模式识别算法在掌形识别系统中的具体 应用 征向量也不是绝对准确的。在这种情况下,经常采用模糊模式 识别的方法将识别问题转化为计算两个模糊集的贴近度或距 离问题。 为了能运用贴近度进行分类.通常模糊集用隶属度函数表 示。对有限论域,模糊集实际上组成有限维的模糊向量,其分量 表示为论域中各元素对该模糊集的隶属度。在实际应用中,可 将识别对象的特征集作为论域,每个特征作为论域中的元素。 所有已知类别的模式和待识模式视作该论域上的模糊集,它们 的各特征值归一化后作为隶属度函数.从而产生各模式类与待 识模式的模糊向量。 2基于格贴近度的模糊模式识别算法 贴近度用来衡量模糊集与模糊集之间的靠近程度,两模糊 集的贴近度定义为:设 ≠ ,lCf_F(X),N:卢 一『0,l】,且对于 任意A, ,C∈ ,满足条件: (1)若A≠ ,则Ⅳ(A,A):l; 使用模糊技术进行识别的结果不再是待识模式明确地属 于或不属于某一标准模式.而是以一定的贴近度属于各个标准 模式。这样的结果往往更真实,具有更多的信息。如果识别系统 是多级的,这有益于下一级的决策。如果当前已是系统最后一 基金项目:河北省教育厅课题。 (2)若A n = ,则N(A,曰)=Ⅳ( ,A)=0; (3)若C B A,则N(C,A)≤Ⅳ( ,A); (4)N(A, )=Ⅳ( ,A)(在有些场合下要求)。 N(B,A)称为在 上 对A的贴近度。符合这个定义的 作者简介:王晓君(1973一),男,副教授,北京理工大学在读博士生,河北科技大学电子工程系教师,研究方向:信号信息处理。 维普资讯 http://www.cqvip.com
82 2007,43(10) Computer En ̄neenng and Applications计算机工程与应用 N(B,A)可以有多个。当两模糊集类型相同时,经常采用两模糊 集的格贴近度.其定义为: N(B,A):(B 其中: )A(BxA) (1) 个标准参考向量的第 个分量的相似性测度。当各个分量具有 不同权重时,可以采用线性加权的方法对各特征分量的贴近度 进行加权综合。设 是第 个分量的权重,则待识模式与第i类 标准模式的总贴近度为: Ao曰=V.( ( )^ ( )) J E^ (2) (3) ^Ll di= q J (8) AxB=八 ( )V ( )) jE 在待识模式与所有标准模式的总贴近度计算完成后.从所 有大于某个阈值的贴近度中选择最大的,其所对应的模式即为 识别结果。 o曰称为 与曰的内积,AxB称为A与日的外积,实际 上 ⑧ 和A×曰分别是 n日的隶属度的上确界和 uB的 隶属度的下确界。 设X≠ ,A。,A:,…,A  ̄flCF(X),是已知的标准模式。 A∈卢是待判别模式。给定阈值A ,选定Ⅳ是卢上的贴近函 数,设: N(A,A )=max{N(A,A1),N(A,A 2),…,N(A,A )} 若N(A,A )≥A0,则判A属于第 类;若N(A,A )<Ao,则 拒绝判断.亦即由此种方式无法判断 应属的类别。这是基于 贴近度的模糊模式识别的择近原则。 设在所解决的问题中,有 个标准模式,且每个特征向量 由Ⅳ个分量组成。令 ,为待识模式特征向量第 个分量的模 糊观测值,而JR 是第i个标准模式的第 个分量的模糊观测 值,则 ,和R 分别是以x和rj为主值的模糊数。识别过程就是 要把由观测模糊数 构成的模糊数向量 归入到一个与它最 相似的由已知模糊数R. 构成的模糊数向量R 中。 设 (M)是R 的隶属度函数, (H)是 的隶属度函数, .选用正态型分布,用or,和or.,表示方差,有: / 2\ (Ⅱ)=exp(\ 一f\o /1 / J(4) f 2\ (u)=exp【一( )J (5) 为了最终判断出待识模式类型,需要确定 .和 。 之间的 相似性测度。由于两模糊集类型相同,故采用格贴近度作为两 个模糊集的相似性测度d 由式(1)有: d =( 。尺 )A(1 ×R ) (6) 在 (“)和 (u)均为正态型隶属度函数时,由于 ,o尺 ..是 (u)和 (u)相交的上确界,亦即是两模糊分布曲线在r 和X之间相交的高度,故有: ro .x』—-o_r』. r.. u=—o+oiq 从而有: 一唧[- 忆 …p[. ] 显然, , :0,于是由式(6)可得: 唧【-等l ㈩ 由上述推导可知d 为待识模式向量的第 个分量与第i 3基于距离的模糊模式识别算法 距离可用来衡量模糊集与模糊集之间的分离程度,故贴近 度越大的两个模糊集其距离越小。两模糊集的距离定义为:设 = 。, ,…, },lfCF(X),P:卢 一R,且对于任意A,B,C∈卢, 若满足条件: (1)非负性:p(A,B)>10,当且仅当A=日时,p(A, )=0; (2)对称性:p(A,曰) (曰,A); (3)三角不等式:p(A,C)≤p ,曰)+p(A,C)。 则称p(A.B)为 上A与 的距离。距离并不是惟一的,常用 的Hamming(海明)距离为: p(A,曰):1∑l ( )^ ( )l (9) Euclid(欧几里得)距离为: p(A,曰)=( ∑ ( )^ ( )) ) (10) 这二种距离均取值于【0,1],从而1_p(A,曰)也可视为 与 的贴近度。 设X≠ ,A ,A 2,…,A EflCF(X),是已知的标准模式。 A∈ 是待判别模式。给定阈值A,,选定P是卢上的距离,设: p(A,A )=min{p(A,A1),p(A,A 2),…,p(A,A )) 若p(A,A )≤Al,则判A属于第k类;若p(A,A )>Al,则拒绝 判断.亦即由此种方法无法判断A应属的类别。这是基于距离 的模糊模式识别的择近原则。 同理仍令 (H)为标准模式特征向量 的第 个分量的 隶属度函数, (u)为待识模式特征向量的第 个分量的隶属 度函数。在规划它们的隶属度函数时,可将标准特征向量视作 “清晰”的,因而它们的隶属度 ( )=1,而认为 (U)是“模 糊”的.满足以相对应的标准模式特征向量为期望的正态型分 布。即 / 2\ .(M)=exPI\\o—f r //1}u∈ (11) 式(11)中, 是论域,为包含Ⅳ个特征分量的有限集合。在计算 距离之前,首先需要计算每个分量的隶属度 ( ),最终会得 到两个模糊集 = ( ), ( ),…, ( ))和R =f1,1,…, 1},由式(9)得两者的海明距离: P( , )=^1∑l『1-/xx( ̄)l (12) ’j=o 由式(1O)得两者的欧氏距离: 1 (1 ( ) (13) 维普资讯 http://www.cqvip.com
王晓君,魏书华:模糊理论在基于特征向量的模式识别中的应用 2007.43(10)83 cm 4基于距离的模糊模式识别算法在掌形身份识别系 统中的应用 掌形身份识别系统是将手掌的8个形状参数作为识别不 标准模式 表1 数据库中部分标准模式的特征向量 特征参数 ril rd ‰ 同手掌的特征参数,在新输入掌形与库中存储的标准掌形之间 进行辨识,进而实现不同身份的识别。根据所要解决问题的性 0 中指长食指长无名指长拇指长小指长手掌宽中指宽无名指宽 8.305 7.320 7.6o7 6.969 7.045 6.225 7.596 6.852 8.080 7.080 7 685 7.059 6 555 7 440 7.645 5.633 5.750 8.555 1.700 5.01 1 5.071 8.684 1754 .1645 .R1 2 1.557 1.470 1660 .质,选择了模糊模式识别的方法。这是因为在本系统训练和识 别时,特征参数的提取过程会引入一定的随机误差,例如,现场 数据采集时手掌的张开、用力程度.掌形输入设备的不一致性 等,均会使特征参数自身具有一定的模糊性。在识别方法上.采 用了基于两模糊集距离的模糊模式识别算法。 4.2l7 4.715 7.820 1715 .R3 4 5.362 5.666 8.302 1.774 5.437 5.570 8.650 l_765 1640 .R5 8.910 7.590 8.385 5.825 5.945 9.195 1.888 1.66O 表2中给出新输入的三个待识向量c0、c。、C2,与库中6 个标准模式特征向量 -R 之间基于最小距离模式识别的计 算机仿真数据,并给出最终的识别结果。 4.1特征向量的确定 人与人的手掌形状。如手指的粗细与长短、手掌的宽厚等 存在差异,正确选择手掌参数是保证可靠身份识别的基础,为 了防止身份的误识别和漏识别.在手掌参数选取时应遵循采样 简单、稳定可靠、反映差异程度显著的原则。根据大量统计实验 结果.同时考虑到实际的可操作性和提取的难度,最终确定描 述掌形的8个特征参数。表示为特征向量 { , ., , , , 例如,计算表2中 与R。的海明距离,此时有X=Co首先 由式(11)分别计算分量的隶属度 ( )-/Zx ( 7): /zx ̄(xo)=exp(一( ) )=e)【p(_( 8-3l80-.28 ).3O5 j:0.996 (一( ))=e)【p(-( ) )=0.384 X5, , },具体分别为中指长(X0)、食指长( )、无名指长( )、 N ̄K(x3)、小指长(%)、手掌宽(X5)、中指宽(X6)、无名指宽( )。 /xx,(x7)=exp4.2标准模式类特征向量库的构建 将每一个掌形(代表每一个成员)都作为一种标准模式,并 将8个形状参数组成的向量作为此模式的标准特征向量R。因 为在抽取特征参数时.误差的出现是随机的,所以在构建标准 模式特征向量库时,仍需采用大量实验统计的方法。在本例中, 随机抽取至少10幅同一手掌的数字图像作为数据源,计算每 个形状参数的平均值后作为标准值。表1给出数据库中一些标 得到待识模糊集X={0.996,0.814,1.000,0.467,0.904,0.883, 0.985,0.384},由于假设标准模式是“清晰”的,故有标准模糊集 。={1,1,1,1,1,1,1,1)。此时问题就转化为模糊集 与模糊集 之间的距离计算问题。所以由公式(12)计算海明距离为: p( , )= 1∑f ( )f= }((1-0.996)+(1-0.8l4)+(1-1.oo0)+(1-0.467)+ (1—0.904)+(1-0.833)+(1-0.985)+(1-0.384))= 0.202 准模式(成员)的标准特征向量,其每一个分量都是同一特征参 数多次采样平均的结果。 4.3基于距离的模糊模式识别算法 根据所涉及问题的性质,采用正态型隶属度函数。仍用 . 由公式(13)计算欧氏距离为: :佰 : 814)2+(1l-000)2+(1_J0467)2+(1 -904)2+(1o.833)2+(1--08[(1--0996)2+[(1-o:0.303 384) 1 -一..表示待识模式(新输入手掌)特征向量的第 个分量所对应的 模糊集,用 ..表示第i个标准模式(手掌)的第 个分量所对应 的模糊集。i遍历库中所有模式,在这里取值0—5,即选择了6 个模式作为标准模式, 取值O~7。采用式(11)的隶属度函数规 划方法。根据实验统计结果,在实际处理时,当 取值0~5时, .,依此类推。计算出不同输入向量与库中现有标准向量的海 明距离与欧氏距离。 由于这里所定义的距离P均取值T[o,1],从而1叩便可视 为两个模糊集之间的贴近度.表示两个向量之间的相似程度。 上例中基于海明距离的贴近度为0.798,可解释为新输入的向 选用经验值0.2;当 取值6和7时,rO ,选用经验值0.05。可 量cn与库中标准模式0的特征向量足 以79.8的可能性相似, 而与标准模式1的特征向量足.只以9.2%的可能性相似。在实 这样直观理解or 当 ,与r 相差 /2时,认为 以77.9%的 可信度属于R .;当 与 .相差 .时,认为 仍以36.8%的可 信度属于足.。 际操作时,可将1 作为模式识别的一个标准,当新输入向量 与某类模式R.的l_p大于某个阈值(如75%)时,就可将新 表2基于最小距离模式识别的计算机仿真数据 (下转134页) 维普资讯 http://www.cqvip.com
134 2007,43(10) Compu ̄r Engineering and Applications计算机工程与应用 10时,可以减少30%到50%。“自适应寻呼”与“无学习寻呼”的 4 结束语 时延的变化率也有类似的结果 此处就不一一画出。 位置管理在移动通信网络中占有极为重要的地位,随着移 动用户数的不断增长,小区尺寸的不断减小,基本寻呼策略的 效率越来越低,因此,设计一种高效、智能以及实施简单的寻呼 策略对于位置管理而言迫在眉睫。本文所提出的策略简单易 行,且能够动态适应移动台的呼人及移动变化。 (收稿日期:2006年l1月) 参考文献: [1]朱艺华,高济,周根贵,等.蜂窝网络中环状搜索移动性管理策略[J】. 电子学报,2003,31(11):1655—1658. [2】朱艺华,肖刚,史定华,等.按概率分批寻呼的位置管理策略[JJ.通信 学报,2004,25(8):82—86. 寻呼次数 f3】Rose C,Yates R.Minimizing the average cost of paging under delay 图4“无学习寻呼”与“基本寻呼策略”的时延比值 constraints[J].ACM J Wireless Networks,1995,1(2):211-219. 蒌 [4】Koukoutsidis I,Theologou M.A combination of optimal partitioning and location prediction to assist paging in mobile cellular net— works[J].Int’1 Journal of Wireless Information Networks,K1uwer A- 董 cademic Publishers—Springer,2004,11(3):123-129. 羹一 [5 Ga5】n R H,Haas Z J.Concurrently searching for mobile users in cel— 嘉一 lular networks叨.IEEE Communications Letters,2003,7(6):287-289. 【6]Kwon C W,Han I1,Cho D H.Improved paging scheme based on 一 寻呼次数 distirbution density information of users in mobile communication systems[J].IEICE Trans Commun,2003,E86-B(4):1466-1471. [7】Krishnamachari B,Gau R H,Wicker S B,et a1.Optimal sequential paging in cellulra networks[J].Wireless Networks,2004,10(2): l2l一131. [8】Zhu Yi—hua,Leung V C M.Derivation of moving distance distri— bution to enhance sequentila paging in distnace—based mobility management for PCS networks[J].IEEE Transactions on Wireless 寻呼次数 Communications,2006,5(11). (b)CMR=l0 【9]Sutton R S,Barto A G.Reifnorcement learning:an introduction[M]. 图5“自适应寻呼”与“无学习寻呼”的代价变化率 【S.1.1.MIT Press,1998. (上接83页) 数。采用正态分布函数作特征向量的隶属度函数,往往能使问 输入模式归于R 类;若与库中所有模式相比较,均不满足这个 题得到简化,但方差or的确定需要设计合理的算法或大量的统 条件.就可判断为新输入模式不属于任何一个现有类。也可设 计实验。如果使用的特征参数比较单一,在标准模式较多时,识 计基于最小距离的分类器,即将 与曰.之间的距离P作为分 别正确率会有所下降,这时可适当增加特征向量的维数。文中 类准则.与哪一个向量最近就将 归人哪一类。 所介绍算法可推广使用于系统在训练和识别时,其特征向量提 表2中最大贴近度是用1减去输入向量与所有标准向量 取过程具有一定随机误差的模式识别场合。 之间的最短距离得到的。表中的识别结果是以70%作为模糊模 (收稿日期:2006年5月) 式识别的阈值,当 与某个参考向量R.的贴近度大于这个阈 值时,就确定X属于这个模式。若最大贴近度小于这个阈值, 参考文献: 则认为 不属于任何现有的模式,在表中填入“无”。由表2可 [1】Wang J G,Tan T N.A new face detection method based on shape 发现.相同输入时。计算出的欧氏距离要普遍大于海明距离,故 ifnormation[J].P ̄tern Recognition Letters,2000,21(6):463—471. 阈值的设定要相应于算法。经大量的仿真发现,在小范围人群 [2]聂传虹.模糊神经网络应用于数据融合中实现目标的身份识别[J1. 中.识别的正确率达100%。 桂林航天工业高等专科学校学报,2002(2):7一l2. [3】蓝金辉,马宝华,蓝天,等.多传感器最大属性数据融合及其目标识 5 结论 别应用[J】.清华大学学报:自然科学版,2000,40(4):21—23. 本文介绍了如何将基于特征向量的模式识别转变为两个 【4】陆正刚,杨杰.模糊逻辑及其在数据融合中的应用[J1.红外与激光工 模糊集的格贴近度或距离的计算问题,给出基于距离的模糊模 程,2000,29(5):56-59. 式识别方法在掌形身份识别系统中的具体应用。算法具有计算 【5】彭祖赠,孙韫玉.模糊数学及其应用[M】.武汉:武汉大学出版社,2002: 简单、意义明确、实用等优点,其难点在于如何构建隶属度函 276-310.
因篇幅问题不能全部显示,请点此查看更多更全内容