CHINAMEASUREMENTTECHNOLOGYVol131 No12Mar,2005
模式识别技术在仪器仪表数字显示系统上的应用
陈 松,姚伯威
(电子科技大学,四川成都610054)
摘 要:模式识别是近年来迅速发展的一门技术,本文介绍了模式识别技术的概念、方法以及有关的数字图像处理技术,重点介绍了模式识别技术在仪器仪表数字显示系统上的应用。关键词:模式识别;数字图像处理;决策树;仪器仪表
中图分类号:TP39114 文献标识码:A 文章编号:167224984(2005)0220073202
Patternrecognitionπsapplicationondigitaldisplaysystemsofapparatus
CHENSong,YAOBo2wei
(UniversityofElectronicScienceandTechnology,Chengdu610054,China)
Abstract:Pattrenrecognitionisdevelopingrapidlyrecently,thispapershowsitsconceptandmethodsincludingdigitalimageprocessingtechnology1Patternrecognitionπsapplicationondigitaldisplaysystemsofapparatusisemphaticallyintroduced1Keywords:Patternrecognition;Digitalimageprocessing;Decisiontree;Apparatus
1 引 言
模式识别诞生于20世纪20年代,随着40年代计算机的出现,50年代人工智能的兴起,模式识别在60年代迅速发展成为一门学科。所谓的模式识别就是指对各种对象学习后进行分类,对判定为新的未知未知对象判断出其相应的其相应的类别研究。当今的模式识别方法通常有3种:统计识别法、句法结构模式识别法和模糊识别法。模式识别技术在很多科学和技术领域中得到了广泛的重视,几十年来,模式识别研究取得了大量的成果,也实现了很多成功的应用,被广泛的应用于人工智能、计算机工程、机器人学、神经生物学、医学、侦探学以及高能物理、考古学、地质勘探、宇航科学和武器技术等很多
重要领域,随着高科技的迅速发展,模式识别技术必
将获得更广泛的应用。
现有的研究成果,为把模式识别技术用于仪器仪表数字显示系统奠定了良好的基础。特别是对有很多仪器仪表的大型实验室而言,具有十分重要的应用价值,满足了实时控制的要求。
2 原 理
通过摄像头将包含仪器仪表显示数字(0~9)的图像通过视频卡输入到计算机,显示的是一个矩形区域,对这个矩形区域先进行预处理,再通过决策树的方法进行模式识别,将字符清晰而又准确的显示出来,这样就可以直接对数据进行分析,进而对仪器仪表达到实时监控的目的,如图1所示。
3 识别系统组成
311 图像预处理
31111 图像的二值化
摄像机拍入的图像通常是以BMP格式存入计算机的,显示的是灰度图像,由于各种因素的影响容易造成图像不佳,细节不清,笔画断开或粗细不均匀,图像存在孤立噪声等,致使字符提取困难,影响字符识别准确性。因此需要对图像进行预处理。
收稿日期:2004203226;收到修改稿日期:2004205219
一幅8位的灰度图像仍有256个灰度等级,设为f(m,n),对此灰度图像进行二值化就是将图像转换为只有两个等级(黑、白)的二值图像。依据区域的相似性和不连续性,取图像灰度平均值为阈值T,二值化处理可用下式表示:
1,当f(m,n)≤T时
B(m,n)=
0,当f(m,n)≥T时 大于此阈值的像素点置为黑,像素值为0,像素
© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
74
中国测试技术
2005年3月
的集合为背景区域;小于此阈值的像素点置为白,像素值为1,像素的集合为对象物区域。这样就得到了只有黑白两色的二值图像,将字符凸显了出来。31112 字符的切分
分别通过水平投影和垂直投影将每个仪器仪表显示的数字矩形区域分割出来,获得每一块矩形区域的宽度和高度;然后再对每一块数字矩形区域通过垂直投影将单个字符切分出来,并获得每个字符块的宽度和高度。31113 字符的平滑化
二值化后的字符图像可能包含孤立的黑白像素,或是在应当是黑的地方出现白点,平滑化就是减少这些这些黑白噪声的技术。经过平滑处理后的字符图像便于后继的细化操作,采用Unger平滑技术。31114 字符的细化
对字符识别来说,字符笔画的宽度信息冗余有可能导致识别错误,为此,需要对字符进行细化处理,除去冗余的部分,仅保留构成字符骨架的线宽为1pixel的笔画中心线,这样有利于字符几何特征的提取,减少识别运算量,提高识别率。
采用Hilditch细化算法,像素值为0的区域是需要细化的部分,像素值为1的区域是背景,按约定的判据确定像素的删留,层层剥离而留下字符的骨架。31115 字符的归一化
将细化后的字符归一化为16316像素大小。
)为归一处理后设(xi,yi)为字符的旧坐标值,(xi′,yi′
的新坐标,归一化公式为:
xi′=HCR(xi-xmin)
yi′=HCR(yi-ymin)
偏下的一个位置上分别取一行,作为特征提取行。在这一行上从左到右扫描,记录并保存像素由黑变白的次数(背景为黑色,前景为白色),以此作为特征(即分类规则),就可把0~9这10个数字进行粗分类。对数字的二值图像提取特征后,进行粗分类的分类结果如图2所示。
(3)在粗分类结果的基础上,再对它们进行细分
312 字符的识别
要以最快的速度找到数字的多种特征,并以此作为分类规则,将10个数字进行分类,是一个多类和多特征的问题。如图2所示,整个分类过程是用树来表示的,它包括树根、非终止节点和终止节点(树叶),除了终止节点外,每个节点上都有相应的分类规则,即提取出来的数字特征。从一个节点出发的两条路分别对应于不同的分类结果,而进一步的分类取决于上一级的分类结果和将要提取的新特征。这种分类方式称为决策树,它是一种算法的表示方法。主要设计思想如下:
(1)以一个较小的窗口为准,测出每个数字的高度和宽度,即数字实际在垂直方向和水平方向上所占的像素数。
(2)在数字的垂直方向上,在数字高度的偏上、
类。由图2可以看到共得到4组分类结果:1、2、7、9一组,4单独为一组,0、8一组。细分类就是对这4组数字分别再进行分类,达到识别的目的。下面考虑如何对它们进行细分类:对1、2、7、9分三种情况考虑,7、9可在数字宽度的中间点处从上到下记录像素由黑变白的次数,就可以分出7、9、1具有长竖,2的下部具有横,那末在一定的范围内考察长竖和横,就可以把这组数字进行区分,得到识别结果;对3、6来说,在数字3的顶部找横,这样考察较小的范围内像素即区分3、6;对0、5、8,先在数字上部找横,若有即可判断为5,否则为0、8,再在数字宽度的中间点处从上到下纪录像素由黑变白的次数即可区分0、8。这样,数字0~9经过粗分类、细分类后,就全部得到了识别。
4 结 论
综上所述,模式识别技术在现代化工业中有着广泛的用途。本文重点介绍了在仪器仪表数字显示系统中的切实可行的应用,整个过程用VC++实现,对于模式识别技术在其它领域的应用有一定的参考价值。
参考文献
[1] 何 斌,马天予,王运坚,朱红莲1VisualC++数字图像
处理[M]1北京:人民邮电出版社,20021[2] 张宏林1VisualC++数字图像模式识别技术及工程实
践[M]1北京:人民邮电出版社,20031[3] DavidJ1Kruglinski,ScotWingo,GeorgeShepherd1VisualC
++技术内幕[M]1北京:希望电子出版社,20001[4] 谷口庆治1数字图像处理———基础篇,数字图像处理
———应用篇[M]1北京:科学出版社,20021
© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
因篇幅问题不能全部显示,请点此查看更多更全内容