第38卷第1期 2011年1月 光电工程 Opto—Electronic Engineering Vo1.38,No.1 Jan,2011 文章编号:1003—501X(201 1)01—0134—08 一种基于人眼视觉特性的立体 图像质量客观评价方法 王阿红 ,郁 梅1,2,彭宗举 ,王 旭 , 蒋刚毅 ,,周俊明 ,邵 枫 (1.宁波大学信息科学与工程学院,浙江宁波315211; 2.南京大学软件新技术国家重点实验室,南京210093) 摘要:通过模拟人眼视觉特性中的对比度敏感函数、多通道效应以及立体感知特性,提出了一种基于人眼视觉特 性的立体图像质量客观评价方法。在评价左右图像质量时,利用小波变换模拟人眼视觉特性中的多通道效应,不 同空间频带的小波系数按对比度敏感函数进行加权,左右图像质量度量采用Canberra ̄-离。在评价立体感知时, 则通过计算原始与测试左右图像的绝对差值图相似度来实现。其后,通过回归分析将左右图像质量和立体感知评 价结果拟合成为所需的立体图像质量客观评价模型。实验结果表明该模型与主观评价结果具有较好的一致性。 关键词:立体图像质量;人眼视觉特性;立体感知 中图分类号:TP391 文献标志码:A doi:10.3969/j.issn.1003—501X.2011.01.025 A Quality Assessment Method of Stereoscopic Images Based on Human Visual System WANG A.hong ,YU Mei '-,PENG Zongqu ,WANG Xu , JIANG Gang-yi ’.,ZHOU Jun.ming ,SHAO Feng (1.Faculty oflnformation Science andEngineering,Ningbo Universiy,Nitngbo 315211,ZhejiangProvince,China; 2.NationalKeyLab ofSoftwareNewTechnology,NanjingUniversity,Nanjing210093,China) Abstract:Through simulating contrast sensitivity function,multi—channel effects and stereoscopic perception of human visual system,a qualiy assessmentt method of stereoscopic images based on human Visual system is proposed.In the qualiy evaluatiton of left and fight images by computing Canberra distance,wavelet transform was used to simulate multi.channel effects and wavelet coeficients of different spatial frequency were weighted according to the contrast sensitivity ftmction.The proposed method calculated similarity of the absolute dispariy itmages of the original and test stereoscopic images to assess the stereoscopic perception.Then regression analysis was used to integrate the two evaluation results into an equation as our quality assessment model of stereoscopic images.Experimental results show that the proposed objective method achieves consistent stereoscopic image quality evaluation results wih stubjective assessment. Key words:stereoscopic images qualiy;human tvisual system;stereoscopic perception 收稿日期:2010-07—06;收到修改稿日期:2010—10—21 基金项目:国家自然科学基金(6O872094,60832003,6107112o);教育部博士点基金(20081646O003);863计划(2009AA0lz327)}浙江省 研究生创新科研项目基金(YK2009044) 作者简介::E[ ̄(1986 ),女(汉族),浙江温岭人。硕士研究生,主要研究方向为多媒体信号压缩与处理,图像质量评价方法研究。 E—mail:wangahong86@163.tom。 第38卷第1期 王阿红等:一种基于人眼视觉特性的立体图像质量客观评价方法 135 0 引 言 图像质量评价是图像处理领域的研究热点,图像质量是比较各种图像处理算法性能优劣以及优化系统 参数的重要指标,因此在图像采集、编码压缩、网络传输等领域建立有效的图像质量评价机制具有重大的 意义。近些年来,随着图像处理技术的发展,该领域的研究已吸引了研究人员的广泛关注,图像质量评价 算法不断涌现,典型的模型有基于人类视觉系统(Human Visual System,HVS)I ̄J[N像质量评价模型¨ 。随着 多媒体技术和互联网技术的大力发展,立体视频技术正迅速发展起来。与传统媒体相比,立体视频在能够 为大众创造更加直观真实的场景感受的同时,需要处理的数据至少多一倍。但在提高编码压缩效率的同时, 还要保证立体图像的主观感知。立体视频系统中的图像质量评价是与立体视频系统相关的所有技术的基础。 对立体图像质量评价的理解和深入程度,直接影响到立体视频系统的发展速度。因此,如何建立一个符合 人类感知结果的立体图像质量客观评价模型就显得尤为重要。 目前,相比平面图像质量评价,国内外对立体图像质量评价的研究相对较少。Horita等人提出的用于 评价彩色立体图像质量的模型 适合左右图像同样质量的情况,而对于左右图像质量不相同时结果不理想, 同时易受图像内容影响,该模型并没有考虑深度感知对立体图像质量产生的影响,评价结果不能完全符合 人眼的主观感受。Boev等人提出了一个用于评价立体视频质量的评价模型p ,该模型主要是将立体图像的 质量分成立体深度感评价和左右视点合成图像(Cyclopean Image,CI)质量评价两个方面。该方法模拟HVS 处理立体图像时的生理过程的思路值得借鉴,但如何合成Cyclopean Image以及该合成方法是否合理仍值 得商榷。Benoit等人结合深度信息的评价,建立了一个立体图像客观评价模型的框架 J,但获得的深度图 存在准确性问题,模型输出值与主观感知的一致性仍有待提高。清华大学和天津大学都在立体图像质量客 观评价方法上进行了研究 J,Yang Jiachen等人提出的对图像质量以及立体视觉感知评价的客观模型p J, 直接将PSNR从平面迁移到立体图像中,而且没有对图像质量和立体感知评价结合后与主观质量的相关性 进行分析。Shao Hang等人结合深度信息,利用图像色彩、强边缘信息评价图像质量_oJ,但同样存在深度图 像的准确性问题。现有的立体图像质量客观评价模型没有充分结合人眼视觉特性,或是只是评价图像质量, 而没有评价立体感知,最终评价结果跟主观感知的相关性较差。本文提出一种基于人眼视觉特性的立体图 像质量客观评价方法,结合人眼视觉特性,同时研究立体图像中立体感知对最终立体图像质量的影响,提 高客观评价模型与主观感知的相关性。 1 基于人眼视觉特性的立体图像质量客观评价模型 人类视觉系统是由大量形态、功能各异的神经细胞组成的信息处理系统。长期以来,通过对人眼的某 些视觉现象的观察并结合视觉生理心理学方面的研究成果,人们发现人类视觉系统有很多特点,如人眼视 觉敏感度、多通道特性、掩蔽效应以及立体感知等,在图像质量评价中引入这些视觉感知特性可提高评价 模型与主观评分的相关性。因此,本文所提出的立体图像质量客观评价模型不但结合人眼视觉特性,合理 地建立数学模型模拟人眼视觉系统,而且评价立体图像中的人眼立体感知质量。然后挖掘立体左右图像质 量、立体感知质量与最终立体图像质量的关系,同时分析客观评价模型结合立体感知质量的必要性。 图1为本文提出的立体图像质量客观评价模型总体框图,包括对左右图像质量的评价以及立体感知质 量的评价。首先,结合人眼视觉特性评价左右图像质量,左右原始和测试图像进行小波变换子带分解,提 取各子带的特征值,对原始和测试图像的特征值作相似度度量,各子带的权重系数由对比度敏感函数决定。 然后,通过评价原始和测试绝对差值图像相似度来完成对立体感知质量的评价。最后,通过分析左右图像 质量和立体感知质量评价结果与立体图像最终质量的关系,得出其与主观评分的分布规律,将左右图像质 量和立体感知质量的评价结果拟合成回归方程,作为对立体图像质量的最终评价结果。 1。1左右图像质量评价 HVS模型的主要特性包括视觉非线性、多通道、视觉灵敏度带通、掩盖效应、多通道间不同激励的相 互作用以及视觉心理等特征。这些特性直接或间接地与图像信息的处理有关,因此,在图像质量评价方法 第38卷第1期 王阿红等:一种基于人眼视觉特性的立体图像质量客观评价方法 137 分解为水平方向、垂直方向以及对角方向,并分别提取各子带系数的均值、标准差作为纹理特征,用于度 量参考图像与测试图像间的相似程度。图2所示为Art立体图像子带系数标准差变化示意图,其中,左图 像未经失真处理,而右图像分别经过不同程度的高斯模糊和白噪声失真处理。图中横坐标为主观质量评分 值,纵坐标为经小波变换后的图像各子带水平方向上系数标 准差,chl到ch5分别表示第一级到第五级水平方向上子带 g 系数的标准差。由图2可知,随着主观质量的变化,图像经 ,§ 小波变换后各子带的标准差呈递减(增)趋势,因此,选取各 小波子带系数的特征值作为质量度量是可行的。大量研究表 差’ 量 。 o.4 明,人眼在不同通道信息的敏感性是不同的,通常用对比度 敏感函数CSF来描述人眼视觉系统与频率信息之间的关系。 CSF函数是频率的函数,并且具有带通滤波器的特性。对比 , 表1各方向每个小波子带的权值 Table 1 Weights ofwavelet sub—bands in diferent directions 最后质量度量采用Canberra距离 引,能够有效地区分差异较小的测试图像之间的质量,在计算质量过 程中,本模型结合视觉多通道特性,利用对比度敏感函数确定小波域每级水平垂直对角三个方向的小波系 数的权值。以水平方向为例,如下式所示 = 其中: 表示第m级水平方向系数的权值, 为水平方向的子带总数。 org 、 pro 表示第 级水平方 向原始图像和测试图像的子带系数标准差,同理可得垂直和对角方向以及直流低频子带的度量结果Q 、 和 。,并通过Qc= 十Q 十 十 1.2立体感知评价 (C=LOrR)计算得到左、右图像质量QI、 。最终立体图像的 左右图像质量评价结果为 ,Q =(Q。 十 )/2,其值越大,表明立体图像质量越差。 立体感是指人眼感受到深度的能力,这是一种辨别明显发生位移的物体间的相对距离的能力,立体感 的好坏会影响到立体图像质量。研究表明原始左右图像的绝对差值图与测试左右图像的绝对差值图相似度 可以评价立体图像的立体感知,绝对差值图越相似,立体图像立体感越强【5]。 138 光电工程 2011年1月 令Lorg、Rorg、Ldis、Rdis分别为原始图像和测试图像的左右图像,则原始和测试左右图像的绝对差值图 像 唱和 is分别为X。唱=lR 一L。 l和 i。=IR啦一 拙I。采用经典算法Wang的结构相似度来评价绝对差 值图像的质量 J,如下式所示 SSIM(x,y = 筹 其中:块的大小为8x8,/1 ,/1 表示原始和测试左右图像绝对差值图像块的均值, 、 ;和 分别为 原始和测试左右图像绝对差值图像块的方差和协方差, 和C2是常数。立体感知评价结果Q2为全部8x8 —图像块SSIM值的均值。同样以Art图像的绝对差值图为例,SSIMMAP如图4所示。图像中的像素点越 黑说明SSIM值越小,左右视点绝对差值图越不相似。显然图4(a)的质量优于图4(b)好,这与主观评价的 结果一致。 (a)DMOS-8.461 5 (b)DMOS=16.786 0 图4不同主观质量下的SSIMMAP图 —Fig.4 SSIM MAP under different subjective qualities 1.3客观模型的回归分析过程 为获取左右图像质量、立体感知质量与主观评价值之间的函数关系,本文采用了Wang等的立体图像 库的主观实验结果¨…,该立体图像库原始图像均来自在立体图像处理领域具有权威地位的MiddleBurry网 站lJ ,立体图像集包括10组高清(分辨率均大于1 200 ̄1 100) ̄1]试图像,涵盖了如人物、静态、丰富纹理 等不同的图像特征,立体图像库中的10对立体图像包括Art、Bowlingl、Computer、Dolls、Drumsticks、 Dwarves、Laundry、Mobius、Reindeer、Rocks1。失真处理类型包括JPEG压缩、JPEG 2000压缩、白噪声 失真、高斯模糊失真,图像库还给出了平均主观评分差值(Difference Mean Opinion Scores,DMOS)。DMOS 是主观评分均值( 和满分(100)的差值(DMOS=1O0-MOS),因此,DMOS值越大表示图像质量越差,且 DMOS的取值范围为[0,100]。本文选用了立体图像库中三组测试图像Art、Bowlingl、Computer在不同 程度的JPEG压缩、JPEG 2000压缩、白噪声失真下的8l对立体图像,包括21幅JPEG压缩失真图像,3O 幅JPEG2000压缩失真图像以及30幅白噪声失真图像。对每一对立体图像分别根据前述方法计算出左右图 像质量Ql以及立体感知评价结果Q2,并考察两个评价结果与主观评价值DMOS之间的关系。 将立体图像的左右图像质量评价结果、立体感知评价结果分别与主观评价值DMOS进行非线性最小二 乘拟合,两者与主观评价值DMOS的非线性拟合响应函数分别为g和h,如式(3)、(4)所示,左右图像质量 和立体感知的分布情况如图5所示,图中横坐标表示左右图像质量评价模型和立体感知评价模型归一化到 [O,1]的值,纵坐标表示主观评分DMOS值,散点代表所选的81对立体图像,曲线是非线性拟合响应函数 g和h。 g(Q1)=273.441 7Q,一397.598 7Ql2+203.6791Q。+2.1306 (Q2)=一108.381 9 +125.869 4 一58.040 8Q2+42.908 7 (3) (4) 从图5可以看出,左右图像质量评价结果和立体感知评价结果的分布都具有规律性,分布在非线性拟 合出的响应函数g和h曲线的附近,分析可得出立体图像最终主观质量与立体图像中左右图像质量和立体 第38卷第1期 王阿红等:一种基于人眼视觉特性的立体图像质量客观评价方法 139 感知质量都相关。然后采用线性回归的方式将响应函数g和h进行拟合,得到如下式所示的立体l 像质量 评价客观模型: Q=0.695 3g(Q1)+0.347 3 (Q2)一0.701 8 (5) 上式中,Q表示立体图像质量的最终评价结果,g和h前的系数在一定程度上反映了左右图像质量评 价结果和立体感知评价结果在立体图像质量评价中的重要性,可看出左右图像质量和立体感知都与立体图 像的感知质量有关。在立体图像感知质量评价过程中,图像质量感知以及立体感知都是人眼对立体图像总 体感知质量的刺激源,因此在立体图像质量客观评价模型中,除了对图像质量的评价,还要评价立体感知 质量 5。 4。 30 篓 2。 1。 O 的 30 薹 2。 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0 9 Objective quality evaluation for left and right images (a)The distribution of quality evaluation results for left and right images Objective quality evaluation for stereoscopic perception (b)The distribution ofevaluation results for stereoscopic perception 图5评价结果与DMOS散点图 Fig.5 Scatter plots ofevaluation results and DMOS 2实验结果与分析 本文所用的立体图像库中共有立体图像380对,其中原始图像10对,待评价的立体测试图像为370 对。剔除1.3节中为获取左右图像质量和立体感知质量与主观评价值之间函数关系所采用的81对立体图像, 采用剩下的289对立体图像来分析如式(5)所示的模型的最终评价结果与主观评分之间的相关性。本文利用 评估图像质量评价方法的2个常用客观参量作为评价指标u ,即:非线性回归条件下的Pearson相关系数 (Correlation Coeficifent,cc) ̄n Spearman相关系数(Rank—Order Correlation Coeficifent,ROCC),前者反映 客观模型的准确性,后者反映其单调性。将模型的输出值Q做四参数Logistic函数非线性拟合,CC和ROCC 值越高说明客观评价方法与DMOS相关性越好。 模型评价结果与主观评分的散点图如图6所示。横坐标为本文提出的立体图像质量评价客观模型输出 值,纵坐标表示平均主观评分差值。图中每个散点代表数据库中所选的立体图像对,曲线代表四参数Logistic 函数非线性拟合结果,散点越集中,说明客观模型与主观感知的一致性越好。曲线表达式如式 D j (/-=D +6所示,a b、c、 分别为D 最大值、最小值、客观模型输出 ∑ : ( 一 )(y,一Y) 结果的平均值以及1,CC和ROCC系数计算式如式(6)、(7)所示。 √∑ ( ,一 )。√∑ ( 一 ) c N(N 一l、 其中:Ⅳ表示被测试的失真图像的数目。X与y分别表示待测样本组 与】,的均值,这里 与】,分别表 示DMOSp与DMOS。SN 与SN 分别表示 与 在各自样本组里面的排列序号,指将样本组 与】,里面 .140 光电工程 2011年1月 的元素按照从大到小的顺序排列起来之后的序号。CC和ROCC系数取值范围均为区『日]【一1,1],其绝对值 越接近1,表明样本组之间的相关性越好。反映准确性和单调性的CC和ROCC系数如表2所示。 差萋 冀 (b)JPEG compression 60 40 羹 Q 羹 20 Q 如 加 m 0 柏 如 加 m O 0 0 l0 2O 30 40 O lO 20 30 40 Q (c)JPEG2000 compression Q (d)White noise 图6模型评价结果Q与主观评分DMOS散点图 Fig.6 Scatter plots ofthe proposed evaluation results and subjective rating DMOS 表2客观模型的性能指标 Table 2 Performance ofthe proposed objective model 从图6可得,本文提出的基于人眼视觉特性的立体图像质量客观评价模型在不同失真类型下,散点均 比较集中,与主观评价数据之间的吻合度较高,能够准确地反映立体图像的主观感知质量。同时,从两个 角度考察DMOSp与DMOS的一致性,分别为Pearson相关系数(CC)和Spearman相关系数 DC0,从表2 数据可以看出,本文提出的客观模型各项性能指标都较高,与主观评价结果比较一致。 3小结与展望 本文充分利用视觉灵敏度带通、多通道效应以及立体感知等人眼视觉特性,提出一种立体图像质量客 观评价模型。通过回归分析方法,挖掘左右图像质量、立体感知质量评价结果与立体图像主观感知质量的 关系与响应函数,分析两者在立体图像质量评价中的重要性。在评价左右图像质量中利用小波变换模拟人 眼视觉特性中的多通道效应,不同空间频带的小波系数按对比度敏感函数进行加权,左右图像质量度量采 用Canberra距离。采用原始左右图像的绝对差值图与测试左右图像的绝对差值图相似度来评价立体感知, 并通过回归分析将左右图像质量和立体感知函数拟合成为所需的立体图像质量客观评价模型。最后,分析 第38卷第1期 王阿红等:一种基于人眼视觉特性的立体图像质量客观评价方法 141 了模型的预测值与主观质量评分之间的相关性,实验结果表明该模型与主观评价结果基本一致,能够较为 准确地反映立体图像质量。在本文的基础上,进一步地结合人眼立体视觉中的双目掩蔽特性来改善评价效 果,是未来工作的研究方向。 参考文献: [1]Yu Z,Wu H R,Winkler S,et a1.Vision—model-based impairment metric to evaluate blocking artifact in digital video[J]. Proceeding ofThe IEEE(S0018-9219),2002,90(1):154—169. 【2】Horita Y,Kawai Y,Minami Y.Quality evaluation model of coded stereoscopic color image fJ].Proceedings of SPIE(S0277—786X),Perth,May 30,2000,4067:389—398. [3]Boev A,Gotchev A,Egiazarian K.Towards compound stereo—video quality metric:a speciifc encoder-based framework 【C]//IEEE Southwest Symposium on Image Analysis and Interpretation,Denver,2006:218-222. [4]Campisi P,Benoit A,Cousseau R.Quality assessment of stereoscopic images[J].Eurasip Journal on Image and Video Processing(S16875176),2008,629024:l—l3. [5]Yang J C,Hou C P,Zhou Y,et a1.Objective quality assessment method of stereo images[C]//3DTV Conference,Potsdam, Germany,May 4-6,2009,5069615:1—4. [6]Shao H,Cao X,Er G H.Objective quality assessment of depth image based rendering in 3DTV system[c]//3DTV Conference,Potsdam,Germany,M.dy 4-6,2009,5069619:l_4. [7】Lu F,Wang H Q,Ji X Y,et a1.Quality assessment of 3D asymmetric view coding using spatial frequency domain model [C]//3DTV Conference,Potsdam,Germany,May 4-6,2009:5069630:卜4. [8】Kokare M,Biswas P K,Chatterji B N.Texture image retrieval using rotated wavelet filters[J].Pattern Recognition Letters(S0167—8655),2007,28(101:1240—1249. [9】Wang z,Bovik A C,Sheikh H R,et a1.Image quality assessment:from error visibility to structural similarity[J].IEEE Transactions on Image Processing(S1057—7149),2004,l3(4):600—612. [1 0】Wang X,Yu M,Yang Y,et a1.Research on subjective stereoscopic image quality assessment[C]//Proceedings of SPIE—IS&T Electronic Imaging(S0277—786X),San Jose,Califomia,USA,Jan 18-22,2009,7255:l一10. [1 1]Scharstein D,Szeliski R.Middlebury Stereo Datasets[EB/OLJ.http://vision.middlebury.edu/stereo/data,2006. 【1 2]Video Quality Experts Group.Final report rfom the video quality experts group on the validation of objective models of video quality assessment[EB/OL]//http://www.its.bldrdoc.gov/vqeg/projects/frtv ̄ohaselI/downloads/VQEGIIFinalReport.pdf, 2003.