高教研究 2014年第5期 主成分分析与因子分析的异同及其应用 高金秋 (西安文理学院数学与计算机工程学院 陕西 西安710065) 摘要:主成分分析法和因子分析法都是从变量的方差一协方差结构入手.在尽可能多地保留原始信息的 基础上,用少数新变量来解释原始变量的多元统计分析方法,但同时也是容易混淆的两种方法。本文从概念、 基本思想、数学模型、计算过程等方面,详细地探讨了两者的异同,并且举例说明了两者在实际问题中的应 用。 关键词:主成分分析;因子分析;异同;应用 The Similarities and differences of principal component analysiS and factor analysis and application 1 关于主成分分析与因子分析的概念 主成分分析的概念 自然界中的客观事物往往受多种因素影响,因 而科学研究就需要考察多个变量。在大部分实际问 Gao Jinqiu (Department of Mathematics,Xi’an University 题中,变量之间有一定相关性。主成分分析是研究 如何通过少数几个主成分来解释多变量的方差—— 协方差结构的分析方法,也就是求出少数几个主成 分(变量)。在主成分分析中,最终确定成分是原始 变量的线性组合。 因子分析的概念 of Arts and Science,Xi’an 710065,China) Abstract:Principal component analysiS and factor analys i S are methods of multivariate statistical analysiS,on the 因子分析是主成分分析的推广和发展,也是多 元统计分析方法中降维的~种方法。因子分析是根 据相关性大小把变量分组,使得同组内的变量之间 相关性较高,但不同的组的变量相关性较低。 2主成分分析与因子分析的异同 basiS of retain the original information as much as possible,with a few new variables to explain the original variables,But it is al SO easy to confuse the two methods.Thi S article from the concept, basic idea, 主成分分析也称主分量分析,旨在利用降维的 mathematical model,calculation process and SO on,has di scussed in detai l both the Similarities and differences. and 思想,把多指标转化为少数几个综合指标。在实证 问题研究中,为了全面、系统地分析问题,我们必须 考虑众多影响因素。主成分分析正是适应这一要求 产生的,是解决这类问题的理想工具。 数学模型方面的异同 i 1 lustrates the appl ication in the actual probl em. Key words:principal component analysi s : factor analysiS : similarities and 设有 个样品,每个样品有P个变量 ,X2….,X , 对其作线性组合得到: differences:application 一12— 2014年第5期 高教研究 f =a11 4-a12x2 -4…+qpXp (3)结果分析 1J =a21. +a22i x2 -4…+ 【 =口p1 4- p2 +…+口 . 这样来确定系数a 的值。在SPSS中,未直接给出计 算主成分分析方法所需要的结果,而是将其嵌入到 主成分分析与因子分析有很多相似之处,如在 求解过程中均从一个协方差 出发。当然,一般首 先将原始数据进行标准化处理,那么此时转化为从 相关系数矩阵尺出发等。但二者又有着区别与联系, 最主要的不同在于它们的数学模型的构建上。这种 分析结果的差异,势必会对最终有关部门提出的政 因子分析(Factor Analysis)的计算结果中。 因子分析的计算过程 策、建议等产生较大影响,因此不能混用。 因子分析的实际常用计算步骤是: 【参考文献】 [11魏艳华,王丙参,田玉柱.主成分分析与因 ]子分析的比较研究Ⅱ].天水师范学院学报,2009,13— 15. ①构造相关矩阵:根据相关矩阵可以确定是否 适合进行因子分析。 ②确定因子个数:可以按照特征根大于1的准 则或碎石准则来确定因子个数。 ③提取因子:可以根据需要选择合适的因子提 取方法。 [2】宇传华.SPSS与统计分析[M】.北京:电子工 业出版社。2007.2:491-513. 【3】高祥宝,董寒青.数据分析与SPSS应用fM]. 北京:清华大学出版社.2007.6:342—364. 【41黄燕,吴平.SAS统计分析及应用[M】.北京: 机械工业出版社.2006.1:293-361. ④计算因子得分:可以利用公共因子来做进一 步的研究。 3主成分分析与因子分析在实际问题中的应 用 [5】王文博,陈秀芝.多指标综合评价中主成分 用SPSS软件对原始数据进行主成分分析和因 分析和因子分析方法的比较 .统计理论与方法, 2006,1 9-22. 子分析,来比较主成分分析和因子分析法。分为以 下三个步骤: (1)将原始数据标准化对原始数据进行标准化 【6]秦浩,陈景武.主成分分析与因子分析的关 系剖析U】_统计分析,2006,152—154. 【7】林海明,张文霖.主成分分析与因子分析的 异同和SPSS软件卟统计研究2005,65—69. 处理,这是两种方法所共有的。SPSS在调用Factor Analyze过程进行分析时,会自动对原始数据进行 标准化处理,因此需调用Descriptives过程进行计 算。 (2)计算主成分值、因子得分及综合得分使用SPSS  ̄,fC-mj-,主成分分析与因子分析是从初始因子载荷阵处 .分开的。将“COmponentMatrix’,中的第 列向量除以第 f个特征值的平方根就得到第i个主成分 的系数。 =0.456708XZX +0.313245XZX,+0.470641XZX,+0.240481×ZX +0.250802XZX .0.26267lXZX .0.319953XZX,+0.424712XZX 只=0.259069xZX .0.403447×ZX,+0.108620X z)(,.0.487105xZX +0.497899XZX +0.170014XZX +0.400748XZX,+0.288080XZX =0.109773XZX.+0.245856XZX,+0.192330XZX,+0.3338561×ZX .0.249485XZX +0.723053XZX +0.397362XZX,+0.191423XZX 上=∑( =0.46939x ̄+o.27459xF2+0.15186xF3 —j 13—