———————————————————————————————— 作者: ———————————————————————————————— 日期:
计量经济学案例分析
多元回归分析案例
学院: 数理学院 班级: 数学092班 学号: 094131230 姓名: 徐冬梅
摘要:为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,用Eviews软件对相关数据进行了多元回归分析,得出了相关结论
关键词:多元回归分析 ,Evicews软件, 中国人口自然增长; 一、 建立模型
为了全面反映中国“人口自然增长率”的全貌,选择人口自然增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。国名总收入,居民消费价格指数增长率,人均GDP作为解释变量暂不考虑文化程度及人口分布的影响。
通过对表1的数据进行分析,建立模型。其模型表达式为:
Yi1X1i2X2i3X3iui (i=1,2,,3)
其中Y表示人口自然增长率,X1 表示国名总收入,X2表示居民消费价格指数增长率,X3表示人均GDP,根据以往经验和对调查资料的初步分析可知,Y与X1,X2 ,X3呈线性关系,因此建立上述三元线性总体回归模型。Xi则表示各解释变量对税收增长的贡献。µi表示随机误差项。通过上式,我们可以了解到,每个解释变量增长1亿元,粮食总产值会如何变化,从而进行财政收入预测。 相关数据: 表1
国民总收
人口自然增
入(亿
长率(%。)Y
元)X1 15.73 15. 14.39 12.98 11.6 11.45 11.21 10.55 10.42 10.06 9.14 8.18 7.58 6.95 6.45 6.01 5.87 5.89 5.38 5.24 5.45
15037
18718 21826 26937 35260 48108 59811 70142 78061 83024 88479 98000 108068 119096 135174 159587 184089 213132 235367 277654
居民消费价格指数人均G增长率DP(元)X3 (CPI)%X2 18.8
3.1 3.4 6.4 14.7 24.1 17.1 8.3 2.8 -0.8 -1.4 0.4 0.7 -0.8 1.2 3.9 1.8 1.5 1.7 1.9
1366 19 1644 1893 2311 2998 4044 5046 5846 6420 6796 7159 7858 8622 9398 10542 12336 14040 16024 17535 19264
年份
1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008
二、 参数估计
利用上表中的数据,运用eview软件,采用最小二乘法,对表中的数据进行线性回归,对所建模型进行估计,估计结果见下图。 从估计结果可得模型:
ˆ15.771770.000392X0.050364X0.005881X Y123Y关于X1的散点图:
可以看出Y和X1成线性相关关系
Y关于X2的散点图:
可以看出Y和X2成线性相关关系
Y关于X3的散点图:
可以看出Y和X3成线性相关关系
回归结果
三、模型检验: 1、经济意义检验
模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000392%;在假定其它变量不变的情况下,当年居民
消费价格指数增长率每增长 1%,人口增长率增长0.050364%;在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低0.005881%。这与理论分析和经验判断相一致。 2、统计检验
(1)、拟合优度检验
YnY, ESSXYnY2 由于 TSSY 所以 R2
可见模型在整体上拟合得非常好。
(2)、F 检验
由于 RSSTSSESS 所以 FESS/k=86.02977 ,
RSS/(nk1)2ESSn1=0.941625, R21(1R2)=0.930680, TSSnk1针对H0:1230,给定显著性水平0.05,在F分布表中查出自由度为k-1=3和n-k-1=16的临界值F(3,16)3.24。由表3.4中得到F=86.02977 ,由于F=86.02977 >F(3,16)3.24应拒绝原假设
H0:1230,说明回归方程显著,即“国民总收入”、“居民消费价格指
数增长率”、“人均GDP”等变量联合起来确实对“人口自然增长率”有显著影响。
(3)、t 检验
ei2e;e0.780038 由于nk1nk120.830371,S8.89415E-05 ,S 0.03196669,S 且S12300.00121009 ,
当H0:00,H1:00, t00S018.99364
在0.05时, t(16)=2.120因为t=18.99364>2.120,所以在95%
2的置信度下拒绝原假设,说明截距项对回归方程影响显著。 当H0:10,H1:10
t11S1024.407392
在0.05时,t(16)=2.120因为t=4.407392>2.120所以在95%的置信度下拒绝原假设,说明X1变量对Y影响显著。 当H0:20,H1:20
t22S221.575515
在0.05时,t(16)=2.120因为t=1.575515<2.120,所以在95%的置信度下接受原假设,说明X2变量对Y影响不显著。 当H0:30,H1:30 t33S3- 4.859971
在0.05时,t(16)=2.120因为t=- 4.859971<2.120,所以在95%的
2置信度下接受原假设,说明X3变量对Y影响不显著。 (4)、0,1,2,3,4,5的置信区间
0的置信区间为:0tS20tS,计算得:
00200(14.01138,17.53216);
1的置信区间为:tS1tS,计算得:
112211 1(0.000203,0.000581);
2的置信区间为:tS2tS,计算得: 2222222(-0.01741,0.118133);
3的置信区间为:3tS23tS,计算得:;
33233(-0.00845,-0.00332)
综上所述,模型通过各种检验,符合要求。
四、方差分析(新增解释变量对被解释变量边际贡献显著性的分析) 引入不同解释变量的ESS,RSS,R2 首先做Y对X1的回归,得到样本回归方程为
Y13.65401-0.0000457X1
(24.45422) (-9.131990)
ESS1=175.8443, RSS137.95517,R12=0.822473;
由t检验可知,X1对Y有显著影响。R12=0.822473表明,对于各种人口自然增长率Y来说,国民总收入(亿元)X1只解释了Y的总离差的82%,还有18%没有解释。
引入第二个解释变量X2后,样本回归方程为:
ˆ=-12.55023-0.0000399X+0.092504X Y212
ESS12=182.8952, RSS1230.90454,R12=0.855451;
新引入X2的方差分析表
变差来源 对X1回归 对X1和X2回归 对X1和X2回归,X2新增的部分对平方和 ESS1=175.8443 ESS12=182.8952 ESS12-ESS1=7.050958 自由度 1 2 1 20-3=17 F统计量 F=50.30362 RSS23=974550.4 X1和X2回归的残差 对于给定的显著性水平=0.05,查F分布表可得临界值F0.05(1,17)4.45,由于F=50.30362>4.45,所以新引入的解释变量X2是显著
的,X2的引入可以显著的提高对Y的解释程度,即X2的边际贡献较大,因此R2从0.822473提高到0.855451,RSS从=37.95517降低到30.90454 再引入第三个解释变量X3:
ˆ=15.77177+0.000392X+0.050364X-0.005881X Y3122ESS123=201.3198, RSS12312.48060,R123=0.941625;
新引入X3的方差分析表
变差来源 对X1和X2回归 平方和 RSS1230.9自由度 2 F统计量 0454, 对X1,X2和X3回归 对X1,X2和X3回归,由X3新增的部分对X1,X2和X3回归的残差 ESS123-ESS12=470ESS123=201.3198 3 399 RSS12312.48061 20-4=16 F=86.02977 0 查F分布表可得临界值F0.05(1,16)=4.49,F=86.02977>4.49,所以新引入的解释变量X3显著,即X3的边际贡献较大,因此R2从0.855451提高到0.941625,RSS从30.90454下降到12.48060,因此应该引入X3。
X1和X3或X2和只引入一个解释变量X1,X2或X3;引入两个解释变量X1和X2,X3;以及引入三个变量X1X2X3的ESS,RSS和R2的结果如表
引入不同解释变量时的ESS,RSS,R2
引入解释变量 X1 回归平方和ESS ESS1=175.844残差平方和RSS RSS1判定系数 R12=0.822473 33 X2 X3 ESS2=87.21383 ESS3=180.1997.95517, RSS2=126.5859 RSS3=33.6008R22=0.407923 R32=0.842840 5 X1,X2 7 2R12=0.855451 ESS12=182.8952 RSS1230.90454 X1,X3 ESS13=199.3845 RSS1314.41682R13=0.93254 69 X2,X3 ESS23=186.12RSS23=27.63290 R23=0.870753 663 X1X2X3 ESS123=202RSS12312.48060 R123=0.941625 1.3198 由Eviews可得,只引入一个解释变量X1,X2,X3时的F统计量分别为F1=83.39325,F2=12.40147,F3=96.53269,由F1,F2和F3都大于临界值
F0.05(1,18)4.41,所以如果单独用X2,X3或X4作解释变量都显著,如果引入两
个解释变量,显然引入X1,X3的结果最好,如果引入三个解释变量X1X2X3无论最后引入哪个解释变量结果都显著,因此最后确定引入三个解释变量,相应的回
顾方程为 :
ˆ=15.77177+0.000392X+0.050364X-0.005881X3 Y21R2=0.941625 R2=0.930680
模型预测
设2009年国民总收入为295267亿元,居民消费价格指数增长率为2.1%,人均GDP为21427元,将值代入样本回归方程,得到1998年的各项税收总量预
ˆ: 测值的点估计值Y1998Y200915.77177+0.000392*295267+0.050364*0.021-0.00588
1*21427
(亿元),实际人口自然增长率为5.51%。 五、模型总结
ˆ=15.77177+0.000392X+0.050364X-0.005881X3 Y21(18.99364) (4.407392) (1.575515) (-4.859971)
R20.941625 R20..930680 F=86.02977 DW=0.568510
上述回归结果基本上消除了多重共线性,拟合优度较高,整体效果的F检验通过,其解释变量X的t检验均较为显著。
因篇幅问题不能全部显示,请点此查看更多更全内容