—甘子君 经济1202班 1205060432
一、
异方差的概念:
异方差性(heteroscedasticity )是相对于同方差而言的。所谓同方差,是为了保证回归参数估计量具有良好的统计性质,经典线性回归模型的一个重要假定:总体回归函数中的随机误差项满足同方差性,即它们都有相同的方差。如果这一假定不满足,即:随机误差项具有不同的方差,则称线性回归模型存在异方差性。
在回归模型的经典假定中,提出的基本假定中,要求对所有的i(i=1,2,„,n)都有
Var(ui)2
也就是说
ui具有同方差性。这里的方差2度量的是随机误差项围绕其均值的分散程
2E(u)0i度。由于,所以等价地说,方差度量的是被解释变量Y的观测值围绕回归线
E(Yi)=12X2ikXki的分散程度,同方差性实际指的是相对于回归线被解释变
量所有观测值的分散程度相同。
设模型为
Yi12X2ikXkiui如果其它假定均不变,但模型中随机误差项
i1,2,,n
ui的方差为
Var(ui2)i2,则称
(i1,2,3,,n).
ui具有异方差性。也称为方差非齐性。
二、内容
根据1998年我国重要制造业的销售利润与销售收入数据,运用EV软件,做回归分析,用图示法,White检验模型是否存在异方差,如果存在异方差,运用加权最小二乘法修正异方差。
三、过程:(实践过程、实践所有参数与指标、理论依据说明等)
(一) 模型设定
为了研究我国重要制造业的销售利润与销售收入是否有关,假定销售利润与销售收入之间满足线性约束,则理论模型设定为:
Yi=1+2Xi+i
其中,Yi表示销售利润,Xi表示销售收入。由1998年我国重要制造业的销售收入与销售利润的数据,如图1:
1988年我国重要制造业销售收入与销售利润的数据 (单位:亿元) 行业名称 销售利润Y 销售收入X 食品加工业 食品制造业 饮料制造业 烟草加工业 纺织业 服装制造业 皮革羽绒制品 木材加工业 家具制造业 造纸及纸制品 印刷业 文教体育用品 石油加工业 化学原料制品 医药制造业 化学纤维制造 橡胶制品业 塑料制品业 非金属矿制业 黑色金属冶炼 有色金属冶炼 金属制品业 普通机械制造 专用设备制造 交通运输设备 电子机械制造 电子通信设备 仪器仪表设备
187.25 111.42 205.42 183.87 316.79 157.7 81.73 35.67 31.06 134.4 90.12 .4 194.45 502.61 238.71 81.57 77.84 144.34 339.26 367.47 144.29 201.42 3.69 238.16 511.94 409.83 508.15 72.46 3180.44 1119.88 14. 1328.59 3862.9 1779.1 1081.77 443.74 226.78 1124.94 499.83 504.44 2363.8 4195.22 12.1 779.46 692.08 1345 2866.14 3868.28 1535.16 1948.12 2351.68 1714.73 4011.53 3286.15 4499.19 663.68 (二) 参数估计
1、双击“Eviews”,进入主页。输入数据:点击主菜单中的File/Open /EV Workfile—excel—异方差数据.xlsx ;
2、在EV主页界面的窗口,object-new object,输入“y c x”,按“Enter”。出现OLS回归结果,如图2:
估计样本回归函数
Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 22:10 Sample: 1 28
Included observations: 28
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C X
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
12.035 0.104393
19.51779 0.008441
0.616650 12.36670
0.28 0.0000 213.4650 146.45 10.935 11.08450 11.01844 1.212795
0.8696 Mean dependent var 0.849107 S.D. dependent var 56.90368 Akaike info criterion 84188.74 Schwarz criterion -151.8508 Hannan-Quinn criter. 152.9353 Durbin-Watson stat 0.000000
ˆ = 12.035 + 0.104393Xi 估计结果为: Yi(19.51779) (0.008441) t=(0.616650) (12.36670)
R2=0.8696 R2=0.849107 S.E.=56.947 DW=1.212859 F=152.9353
这说明在其他因素不变的情况下,销售收入每增长1元,销售利润平均增长0.104393元。
R2=0.8696 , 拟合程度较好。在给定=0.0时,t=12.36670 > t0.025(26)=2.056 ,拒
绝原假设,说明销售收入对销售利润有显著性影响。F=152.9353 > F0.05(1,26)= 4.23 ,表明方程整体显著。
(三) 检验模型的异方差
※(一)图形法
1、在“Workfile”页面:选中x,y序列,点击鼠标右键,点击Open—as Group
2、在“Group”页面:点击View-Graph—Scatter, 得到X,Y的散点图(下图3所示):
600500400销售利润Y300200100001,0002,0003,0004,0005,000销售收入X
3、在“Workfile”页面:点击Generate,输入“e2=resid^2”—OK 4、选中x,e2序列,点击鼠标右键,Open—as Group
5、在“Group”页面:点击View-Graph—Scatter, 得到X,e2的散点图(下图4所示):
25,00020,00015,000E210,0005,000001,0002,0003,0004,0005,000销售收入X
6、判断
由图3可以看出,被解释变量Y随着解释变量X的增大而逐渐分散,离散程度越来越大; 同样,由图4可以看出,残差平方ei对解释变量X的散点图主要分布在图形中的下三角部分,大致看出残差平方ei随Xi的变动呈增大趋势。因此,模型很可能存在异方差。但是否
22确实存在异方差还应该通过更近一步的检验。
※ (二)White检验
1、 在“Equation”页面:点击View-Residual Diagnostics—Heteroskedasticity Tests
—White检验(no cross),(本例为一元函数,没有交叉乘积项)得到检验结果,如图5:
White检验结果
Heteroskedasticity Test: White F-statistic
3.607218 Prob. F(2,25)
0.0420 0.0435 0.0220 Prob. 0.2619 0.1942 0.0802 3006.741 5144.470 19.85361 19.99635 19.725 1.479908
Obs*R-squared Scaled explained SS
Test Equation:
6.270612 Prob. Chi-Square(2) 7.631425 Prob. Chi-Square(2)
Coefficient -3279.779 -0.000871 5.670634
Std. Error 2857.117 0.000653 3.109363
t-Statistic -1.147933 -1.334000 1.823728
Dependent Variable: RESID^2 Method: Least Squares Date: 12/18/14 Time: 22:35 Sample: 1 28
Included observations: 28
Variable C X^2 X
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
0.223950 Mean dependent var 0.161866 S.D. dependent var 4709.744 Akaike info criterion 5.55E+08 Schwarz criterion -274.9506 Hannan-Quinn criter. 3.607218 Durbin-Watson stat 0.042036
2、因为本例为一元函数,没有交叉乘积项,则辅助函数为 t=0+1xt+2xt+t 从上表可以看出,nR=6.270612 ,有White检验知,在=0,05下,查分布表,得临界值22222=5.99147。比较计算的0.05(2)
26.270612 > 0.052统计量与临界值,因为nR2=
(2)=5.99147 ,所以拒绝原假设,不拒绝备择假设,这表明模型存在异方差。
(四) 异方差的修正
在运用加权最小二乘法估计过程中,分别选用了权数1t=1/Xt, 2t=1/Xt,3t=1/Xt。1、在“Workfile”页面:点击“Generate”,输入“w1=1/x”—OK ;同样的输入“w2=1/x^2” “w3=1/sqr(x)”;
2、在“Equation”页面:点击“Procs-Specify-Estimate”进入Equation Specification对话框,点击Options按钮,在Type中勾选“Inverse std. dev”在weight series输入w1,出现如图6:
用权数1t的结果
Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 22:57 Sample: 1 28
Included observations: 28 Weighting series: W1
Variable C X
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat
Coefficient 5.988351 0.108606
Std. Error 6.403392 0.008155
t-Statistic 0.935184 13.31734
Prob. 0.3583 0.0000 123.4060 31.99659 9.8421 9.937699 9.871632 1.465148 67.92129 213.4650 146.45 85116.40
2Weight type: Inverse standard deviation (EViews default scaling)
Weighted Statistics
0.0323 Mean dependent var -0.004667 S.D. dependent var 32.07117 Akaike info criterion 26742.56 Schwarz criterion -135.7956 Hannan-Quinn criter. 177.3515 Durbin-Watson stat 0.000000 Weighted mean dep. Unweighted Statistics
0.853095 Mean dependent var 0.847445 S.D. dependent var 57.21632 Sum squared resid 1.261469
3、在“Equation”页面:同样的输入“w2”,出现如图7:
用权数2t的结果
Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 23:01 Sample: 1 28
Included observations: 28 Weighting series: W2
Variable C X
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat
Coefficient 6.496703 0.1062
Std. Error 3.486526 0.010991
t-Statistic 1.863374 9.725260
Prob. 0.0737 0.0000 67.92129 75.51929 9.032884 9.128041 9.061975 1.905670 36.45276 213.4650 146.45 84486.88
Weight type: Inverse standard deviation (EViews default scaling)
Weighted Statistics
0.922715 Mean dependent var 0.919743 S.D. dependent var 21.39439 Akaike info criterion 11900.72 Schwarz criterion -124.4604 Hannan-Quinn criter. 94.58068 Durbin-Watson stat 0.000000 Weighted mean dep. Unweighted Statistics
0.8182 Mean dependent var 0.848573 S.D. dependent var 57.00434 Sum squared resid 1.242212
4、在“Equation”页面:同样的输入“w3”,出现如图8:
用权数3t的结果
Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 23:08 Sample: 1 28
Included observations: 28 Weighting series: W3
Weight type: Inverse standard deviation (EViews default scaling)
Variable C X
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic)
R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat
Coefficient 8.0341 0.106153
Std. Error 11.18733 0.007746
t-Statistic 0.772333 13.70473
Prob. 0.4469 0.0000 165.8420 67.13044 10.41205 10.50720 10.44114 1.2729 123.4060 213.4650 146.45 84329.44
Weighted Statistics
0.611552 Mean dependent var
0.596612 S.D. dependent var
42.636 Akaike info criterion 472.56 Schwarz criterion -143.7686 Hannan-Quinn criter. 187.8197 Durbin-Watson stat 0.000000 Weighted mean dep. Unweighted Statistics
0.8453 Mean dependent var 0.848855 S.D. dependent var 56.95121 Sum squared resid 1.2335
经估计检验,发现用权数1t,3t的结果,其可决系数反而减小;只有用权数2t的效果最好,可决系数增大。
用权数2t的结果
Dependent Variable: Y Method: Least Squares Date: 12/18/14 Time: 23:12 Sample: 1 28
Included observations: 28 Weighting series: W2
Variable C X
R-squared Adjusted R-squared S.E. of regression Sum squared resid
Coefficient 6.496703 0.1062
Std. Error 3.486526 0.010991
t-Statistic 1.863374 9.725260
Prob. 0.0737 0.0000 67.92129 75.51929 9.032884 9.128041
Weight type: Inverse standard deviation (EViews default scaling)
Weighted Statistics
0.922715 Mean dependent var
0.919743 S.D. dependent var
21.39439 Akaike info criterion 11900.72 Schwarz criterion
Log likelihood F-statistic Prob(F-statistic)
R-squared Adjusted R-squared S.E. of regression Durbin-Watson stat
-124.4604 Hannan-Quinn criter. 94.58068 Durbin-Watson stat 0.000000 Weighted mean dep. Unweighted Statistics
9.061975 1.905670 36.45276 213.4650 146.45 84486.88
0.8182 Mean dependent var 0.848573 S.D. dependent var 57.00434 Sum squared resid 1.242212
ˆ= 6.496703 + 0.1062Xi 用权数2t的估计结果为: Yi(1.863374) (9.725260)
R2=0.922715 DW=1.905670 F=94.58068
括号中的数据为t统计量值。
由上可以看出,运用加权最小二乘法消除了异方差后,参数2的t检验显著,可决系数提高了不少,F检验也显著,并说明销售收入每增长1元,销售利润平均增长0.1062元。
四、结果:
1、用图示法初步判断是否存在异方差:被解释变量Y随着解释变量X的增大而逐渐分散,离散程度越来越大;同样的,残差平方ei对解释变量X的散点图主要分布在图形中的下三角部分,大致看出残差平方ei随Xi的变动呈增大趋势。因此,模型很可能存在异方差。但是否确实存在异方差还应该通过更近一步的检验。 再用White检验异方差:因为nR= 6.270612 > 不拒绝备择假设,这表明模型存在异方差。
2、用加权最小二乘法修正异方差:
发现用权数2t的效果最好,则估计结果为:
22220.05(2)=5.99147 ,所以拒绝原假设,
ˆ= 6.496703 + 0.1062Xi Yi(1.863374) (9.725260)
R2=0.922715 DW=1.905670 F=94.58068
括号中的数据为t统计量值。
由上可以看出,R=0.922715,拟合程度较好。在给定=0.0时,t=9.725260 >
2t0.025(26)=2.056 ,拒绝原假设,说明销售收入对销售利润有显著性影响。
F=94.58068 > F0.05(1,26)= 4.23 , 表明方程整体显著。
运用加权最小二乘法后,参数2的t检验显著,可决系数提高了不少,F检验也显著,并说明销售收入每增长1元,销售利润平均增长0.1062元。
3、再用White检验修正后的模型是否还存在异方差:
White检验结果
Heteroskedasticity Test White F-statistic Obs*R-squared
Test Equation:
Dependent Variable: STD_RESID^2 Method: Least Squares Date: 12/18/14 Time: 23:15 Sample: 1 28
Included observations: 28
Variable C X X^2
R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat
2
Std. Error 675.2246 0.734838 0.0001
t-Statistic 2.8378 -1.982223 1.586342
0.060509 0.059963
Prob. 0.0085 0.0585 0.1252 425.0258 1198.210 16.96857 17.11130 3.144597 0.060509
2 3.144597 Probability 5.628058 Probability
Coefficient 1927.346 -1.456613 0.000245
0.201002 Mean dependent var 0.137082 S.D. dependent var 1113.057 Akaike info criterion 30972414 Schwarz criterion -234.5599 F-statistic 2.559506 Prob(F-statistic)
由上看出,nR= 5.628058 ,由White检验知,在=0,05下,查分布表,得临界值:
20.05(2)=5.99147。
比较计算的统计量与临界值,因为nR= 5.628058 < 受原假设,这说明修正后的模型不存在异方差。
2220.05(2)=5.99147 ,所以接
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- yrrf.cn 版权所有 赣ICP备2024042794号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务